614 articles  [english version]
Fiche détaillée Thèses
Université Paris-Diderot - Paris VII (17/12/2007), Catherine FUCHS (Dir.)
Liste des fichiers attachés à ce document : 
PDF
These_YND.pdf(31.8 MB)
Alignement automatique de textes parallèles français-japonais
Yayoi Nakamura-Delloye1

L'alignement automatique consiste à trouver une correspondance entre des unités de textes parallèles. Nous nous intéressons plus particulièrement à la réalisation d'un système qui procède à l'alignement au niveau des propositions, unités profitables dans beaucoup d'applications.
La présente thèse est constituée de deux types de travaux : les travaux introducteurs et ceux constituant le noyau central. Ce dernier s'articule autour de la notion de proposition syntaxique.
Les travaux introducteurs comprennent l'étude des généralités sur l'alignement ainsi que des travaux consacrés à l'alignement des phrases. Ces travaux ont conduit à la réalisation d'un système d'alignement des phrases adapté au traitement des textes français et japonais.
Le noyau de la thèse est composé de deux types de travaux, études linguistiques et réalisations informatiques. Les études linguistiques se divisent elles-mêmes en deux sujets : la proposition en français et la proposition en japonais. Le but de nos études sur la proposition française est de définir une grammaire pour la détection des propositions. Pour cet effet, nous avons cherché à définir une typologie des propositions, basée sur des critères uniquement formels. Dans les études sur le japonais, nous définissons d'abord la phrase japonaise sur la base de l'opposition thème-rhème. Nous tentons ensuite d'élucider la notion de proposition.
Les réalisations informatiques comportent trois tâches composant ensemble au final l'opération d'alignement des propositions, incarnées par trois systèmes informatiques distincts : deux détecteurs de propositions (un pour le français et un pour le japonais), ainsi qu'un système d'alignement des propositions.
1 :  LaTTice - Langues, textes, traitement informatique, cognition
Alignement – corpus parallèles – analyse morphologique japonaise partielle – mémoire de traduction – analyse syntaxique partielle – proposition syntaxique – subordination – Prolog – CFG – DCG – appariement de graphes – classification ascendante hiérarchique – linguistique contrastive.

French-Japanese parallel text automatic alignment
Automatic alignment aims to match elements of parallel texts. We are interested especially in the implementation of a system which carries out alignment at the clause level. Clause is a beneficial linguistic unit for many applications.
This thesis consists of two types of works: the introductory works and those that constitute the thesis core. It is structured around the concept of syntactic clause.
The introductory works include an overview of alignment and studies on sentence alignment. These works resulted in the creation of a sentence alignment system adapted to French and Japanese text processing.
The thesis core consists of two types of works: linguistic studies and implementations.
The linguistic studies are themselves divided into two topics: French clause and Japanese clause. The goal of our French clause studies is to define a grammar for clause identification. For this purpose, we attempted to define a typological classification of clauses, based on formal criteria only. In Japanese studies, we first define the Japanese sentence on the basis of the theme-rheme structure. We then try to elucidate the notion of clause.
Implementation works consist of three tasks which finally constitute the clause alignment processing. These tasks are carried out by three separate tools: two clauses identification systems (one for French texts and one for Japanese texts) and a clause alignment system.
Alignment – parallel corpora – partial japanese morphological analysis – translation memory – partial syntactic analysis – syntactic clause – subordination – Prolog – CFG – DCG – graph matching – agglomerative hierarchical clustering – contrastive linguistics.