Acquisition automatique de traductions d'unités lexicales complexes à partir du Web - TEL - Thèses en ligne Accéder directement au contenu
Thèse Année : 2008

Automatic Web acquisition of complex lexical units translations

Acquisition automatique de traductions d'unités lexicales complexes à partir du Web

Résumé

Recently, machine translation has made significant progress by using lists of compound expressions such as " armed robbery " (" vol à main armée " in French). However, current systems are not yet capable of translating correctly many unknown expressions, such as "caisse centrale", mistranslated by Systran as "central case" instead of "central fund". This expression could have been automatically translated using the Web as a source of examples. The aim of this study is to acquire automatically a database of complex lexical units translations from the Web. We especially tackle difficult translation problems such as polysemy and idioms, for which better translation mechanisms are proposed. Beyond the practical aspects of machine translation improvement, we discuss the possible uses of the Web for general studies in linguistics.
Les systèmes de traduction automatique ont connu des progrès récents avec la prise en compte d'expressions complexes telles que " vol à main armée " ("armed robbery" en anglais). Cependant, dès que l'on sort de ces listes d'expressions figées, on retombe rapidement dans des erreurs de traduction. Par exemple, le traducteur Systran traduit " caisse centrale " par "central case" au lieu de "central fund". Cette expression aurait pu être automatiquement traduite grâce au Web. Le but de cette étude est la création d'une base bilingue français-anglais de traduction automatique d'unités lexicales complexes à partir du Web. Nous axerons notre étude sur les difficultés de traduction telles que la polysémie ou le caractère idiomatique et proposerons des traitements adaptés. Au-delà des aspects linguistiques et technologiques, nous analyserons les utilisations du Web dans le domaine de la linguistique.
Fichier principal
Vignette du fichier
leon-these.pdf (2.53 Mo) Télécharger le fichier
Loading...

Dates et versions

tel-00359235 , version 1 (06-02-2009)

Identifiants

  • HAL Id : tel-00359235 , version 1

Citer

Stéphanie Léon. Acquisition automatique de traductions d'unités lexicales complexes à partir du Web. Informatique [cs]. Université de Provence - Aix-Marseille I, 2008. Français. ⟨NNT : ⟩. ⟨tel-00359235⟩
256 Consultations
1576 Téléchargements

Partager

Gmail Facebook X LinkedIn More