Contributions sur la structure morphosyntaxique des graphies terminologiques et sur l’hybridation entre terminologie et modèles de thèmes - TEL - Thèses en ligne Accéder directement au contenu
Thèse Année : 2020

Contributions about the morphosyntactic structure of terminological units and about hybridization between terminology and topic models

Contributions sur la structure morphosyntaxique des graphies terminologiques et sur l’hybridation entre terminologie et modèles de thèmes

Résumé

We propose here several experiments and hypothesis about automatic terminography extraction and potential hybridization with topic models. In NLP, there is only little consensus about automatic terminology construction. The different goals of researchers lead to dissension about what constitutes or not a terminological unit. On a linguistic level, researchers reached a relative consensus about terminological unit structure. New proposals regularly appear, but they complete the consensus rather than invalidate it. Even if there is a relative agreement on terminological unit structure, there is none about how to flag pertinent terminological units. The terminological aspect of a unit is estimated through several internal and external criteria. We will first focus our experiments on terminological unit contexts through topic models. We will see if and how terminological units can improve topic models. This improvement will be estimated through statistical metrics representing the quality of the model. Then we will introduce and experiment with our terminological unit structure extension proposal.
Nous présentons ici diverses expériences et hypothèses en lien avec l’extraction terminographique automatique et de potentielles hybridations avec des modèles de thèmes. Dans le domaine du tal, la construction automatique de terminologies n’est que peu consensuelle. Les différents objectifs des chercheurs font poindre des divergences d’opinion quant à ce qui constitue ou non une unité terminologique. Les divergences se situent à différents niveaux de la tâche. Sur le plan linguistique, les chercheurs sont parvenus à un accord relatif quant à la structure morphosyntaxique des graphies terminologiques. De nouvelles propositions apparaissent régulièrement mais qui complètent le consensus plus qu’elles ne l’invalident. Si la structure des graphies fait consensus, il n’en est pas de même pour leur caractérisation en tant qu’unité terminologique. L’aspect terminologique d’une unité est déterminé à partir de différents facteurs internes ainsi qu’externes. Dans un premier temps nos expériences portent sur le contexte d’apparition des unités terminologiques à partir de modèles de thèmes. Nous verrons si et comment les unités terminologiques peuvent bénéficier à la construction de modèles de thèmes. Ce bénéfice sera estimé à l’aune de la pertinence des modèles construits et de mesures statistiques. Dans un second temps, nous proposerons une extension de la structure morphosyntaxique des graphies terminologiques.
Fichier principal
Vignette du fichier
delamaire-amaury-diff.pdf (9.02 Mo) Télécharger le fichier
Origine : Version validée par le jury (STAR)

Dates et versions

tel-03461301 , version 1 (01-12-2021)

Identifiants

  • HAL Id : tel-03461301 , version 1

Citer

Amaury Delamaire. Contributions sur la structure morphosyntaxique des graphies terminologiques et sur l’hybridation entre terminologie et modèles de thèmes. Autre [cs.OH]. Université de Lyon, 2020. Français. ⟨NNT : 2020LYSEM016⟩. ⟨tel-03461301⟩
68 Consultations
26 Téléchargements

Partager

Gmail Facebook X LinkedIn More