Étude d'un modèle computationnel pour la représentation du sens des mots par intégration des relations de contexte - TEL - Thèses en ligne Accéder directement au contenu
Thèse Année : 2004

A Computational Model for Word Sense Representation Using Contextual Relations

Étude d'un modèle computationnel pour la représentation du sens des mots par intégration des relations de contexte

Résumé

In this thesis, we present a theory of concepts and a related computational linguistic model. This non-definitinal theory proposes a view that considers concepts as a Gaussian representation. The term contexonym, formalized version for `contextually related words', is introduced that relates this theory of concepts and computational model. Based on these two principles, our computational model learns automatically contexonyms from a very large untagged corpus. For a given word, the model proposes a set of its contexonyms and organizes them by a hierarchical clustering method. The contexonyms thus obtained reflect encyclopedic knowledge in addition to various linguistic features like word usage or subtle difference between near-synonyms. The results on different tests show that the model could be used for natural language processing (NLP) tasks as well as a dynamic lexical reference.
Dans cette thèse nous présentons une approche théorique du concept et un modèle linguistico-informatique. Cette théorie, non définitionnelle, est fondée sur une représentation gaussienne du concept. Nous introduisons le terme contexonyme, une formalisation de la relation de contexte entre les mots. Cette notion lie la théorie du concept au modèle informatique. Basé sur ces deux notions, notre modèle informatique apprend des contexonymes de manière automatique à partir de corpus de taille importante non annotés. Pour chaque mot donné, le modèle propose la liste de ses contexonymes et les organise par une méthode de classification hiérarchique. Les contexonymes ainsi obtenus reflètent des connaissances encyclopédiques ainsi que diverses caractéristiques langagières comme l'usage des mots ou encore les fines différences sémantiques entre synonymes. Les résultats sur des tests montrent que le modèle peut être utilisé pour des tâches de TAL ainsi que comme ressource lexicale dynamique.
Fichier principal
Vignette du fichier
tel-00008384.pdf (911.9 Ko) Télécharger le fichier

Dates et versions

tel-00008384 , version 1 (07-02-2005)

Identifiants

  • HAL Id : tel-00008384 , version 1

Citer

Hyungsuk Ji. Étude d'un modèle computationnel pour la représentation du sens des mots par intégration des relations de contexte. domain_stic.othe. Institut National Polytechnique de Grenoble - INPG, 2004. Français. ⟨NNT : ⟩. ⟨tel-00008384⟩
301 Consultations
1181 Téléchargements

Partager

Gmail Facebook X LinkedIn More