Construction d'ontologies à partir de textes. L'apport de l'analyse de concepts formels. - TEL - Thèses en ligne Accéder directement au contenu
Thèse Année : 2011

Construction d'ontologies à partir de textes. L'apport de l'analyse de concepts formels.

Thibault Mondary
  • Fonction : Auteur
  • PersonId : 840563

Résumé

Build an ontology is a tedious task, which still requires a great amount of manual work. Texts, as knowledge sources, can help, but TALN tools stop at linguistic level. Manual conceptualization fill the gap between a linguistic model and a conceptual model. In this thesis we study how a symbolic clustering method, Formal Concept Analysis, can be combined with a linguistic model to help the knowledge engineer. We have experimented on three different domains represented by same-sized corpora. We show that ontology learning from texts cannot be fully automatized. We propose solutions that combine FCA and terminological analysis, to let the computer suggests useful clusters and faithful representation of texts.
La construction d'ontologies est un processus fastidieux qui nécessite un travail manuel conséquent. Les textes, en tant que sources de connaissances, peuvent optimiser les recours aux experts du domaine. Le passage des textes à l'ontologie requiert un double changement de perspective. Tout d'abord du niveau du discours vers le niveau linguistique (terminologie, hyperonymie, synonymie, etc.), à l'aide d'outils de traitement automatique des langues. La conceptualisation, manuelle, permet ensuite d'entrer dans le monde des modèles. Nous étudions dans cette thèse comment une méthode de regroupement automatique, l'analyse de concepts formels (ACF), peut se combiner aux éléments du niveau linguistique afin de faciliter la tâche de conceptualisation. Nous avons mené des expérimentations sur trois domaines différents, représentés par des corpus de taille comparable. Nous montrons que, dans l'état actuel des connaissances, la construction d'ontologies à partir de textes ne peut s'effectuer de manière totalement automatique. Nous proposons plusieurs paramétrages pour s'affranchir des problèmes inhérents à l'utilisation de l'ACF sur les données textuelles, dans l'optique de fournir à l'utilisateur à la fois des regroupements pertinents et une vue fidèle sur le matériau textuel.
Fichier principal
Vignette du fichier
these_thibault_mondary.pdf (3.96 Mo) Télécharger le fichier
slides_soutenance_mondary.pdf (2.01 Mo) Télécharger le fichier
Format : Autre

Dates et versions

tel-00596825 , version 1 (30-05-2011)
tel-00596825 , version 2 (25-02-2012)

Identifiants

  • HAL Id : tel-00596825 , version 2

Citer

Thibault Mondary. Construction d'ontologies à partir de textes. L'apport de l'analyse de concepts formels.. Autre [cs.OH]. Université Paris-Nord - Paris XIII, 2011. Français. ⟨NNT : ⟩. ⟨tel-00596825v2⟩
536 Consultations
2108 Téléchargements

Partager

Gmail Facebook X LinkedIn More