Indexation de textes médicaux par extraction de concepts, et ses utilisations

Bruno Pouliquen

Thèse Année : 2002

Medical texts indexation using concepts extraction, and its use

Indexation de textes médicaux par extraction de concepts, et ses utilisations

(1)

Bruno Pouliquen

Fonction : Auteur
PersonId : 951210

laboratoire d'informatique médicale

Résumé

The work presented specifically targets the accessibility to medical information. We used a French medical lexicon (specifically created for the medical domain), and built an index tool to particularly recognize a concept from a medical thesaurus that is present in a sentence written in natural language. First we indexed medical documents with a set of concepts and then demonstrated the utility of such indexing by developing a search engine and various tools which include: keyword identification, document similarity and automatic document synthesis. This indexing greatly aided in reducing the repository complexity of natural language documents. In addition, the evaluation results demonstrate that this indexing retains the main semantic information.

Nous nous intéressons à l'accès à l'information médicale. Nous avons utilisé un lexique de flexions, dérivations et synonymes de mots spécifiquement créé pour le domaine médical, issu de la base de connaissances "Aide au Diagnostic Médical". Nous avons exploité les mots composés et les associations de mots de ce lexique pour optimiser l'indexation d'une phrase en mots de référence. Nous avons créé un outil d'indexation permettant de reconnaître un concept d'un thésaurus médical dans une phrase en langage naturel. Nous avons ainsi pu indexer des documents médicaux par un ensemble de concepts, ensuite nous avons démontré l'utilité d'une telle indexation en développant un système de recherche d'information et divers outils: extraction de mots-clés, similarité de documents et synthèse automatique de documents. Cette indexation diminue considérablement la complexité de la représentation des connaissances contenues dans les documents en langage naturel. Les résultats des évaluations montrent que cette indexation conserve néanmoins la majeure partie de l'information sémantique.

Mots clés

NLP text indexing Medical search engines lexicon

Traitement automatique des langues naturelles Indexation Médecine Système de recherche d'information Lexique Thésaurus Web

Domaines

Informatique et langage [cs.CL]

Fichier principal

nomindex.pdf (1.43 Mo)

Bruno Pouliquen : Connectez-vous pour contacter le contributeur

https://theses.hal.science/tel-00932922

Soumis le : mardi 21 janvier 2014-14:25:39

Dernière modification le : vendredi 10 mars 2023-16:18:28

Archivage à long terme le : mardi 22 avril 2014-11:45:21

Dates et versions

tel-00932922 , version 1 (21-01-2014)

Identifiants

HAL Id : tel-00932922 , version 1

Citer

Bruno Pouliquen. Indexation de textes médicaux par extraction de concepts, et ses utilisations. Informatique et langage [cs.CL]. Université Rennes 1, 2002. Français. ⟨NNT : ⟩. ⟨tel-00932922⟩

Exporter

BibTeX XML-TEI Dublin Core DC Terms EndNote DataCite

Collections

UNIV-RENNES1 UR1-THESES UNIV-RENNES

568 Consultations

1702 Téléchargements

Medical texts indexation using concepts extraction, and its use

Indexation de textes médicaux par extraction de concepts, et ses utilisations

Résumé

Mots clés

Domaines

Dates et versions

Identifiants

Citer

Exporter

Collections

Partager