Skip to Main content Skip to Navigation
Habilitation à diriger des recherches

Accès à l'information : vers une hybridation fouille de données et traitement automatique des langues

Thierry Charnois 1
1 Equipe CODAG - Laboratoire GREYC - UMR6072
GREYC - Groupe de Recherche en Informatique, Image, Automatique et Instrumentation de Caen
Résumé : Ce mémoire porte sur mes travaux de recherche en traitement automatique des langues (TAL) et en fouille de données textuelles. Il présente comment ces travaux s'organisent autour de la problématique de l'accès à l'information dans les textes. Notre démarche s'appuie sur la prise en compte de l'aspect sémantique de la langue sous forme de modélisation linguistique et de ressources linguistiques pour le développement d'applications. La méthodologie de l'accès à l'information est donc ici vue comme un accès au sens à partir d'une modélisation linguistique relative à l'application visée plutôt qu'un accès aux formes de surface comme l'utilisent par exemple actuellement les méthodes prédominantes des moteurs de recherche. En retour, la formalisation du modèle linguistique et son expérimentation sur corpus visent à améliorer notre connaissance des phénomènes traités et permettre un retour qualitatif, c'est-à-dire explicatif, sur le modèle. L'intérêt pour les méthodes de fouille fondées sur les motifs et la volonté de les intégrer au TAL -- par exemple, pour acquérir automatiquement des ressources linguistiques et alimenter à moindre coût les systèmes de TAL -- procède de la même démarche. Une telle combinaison vise d'une part à repenser la manière dont les processus de TAL peuvent tirer bénéfice de méthodes de fouille spécifiquement adaptées au texte, et d'autre part à renforcer les processus de fouille, en fonction des spécificités de la donnée textuelle, par une prise en compte d'informations de nature linguistique visant notamment à sélectionner l'information la plus pertinente.
Complete list of metadatas

Cited literature [107 references]  Display  Hide  Download

https://tel.archives-ouvertes.fr/tel-00657919
Contributor : Thierry Charnois <>
Submitted on : Monday, February 13, 2012 - 5:02:50 PM
Last modification on : Tuesday, February 5, 2019 - 12:12:41 PM
Document(s) archivé(s) le : Thursday, November 22, 2012 - 12:06:05 PM

Identifiers

  • HAL Id : tel-00657919, version 1

Citation

Thierry Charnois. Accès à l'information : vers une hybridation fouille de données et traitement automatique des langues. Traitement du texte et du document. Université de Caen, 2011. ⟨tel-00657919⟩

Share

Metrics

Record views

653

Files downloads

1079