Accès à l'information : vers une hybridation fouille de données et traitement automatique des langues - TEL - Thèses en ligne Accéder directement au contenu
Hdr Année : 2011

Accès à l'information : vers une hybridation fouille de données et traitement automatique des langues

Thierry Charnois

Résumé

Ce mémoire porte sur mes travaux de recherche en traitement automatique des langues (TAL) et en fouille de données textuelles. Il présente comment ces travaux s'organisent autour de la problématique de l'accès à l'information dans les textes. Notre démarche s'appuie sur la prise en compte de l'aspect sémantique de la langue sous forme de modélisation linguistique et de ressources linguistiques pour le développement d'applications. La méthodologie de l'accès à l'information est donc ici vue comme un accès au sens à partir d'une modélisation linguistique relative à l'application visée plutôt qu'un accès aux formes de surface comme l'utilisent par exemple actuellement les méthodes prédominantes des moteurs de recherche. En retour, la formalisation du modèle linguistique et son expérimentation sur corpus visent à améliorer notre connaissance des phénomènes traités et permettre un retour qualitatif, c'est-à-dire explicatif, sur le modèle. L'intérêt pour les méthodes de fouille fondées sur les motifs et la volonté de les intégrer au TAL -- par exemple, pour acquérir automatiquement des ressources linguistiques et alimenter à moindre coût les systèmes de TAL -- procède de la même démarche. Une telle combinaison vise d'une part à repenser la manière dont les processus de TAL peuvent tirer bénéfice de méthodes de fouille spécifiquement adaptées au texte, et d'autre part à renforcer les processus de fouille, en fonction des spécificités de la donnée textuelle, par une prise en compte d'informations de nature linguistique visant notamment à sélectionner l'information la plus pertinente.
Fichier principal
Vignette du fichier
memoireHDR_charnois_dec_2011.pdf (1.27 Mo) Télécharger le fichier
Loading...

Dates et versions

tel-00657919 , version 1 (13-02-2012)

Identifiants

  • HAL Id : tel-00657919 , version 1

Citer

Thierry Charnois. Accès à l'information : vers une hybridation fouille de données et traitement automatique des langues. Traitement du texte et du document. Université de Caen, 2011. ⟨tel-00657919⟩
474 Consultations
622 Téléchargements

Partager

Gmail Facebook X LinkedIn More