Intégration de connaissances linguistiques pour la reconnaissance de textes manuscrits en-ligne

Solen Quiniou 1
1 IMADOC - Interprétation et Reconnaissance d’Images et de Documents
UR1 - Université de Rennes 1, INSA Rennes - Institut National des Sciences Appliquées - Rennes, CNRS - Centre National de la Recherche Scientifique : UMR6074
Résumé : L'objectif de ces travaux de thèse est de construire un système de reconnaissance de phrases, en se basant sur un système de reconnaissance de mots existant. Pour cela, deux axes de recherche sont abordés : la segmentation des phrases en mots ainsi que l'intégration de connaissances linguistiques pour prendre en compte le contexte des phrases. Nous avons étudié plusieurs types de modèles de langage statistiques, en comparant leurs impacts respectifs sur les performances du système de reconnaissance. Nous avons également recherché la meilleure stratégie pour les intégrer efficacement dans le système de reconnaissance global. Une des orginalités de cette étude est l'ajout d'une représentation des différentes hypothèses de phrases sous forme d'un réseau de confusion, afin de pouvoir détecter et corriger les erreurs de reconnaissance restantes. L'utilisation des technique présentées permet de réduire de façon importante le nombre d'erreurs de reconnaissance, parmi les mots des phrases.
Type de document :
Thèse
Interface homme-machine [cs.HC]. INSA de Rennes, 2007. Français
Liste complète des métadonnées

https://tel.archives-ouvertes.fr/tel-00580623
Contributeur : Solen Quiniou <>
Soumis le : lundi 28 mars 2011 - 17:21:00
Dernière modification le : vendredi 13 janvier 2017 - 14:21:41
Document(s) archivé(s) le : mercredi 29 juin 2011 - 02:59:29

Identifiants

  • HAL Id : tel-00580623, version 1

Collections

Citation

Solen Quiniou. Intégration de connaissances linguistiques pour la reconnaissance de textes manuscrits en-ligne. Interface homme-machine [cs.HC]. INSA de Rennes, 2007. Français. 〈tel-00580623〉

Partager

Métriques

Consultations de
la notice

233

Téléchargements du document

289