Introduction de la vision perceptive pour la reconnaissance de la structure de documents

Aurélie Lemaitre Legargeant 1
1 IMADOC - Interprétation et Reconnaissance d’Images et de Documents
UR1 - Université de Rennes 1, INSA Rennes - Institut National des Sciences Appliquées - Rennes, CNRS - Centre National de la Recherche Scientifique : UMR6074
Résumé : La vision perceptive humaine combine différents niveaux de perception pour faciliter l'interprétation d'une scène. Les physiologistes la modélisent par le cycle perceptif, guidé par un facteur psychologique, l'attention visuelle. Ce fonctionnement est à la base de nos travaux sur une méthode générique pour l'analyse de documents structurés. Dans ce contexte, nous proposons le formalisme de calque perceptif ainsi que des outils de multirésolution, pour simuler le cycle perceptif et l'attention visuelle. Le formalisme du calque perceptif permet de fusionner des informations issues de différents niveaux de perception, en étant guidé par des connaissances. Nous aboutissons ainsi à une architecture complète de vision perceptive, DMOS-P, qui est un enrichissement de la méthode DMOS de reconnaissance de documents. Grâce à cette méthode, il devient possible de spécifier simplement des mécanismes complexes de coopération perceptive, adaptés à chaque type de problème, qui améliorent la reconnaissance de la structure de documents. Nous mettons en évidence un mécanisme de prédiction/vérification lié à la vision perceptive : la vision à basse résolution permet d'émettre des hypothèses sur la structure en utilisant le contexte global ; ces hypothèses sont ensuite vérifiées à plus haute résolution. Ce mécanisme simplifie et améliore la reconnaissance des documents : lorsque les indices visuels sont denses (documents bruités ou à structure complexe), la vision perceptive permet de mieux sélectionner les données structurelles pertinentes ; lorsque l'information structurelle est physiquement diuse (documents ayant une structure pauvre), la vision perceptive permet de mieux reconstituer la structure du document. Nous avons validé cette approche sur des documents à structure variée (courriers manuscrits, registres d'archives, presse. . .), à grande échelle (plus de 80 000 images), et de manière industrielle grâce au transfert technologique vers la société Evodia.
Type de document :
Thèse
Interface homme-machine [cs.HC]. INSA de Rennes, 2008. Français
Liste complète des métadonnées

Littérature citée [81 références]  Voir  Masquer  Télécharger

https://tel.archives-ouvertes.fr/tel-00542490
Contributeur : Aurélie Lemaitre <>
Soumis le : vendredi 3 décembre 2010 - 09:32:24
Dernière modification le : vendredi 13 janvier 2017 - 14:16:59
Document(s) archivé(s) le : vendredi 4 mars 2011 - 02:53:02

Identifiants

  • HAL Id : tel-00542490, version 1

Collections

Citation

Aurélie Lemaitre Legargeant. Introduction de la vision perceptive pour la reconnaissance de la structure de documents. Interface homme-machine [cs.HC]. INSA de Rennes, 2008. Français. 〈tel-00542490〉

Partager

Métriques

Consultations de
la notice

308

Téléchargements du document

962