login
english version rss feed
Detailed view PhD thesis
INSA de Rennes (09/12/2011), Eric Anquetil (Dir.)
Attached file list to this document: 
PDF
these_Adrien_Delaye.pdf(11.2 MB)
Méta-modèles de positionnement spatial pour la reconnaissance de tracés manuscrits
Adrien Delaye1

L'essor des interfaces homme-machine permettant la saisie d'informations à l'aide d'un stylo électronique est accompagné par le développement de méthodes automatiques pour interpréter des données de plus en plus riches et complexes : texte manuscrit, mais aussi expressions mathématiques, schémas, prise de notes libre... Pour interpréter efficacement ces documents manuscrits, il est nécessaire de considérer conjointement les formes des objets qui les constituent et leur positionnement spatial. Nos recherches se concentrent sur la modélisation du positionnement spatial entre des objets manuscrits, en partant du constat qu'il n'est pas exploité dans toute sa richesse par les méthodes actuelles. Nous introduisons le concept de méta-modèle spatial, une modélisation générique pour décrire des relations spatiales entre des objets de nature, complexité et formes variables. Ces modèles, qui peuvent être appris à partir de données, offrent une richesse et une précision inédite car ils autorisent la conduite d'un raisonnement spatial directement dans l'espace image. L'appui sur le cadre de la théorie des sous-ensembles flous et de la morphologie mathématique permet la gestion de l'imprécision et offre une description des relations spatiales conforme à l'intuition. Un méta-modèle est doté d'un pouvoir de prédiction qui permet de décrire la relation spatiale modélisée au sein de l'image, par rapport à un objet de référence. Cette capacité rend possible la visualisation des modèles et fournit un outil pour segmenter les tracés en fonction de leur contexte. En exploitant ces modèles, nous proposons une représentation pour des objets manuscrits à la structure complexe. Cette représentation repose uniquement sur la modélisation de leurs informations spatiales, afin de démontrer l'importance de ces informations pour l'interprétation d'objets manuscrits structurés. La segmentation des tracés en primitives structurelles est guidée par les modèles de positionnement, via leur capacité de prédiction. Les résultats expérimentaux, portant sur des objets de complexité et de natures diverses (caractères chinois, gestes d'édition, symboles mathématiques, lettres), confirment la bonne qualité de description du positionnement offerte par les méta-modèles. Les tests de reconnaissance de symboles par l'exploitation de leur information spatiale attestent d'une part de l'importance de cette information et valident d'autre part la capacité des méta-modèles à la représenter avec une grande précision. Ces résultats témoignent donc de la richesse de l'information spatiale et du potentiel des méta-modèles spatiaux pour l'amélioration des techniques de traitement du document manuscrit.
1:  IRISA - INTUIDOC
INTUIDOC - IRISA
document manuscrit – raisonnement spatial – modèles flous – morphologie mathématique – apprentissage de relations spatiales – reconnaissance de formes – analyse structurelle

Spatial meta-templates for handwritten pattern recognition
The rise of pen-enabled interfaces is supported by the development of automatic methods for interpretation of more and more rich and complex input data: handwritten text, mathematical equations, sketches, free handwritten notes... For efficiently recognizing these handwritten documents, one has to consider jointly the shapes of their components and the relative positioning between them. Our research focuses on the modeling of relative positioning between handwritten objects, considering that the potential of this part of the information is not fully exploited in the current methods. We introduce spatial meta-templates, a generic modeling for describing spatial relations between objects of diverse nature, complexity, and shape. These models can be trained from data and provide richer and more accurate descriptions because they authorize to reason about spatial information directly in the image space. Relying on fuzzy sets theory and mathematical morphology allows dealing with imprecision and offers intuitive description of spatial relations. A meta-template is endowed with a prediction capacity: it provides the description of modeled spatial relations with respect to a reference object in the image, as a spatial template. This enables to conduct segmentation of objects depending on their spatial context. By exploiting these models, we present a new representation for structured handwritten objects. It relies only on modeling of the spatial information so as to demonstrate the importance of spatial information for interpretation of these objects. The segmentation of handwritten strokes into structural primitives is driven by positioning models, making use of their prediction ability. Experimental results, obtained with objects of diverse nature and complexity (Chinese characters, editing gestures, mathematical symbols, letters), validate the quality of positioning description offered by our models. The performance on the task of recognizing symbols with a spatial-based representation further attests the importance of this information and confirms the ability of meta-templates to model it properly and accurately. These results both show the richness of spatial information and give an insight on the potential of meta-templates for improving methods for handwritten document interpretation.
handwritten document analysis – spatial reasoning – fuzzy models – mathematical morphology – spatial relation learning – pattern recognition – structural analysis

all articles on CCSd database...
all articles on CCSd database...
all articles on CCSd database...
all articles on CCSd database...
all articles on CCSd database...