Reconnaissance de structures bidimensionnelles : Application aux expressions mathématiques manuscrites en-ligne - TEL - Thèses en ligne Accéder directement au contenu
Thèse Année : 2010

Recognition of two-dimensional structures: application on online handwritten mathematical expressions

Reconnaissance de structures bidimensionnelles : Application aux expressions mathématiques manuscrites en-ligne

Résumé

This thesis focuses on the study, conception, development and testing of a recognition system for two-dimensional handwritten structures. The proposed system is based on a global architecture that considers the problem of recognition as simultaneous optimization of segmentation, symbol recognition, and interpretation. In this framework, we have first designed a system to recognize handwritten mathematical expression. All the three problems of segmentation, recognition and interpretation are not straightforward. Segmentation is complex because of the large freedom for composing an expression, since delayed multi-stroke symbols are considered. Recognition has to face a large number of classes, and to deal with the problem of unknown pattern, and interpretation suffers for the fuzzy nature of spatial relationships. We have defined a solution which minimizes a global cost function where recognition costs and structural costs are combined and a large exploration of the space of solutions is proposed. The results are very promising and competitive compared to those of the literature. We have finally shown the generality of our approach in adapting the system to the recognition of another 2D language, which is used to design handwritten flowcharts.
Les travaux présentés dans le cadre de cette thèse portent sur l'étude, la conception, le développement et le test d'un système de reconnaissance de structures manuscrites bidimensionnelles. Le système proposé se base sur une architecture globale qui considère le problème de reconnaissance en tant qu'optimisation simultanée de la segmentation, de la reconnaissance de symboles, et de l'interprétation. Le premier cadre d'applications a été celui d'un système de reconnaissance d'expressions mathématiques manuscrites. La difficulté du problème se situe aux trois niveaux évoqués. La segmentation est complexe du fait de la grande liberté de composition d'une expression, avec notamment la possibilité de symboles multi-traits non séquentiels ; la reconnaissance doit affronter un nombre élevé de classes et en particulier, gérer les situations de formes non-apprises ; l'interprétation peut-être ambiguë du fait du positionnement spatial approximatif. La solution proposée repose sur la minimisation d'une fonction de coût global qui met en compétition des coûts de reconnaissance et des coûts structurels pour explorer un vaste espace de solutions. Les résultats obtenus sont très compétitifs et prometteurs comparés à ceux de la littérature. Nous avons finalement montré la généricité de notre approche en l'adaptant à la reconnaissance d'un autre type de langage 2D, celui des représentations graphiques de type organigramme.
Fichier principal
Vignette du fichier
These_Ahmad_Montaser_AWAL_IRCCyN_IVC_2010.pdf (7.71 Mo) Télécharger le fichier
Loading...

Dates et versions

tel-00564519 , version 1 (09-02-2011)

Identifiants

  • HAL Id : tel-00564519 , version 1

Citer

Ahmad-Montaser Awal. Reconnaissance de structures bidimensionnelles : Application aux expressions mathématiques manuscrites en-ligne. Interface homme-machine [cs.HC]. Université de Nantes, 2010. Français. ⟨NNT : ⟩. ⟨tel-00564519⟩
357 Consultations
1433 Téléchargements

Partager

Gmail Facebook X LinkedIn More