Computer Vision Methods for Unconstrained Gesture Recognition in the Context of Sign Language Annotation

Matilde Gonzalez

Thèse Année : 2012

Computer Vision Methods for Unconstrained Gesture Recognition in the Context of Sign Language Annotation

Méthodes de vision par ordinateur pour la reconnaissance de gestes naturelles dans le contexte de lʼannotation en langue des signes

(1)

Matilde Gonzalez

Fonction : Auteur
PersonId : 1034973

Institut de recherche en informatique de Toulouse

Résumé

This PhD thesis concerns the study of computer vision methods for the automatic recognition of unconstrained gestures in the context of sign language annotation. Generally the annotation of SL video corpus is man- ually performed by linguists or computer scientists experienced in SL. However manual annotation is error-prone, unreproducible and time consuming. In addition de quality of the results depends on the SL annotators knowledge. Associating annotator knowledge to image processing techniques facilitates the annotation task increasing robustness and speeding up the required time. We have studied some image processing techniques for assisting annotation. First of all we intend to detect the limits corresponding to the beginning and end of a sign. This annotation method requires several low level approaches for performing temporal segmentation and for extracting motion and hand shape features. First we propose a particle filter based approach for robustly tracking hand and face robust to occlusions. Then a segmentation method for extracting hand when it is in front of the face has been developed. Motion is used for segmenting signs and later hand shape is used to improve the results. Indeed hand shape allows to delete limits detected in the middle of a sign. Once signs have been segmented we proceed to the gloss recognition using lexical description of signs.

Cette thèse porte sur l'étude des méthodes de vision par ordinateur pour la reconnaissance de gestes naturels dans le contexte de l'annotation de la Langue des Signes. Les annotations de vidéo en LS sont réalisées manuellement par des linguistes ou experts en LS, ce qui est source d'erreur, non reproductible et extrêmement chronophage. De plus, la qualité des annotations dépend des connaissances en LS de l'annotateur. L'association de l'expertise de l'annotateur aux traitements automatiques facilite cette tâche et représente un gain de temps et de robustesse. Nous avons étudié un ensemble de méthodes permettant de réaliser l'annotation en glose. Dans un premier temps, nous cherchons à détecter les limites de début et fin de signe. Cette méthode d'annotation nécessite plusieurs traitements de bas niveau afin de segmenter les signes et d'extraire les caractéristiques de mouvement et de forme de la main. D'abord nous proposons une méthode de suivi des composantes corporelles robuste aux occultations basée sur le filtrage particulaire. Ensuite, un algorithme de segmentation des mains est développé afin d'extraire la région des mains même quand elles se trouvent devant le visage. Puis, les caractéristiques de mouvement sont utilisées pour réaliser une première segmentation temporelle des signes qui est par la suite améliorée grâce à l'utilisation de caractéristiques de forme. En effet celles-ci permettent de supprimer les limites de segmentation détectées en milieu des signes. Une fois les signes segmentés, on procède à l'extraction de caractéristiques visuelles pour leur reconnaissance en termes de gloses à l'aide de modèles phonologiques.

Mots clés

Gesture analysis Sign Language Automatique annotation analyse de gestes langue des signes annotation automatique

Domaines

Informatique et langage [cs.CL]

Fichier principal

Thesis_GONZALEZ_2012.pdf (24.24 Mo)

Matilde Gonzalez Preciado : Connectez-vous pour contacter le contributeur

https://theses.hal.science/tel-00768440

Soumis le : vendredi 21 décembre 2012-14:42:32

Dernière modification le : lundi 20 novembre 2023-11:44:19

Archivage à long terme le : dimanche 18 décembre 2016-08:29:43

Dates et versions

tel-00768440 , version 1 (21-12-2012)

Identifiants

HAL Id : tel-00768440 , version 1

Citer

Matilde Gonzalez. Computer Vision Methods for Unconstrained Gesture Recognition in the Context of Sign Language Annotation. Computation and Language [cs.CL]. Université Paul Sabatier - Toulouse III, 2012. English. ⟨NNT : ⟩. ⟨tel-00768440⟩

Exporter

BibTeX XML-TEI Dublin Core DC Terms EndNote DataCite

Collections

UNIV-TLSE2 CNRS UT1-CAPITOLE IRIT TOULOUSE-INP UNIV-UT3 UT3-TOULOUSEINP

391 Consultations

752 Téléchargements

Computer Vision Methods for Unconstrained Gesture Recognition in the Context of Sign Language Annotation

Méthodes de vision par ordinateur pour la reconnaissance de gestes naturelles dans le contexte de lʼannotation en langue des signes

Résumé

Mots clés

Domaines

Dates et versions

Identifiants

Citer

Exporter

Collections

Partager