Modèles de génération de trajectoires pour l'animation de visages parlants

Résumé : Le travail réalisé durant cette thèse concerne la synthèse visuelle de la parole pour l'animation d'un humanoïde de synthèse. L'objectif principal de notre étude est de proposer et d'implémenter des modèles de contrôle pour l'animation faciale qui puissent générer des trajectoires articulatoires à partir du texte. Pour ce faire nous avons travaillé sur 2 corpus audiovisuels. Tout d'abord, nous avons comparé objectivement et subjectivement les principaux modèles existants de l'état de l'art. Ensuite, nous avons étudié l'aspect spatial des réalisations des cibles articulatoires, pour les synthèses par HMM (Hidden Markov Model) et par concaténation simple. Nous avons combiné les avantages des deux méthodes en proposant un nouveau modèle de synthèse nommé TDA (Task Dynamics for Animation). Ce modèle planifie les cibles géométriques grâce à la synthèse par HMM et exécute les cibles articulatoires ainsi générées grâce à la synthèse par concaténation. Par la suite, nous avons étudié l'aspect temporel de la synthèse de la parole et proposé un second modèle de synthèse intitulé PHMM (Phased Hidden Markov Model) permettant de gérer les différentes modalités liées à la parole. Le modèle PHMM permet de calculer les décalages des frontières des gestes articulatoires par rapport aux frontières acoustiques des allophones. Ce modèle a été également appliqué à la synthèse automatique du LPC (Langage Parlé Complété). Enfin, nous avons réalisé une évaluation subjective des différentes méthodes de synthèse visuelle étudiées (concaténation, HMM, PHMM et TDA).
Type de document :
Thèse
Informatique [cs]. Institut National Polytechnique de Grenoble - INPG, 2008. Français


https://tel.archives-ouvertes.fr/tel-00363319
Contributeur : Oxana Govokhina Le Blevec <>
Soumis le : dimanche 22 février 2009 - 15:09:43
Dernière modification le : mercredi 17 juin 2015 - 01:14:06
Document(s) archivé(s) le : vendredi 12 octobre 2012 - 12:10:16

Identifiants

  • HAL Id : tel-00363319, version 1

Citation

Oxana Govokhina. Modèles de génération de trajectoires pour l'animation de visages parlants. Informatique [cs]. Institut National Polytechnique de Grenoble - INPG, 2008. Français. <tel-00363319>

Exporter

Partager

Métriques

Consultations de
la notice

319

Téléchargements du document

181