10 articles  [english version]
Fiche concise Thèses
Conception et évaluation d'un système de synthèse 3D de Langue française Parlée Complétée (LPC) à partir du texte
Gibert G.
Thèses. Institut National Polytechnique de Grenoble - INPG (05/04/2006), Gérard Bailly (Dir.)
[oai:tel.archives-ouvertes.fr:tel-00203134] - http://tel.archives-ouvertes.fr/tel-00203134
Liste des fichiers attachés à ce document : 
PDF
These_Gibert.pdf(5.1 MB)
Guillaume Gibert1
1 :  ICP - Institut de la communication parlée
http://www.icp.inpg.fr/
CNRS : UMR5009 – Université Stendhal - Grenoble III – Institut National Polytechnique de Grenoble (INPG)
1180 Av Centrale - BP 25 38040 GRENOBLE CEDEX 9
France
Conception et évaluation d'un système de synthèse 3D de Langue française Parlée Complétée (LPC) à partir du texte
05/04/2006
Cette thèse traite de la mise en œuvre d'un système de synthèse 3D de parole audiovisuelle capable, a partir d'une simple chaîne phonétique, de générer un signal audio synthétique, les mouvements du visage correspondant ainsi que les mouvements de la main reproduisant les gestes de la Langue française Parlée Complétée (LPC). Nous avons enregistré les mouvements faciaux et manuels d'une codeuse LPC par une technique de motion capture, ainsi que le signal audio correspondant, lors de la production d'un corpus de 238 phrases couvrant l'ensemble des diphones du français. Après traitements et analyses des données, nous avons implémenté un système de synthèse par concaténation d'unités en deux étapes capable de générer de la parole codée. Enfin, nous avons évalué notre système tant au niveau de l'intelligibilité segmentale qu'au niveau de la compréhension. Les résultats sont prometteurs et montrent clairement un apport d'information du code de synthèse.
This thesis deals with the implementation of a complete 3D text-to-Cued Speech synthesizer : from a text input, we generate the facial and manual movements and the audio corresponding to the French Cued Speech transcription. We recorded the trajectories of flesh points on the face and the hand during the production of a corpus of sentences designed to cover all French diphones by a cuer. After processing and analysis, we implement a system able to generate French Cued Speech from a text input. Finally, we evaluate our system according to different methods. Evaluations show promising results in terms of intelligibility and understanding.
Sciences de l'ingénieur/Traitement du signal et de l'image

Institut National Polytechnique de Grenoble - INPG
Electronique, Electrotechnique, Automatique, Télécommunications, Signal
signal, image, parole, télécoms
Français

Gérard Bailly
Jean-Marc Chassery (Président)
Sylvie Gibet (Rapporteur)
Christophe d'Alessandro (Rapporteur)
Gérard Bailly (Directeur)
Nadine Vigouroux (Examinateur)

Synthèse de parole audiovisuelle – Langue française Parlée Complétée (LPC) – Capture de mouvements – Animation 3D – évaluation
Text-to-Audiovisual Speech – Cued Speech – Motion capture – 3D Animation – Evaluation