10 articles  [english version]
Fiche détaillée Thèses
Institut National Polytechnique de Grenoble - INPG (05/04/2006), Gérard Bailly (Dir.)
Liste des fichiers attachés à ce document : 
PDF
These_Gibert.pdf(5.1 MB)
Conception et évaluation d'un système de synthèse 3D de Langue française Parlée Complétée (LPC) à partir du texte
Guillaume Gibert1

Cette thèse traite de la mise en œuvre d'un système de synthèse 3D de parole audiovisuelle capable, a partir d'une simple chaîne phonétique, de générer un signal audio synthétique, les mouvements du visage correspondant ainsi que les mouvements de la main reproduisant les gestes de la Langue française Parlée Complétée (LPC). Nous avons enregistré les mouvements faciaux et manuels d'une codeuse LPC par une technique de motion capture, ainsi que le signal audio correspondant, lors de la production d'un corpus de 238 phrases couvrant l'ensemble des diphones du français. Après traitements et analyses des données, nous avons implémenté un système de synthèse par concaténation d'unités en deux étapes capable de générer de la parole codée. Enfin, nous avons évalué notre système tant au niveau de l'intelligibilité segmentale qu'au niveau de la compréhension. Les résultats sont prometteurs et montrent clairement un apport d'information du code de synthèse.
1 :  ICP - Institut de la communication parlée
Synthèse de parole audiovisuelle – Langue française Parlée Complétée (LPC) – Capture de mouvements – Animation 3D – évaluation

This thesis deals with the implementation of a complete 3D text-to-Cued Speech synthesizer : from a text input, we generate the facial and manual movements and the audio corresponding to the French Cued Speech transcription. We recorded the trajectories of flesh points on the face and the hand during the production of a corpus of sentences designed to cover all French diphones by a cuer. After processing and analysis, we implement a system able to generate French Cued Speech from a text input. Finally, we evaluate our system according to different methods. Evaluations show promising results in terms of intelligibility and understanding.
Text-to-Audiovisual Speech – Cued Speech – Motion capture – 3D Animation – Evaluation