Classification automatique pour la compréhension de la parole : vers des systèmes semi-supervisés et auto-évolutifs - TEL - Thèses en ligne Accéder directement au contenu
Thèse Année : 2012

Machine learning applied to speech language understanding : towards semi-supervised and self-evolving systems

Classification automatique pour la compréhension de la parole : vers des systèmes semi-supervisés et auto-évolutifs

Pierre Gotab
  • Fonction : Auteur
  • PersonId : 769208
  • IdRef : 171363507

Résumé

Two wide research fields named Speech Recognition and Machine Learning meet with the Automatic Speech Language Understanding. One of the main problems in this domain is to obtain a sufficient corpus to train an efficient statistical model. Such speech corpora need a lot of human involvement to transcript and semantically annotate them. Their production cost is therefore quite high and they are difficultly available.This thesis mainly aims at reducing the need of human intervention in two ways: firstly, reducing the amount of corpus needed to build a model thanks to some semi-supervised learning methods (Self-Training, Co-Training and Active-Learning); And lastly, using the answers of the system end-user to improve the comprehension model.This last point addresses another problem related to automatic speech understanding systems: the need to adapt their models to the fluctuation of end-user habits or to the modification of the services list offered by the system
La compréhension automatique de la parole est au confluent des deux grands domaines que sont la reconnaissance automatique de la parole et l'apprentissage automatique. Un des problèmes majeurs dans ce domaine est l'obtention d'un corpus de données conséquent afin d'obtenir des modèles statistiques performants. Les corpus de parole pour entraîner des modèles de compréhension nécessitent une intervention humaine importante, notamment dans les tâches de transcription et d'annotation sémantique. Leur coût de production est élevé et c'est la raison pour laquelle ils sont disponibles en quantité limitée.Cette thèse vise principalement à réduire ce besoin d'intervention humaine de deux façons : d'une part en réduisant la quantité de corpus annoté nécessaire à l'obtention d'un modèle grâce à des techniques d'apprentissage semi-supervisé (Self-Training, Co-Training et Active-Learning) ; et d'autre part en tirant parti des réponses de l'utilisateur du système pour améliorer le modèle de compréhension.Ce dernier point touche à un second problème rencontré par les systèmes de compréhension automatique de la parole et adressé par cette thèse : le besoin d'adapter régulièrement leurs modèles aux variations de comportement des utilisateurs ou aux modifications de l'offre de services du système
Fichier principal
Vignette du fichier
Manuscrit_-_These_-_Pierre_-_Gotab_-_w_-_jury.pdf (2.64 Mo) Télécharger le fichier
Origine : Version validée par le jury (STAR)
Loading...

Dates et versions

tel-00858980 , version 1 (06-09-2013)

Identifiants

  • HAL Id : tel-00858980 , version 1

Citer

Pierre Gotab. Classification automatique pour la compréhension de la parole : vers des systèmes semi-supervisés et auto-évolutifs. Autre [cs.OH]. Université d'Avignon, 2012. Français. ⟨NNT : 2012AVIG0180⟩. ⟨tel-00858980⟩
345 Consultations
758 Téléchargements

Partager

Gmail Facebook X LinkedIn More