Étude sur les représentations continues de mots appliquées à la détection automatique des erreurs de reconnaissance de la parole

Résumé : Nous abordons, dans cette thèse, une étude sur les représentations continues de mots (en anglais word embeddings) appliquées à la détection automatique des erreurs dans les transcriptions de la parole. Notre étude se concentre sur l’utilisation d’une approche neuronale pour améliorer la détection automatique des erreurs dans les transcriptions automatiques, en exploitant les word embeddings. L’exploitation des embeddings repose sur l’idée que la détection d’erreurs consiste à trouver les possibles incongruités linguistiques ou acoustiques au sein des transcriptions automatiques. L’intérêt est donc de trouver la représentation appropriée du mot qui permet de capturer des informations pertinentes pour pouvoir détecter ces anomalies. Notre contribution dans le cadre de cette thèse porte sur plusieurs axes. D’abord, nous commençons par une étude préliminaire dans laquelle nous proposons une architecture neuronale capable d’intégrer différents types de descripteurs, y compris les embeddings. Ensuite, nous nous focalisons sur une étude approfondie des représentations continues de mots. Cette étude porte d’une part sur l’évaluation de différents types d’embeddings linguistiques puis sur leurs combinaisons. D’autre part, elle s’intéresse aux embeddings acoustiques de mots. Puis, nous présentons une étude sur l’analyse des erreurs de classifications, qui a pour objectif de percevoir les erreurs difficiles à détecter.Finalement, nous exploitons les embeddings linguistiques et acoustiques ainsi que l’information fournie par notre système de détections d’erreurs dans plusieurs cadres applicatifs.
Type de document :
Thèse
Informatique et langage [cs.CL]. Université du Maine, 2017. Français. 〈NNT : 2017LEMA1019〉
Liste complète des métadonnées

Littérature citée [106 références]  Voir  Masquer  Télécharger

https://tel.archives-ouvertes.fr/tel-01661491
Contributeur : Abes Star <>
Soumis le : mercredi 31 janvier 2018 - 11:30:10
Dernière modification le : mardi 20 février 2018 - 16:33:08
Document(s) archivé(s) le : mardi 1 mai 2018 - 12:17:16

Fichier

2017LEMA1019_vers02.pdf
Version validée par le jury (STAR)

Identifiants

  • HAL Id : tel-01661491, version 1

Collections

Citation

Sahar Ghannay. Étude sur les représentations continues de mots appliquées à la détection automatique des erreurs de reconnaissance de la parole. Informatique et langage [cs.CL]. Université du Maine, 2017. Français. 〈NNT : 2017LEMA1019〉. 〈tel-01661491〉

Partager

Métriques

Consultations de la notice

477

Téléchargements de fichiers

803