Résumé automatique de parole pour un accès efficace aux bases de données audio

Benoit Favre

Thèse Année : 2007

Efficient Access to Speech Databases through Automatic Summarization

Résumé automatique de parole pour un accès efficace aux bases de données audio

(1)

Benoit Favre

Fonction : Auteur
PersonId : 4978
IdHAL : benoit-favre
ORCID : 0000-0002-9777-4613
IdRef : 115288511

Laboratoire Informatique d'Avignon

Résumé

The digital era has revealed new ways to store great quantities of speech at a low cost. Whereas recent advances in spoken document retrieval, exploiting audio documents is still difficult because of the time necessary to listen to them. We try to attenuate this disadvantage by producing an automatic spoken abstract from the most important information. For that purpose, an extractive summarization algorithm is applied to the spoken content thanks to automatic speech structuring. The rich transcription is carried out thanks to Speeral and Alize toolkits developed at LIA. We complement this structuring chain by sentence segmentation and named entities detection, two important features for extractive summarization. The proposed summarization approach includes constraints imposed by audio data and interactions with the user. Moreover, the method integrates a projection of sentences in pseudo-semantic-space. We integrated the various modules in a coherent prototype that ease the study of user interactions. Due to the lack of evaluation data for the speech summarization task, we evaluate our approach on the textual documents from the DUC 2006 campaign. We simulate the impact of spoken content structuring by artificially degrading the textual content provided for DUC. Finally, the whole processing sequence is implemented within a demonstrator facilitating the access radio broadcasts from the ESTER evaluation campain. Within the framework of this prototype, we present an interactive timeline that aims at recontextualizing the spoken summary.

L'avènement du numérique permet de stocker de grandes quantités de parole à moindre coût. Malgré les récentes avancées en recherche documentaire audio, il reste difficile d'exploiter les documents à cause du temps nécessaire pour les écouter. Nous tentons d'atténuer cet inconvénient en produisant un résumé automatique parlé à partir des informations les plus importantes. Pour y parvenir, une méthode de résumé par extraction est appliquée au contenu parlé, transcrit et structuré automatiquement. La transcription enrichie est réalisée grâce aux outils Speeral et Alize développés au LIA. Nous complétons cette chaîne de structuration par une segmentation en phrases et une détection des entités nommées, deux caractéristiques importantes pour le résumé par extraction. La méthode de résumé proposée prend en compte les contraintes imposées par des données audio et par des interactions avec l'utilisateur. De plus, cette méthode intègre une projection dans un espace pseudo-sémantique des phrases. Les différents modules mis en place aboutissent à un démonstrateur complet facilitant l'étude des interactions avec l'utilisateur. En l'absence de données d'évaluation sur la parole, la méthode de résumé est évaluée sur le texte lors de la campagne DUC 2006. Nous simulons l'impact d'un contenu parlé en dégradant artificiellement les données de cette même campagne. Enfin, l'ensemble de la chaîne de traitement est mise en œuvre au sein d'un démonstrateur facilitant l'accès aux émissions radiophoniques de la campagne ESTER. Nous proposons, dans le cadre de ce démonstrateur, une frise chronologique interactive complémentaire au résumé parlé.

Mots clés

Automatic speech summarization Spoken Document Retrieval Automatic Speech Recognition Rich Transcription Sentence Boundaries Named Entities

Résumé Automatique de Parole Recherche d'Information Parlée Reconnaissance Automatique de la Parole Transcription Enrichie Frontière de Phrase Entité Nommée Maximal Marginal Relevance MMR Conditional Random Fields CRF Latent Semantic Analysis LSA Document Understanding Conference DUC

Domaines

Interface homme-machine [cs.HC]

Fichier principal

favre_phd-thesis2007.pdf (1.67 Mo)

Benoit Favre : Connectez-vous pour contacter le contributeur

https://theses.hal.science/tel-00444105

Soumis le : mardi 5 janvier 2010-16:47:40

Dernière modification le : vendredi 21 janvier 2022-15:44:03

Archivage à long terme le : jeudi 18 octobre 2012-11:55:35

Dates et versions

tel-00444105 , version 1 (05-01-2010)

Identifiants

HAL Id : tel-00444105 , version 1

Citer

Benoit Favre. Résumé automatique de parole pour un accès efficace aux bases de données audio. Interface homme-machine [cs.HC]. Université d'Avignon, 2007. Français. ⟨NNT : ⟩. ⟨tel-00444105⟩

Exporter

BibTeX XML-TEI Dublin Core DC Terms EndNote DataCite

Collections

UNIV-AVIGNON LIA

232 Consultations

1503 Téléchargements

Efficient Access to Speech Databases through Automatic Summarization

Résumé automatique de parole pour un accès efficace aux bases de données audio

Résumé

Mots clés

Domaines

Dates et versions

Identifiants

Citer

Exporter

Collections

Partager