Estimation de fréquences fondamentales multiples en vue de la séparation de signaux de parole mélangés dans un même canal - TEL - Thèses en ligne Accéder directement au contenu
Thèse Année : 2009

Automatic multipitch estimation for monaural speech mixture signals

Estimation de fréquences fondamentales multiples en vue de la séparation de signaux de parole mélangés dans un même canal

Résumé

This PhD dissertation presents a new multi-Pitch Estimation Algorithm (mPEA) for speech mixtures. It relies on two new spectral comb families called Negatives Teeth Combs (NTC) and Missing Teeth Combs (MTC). The scalar product between a spectrum and a spectral comb produces a pitch function which quanti es the strength of the harmonic structure at a given frequency. Each pitch function contains spurious peaks which could produce F0 estimation errors. The combination of pitch functions obtained by each NTC and MTC attenuates the spurious peaks. This combination is called Harmonic Cancellation Comb principle. Two implementations of this principle are described and one is evaluated comparatively to others existing mPEA in the monopitch and bipitch cases. The performances obtained are similar to the state of art (10% of gross error rate in the bipitch case). The evaluation process points out the critical influence of the voiced/unvoiced decision on the gross error rate. Four mPEA comparative evaluation methodologies are proposed and used.
Cette thèse propose un algorithme d'estimation de F0 multiples (AEP) pour la parole superposée. Il s'appuie sur deux familles de peignes spectraux nommées Peignes à Dents Négatives (PDN) et Peignes à Dents Manquantes (PDM). Le produit scalaire entre un spectre d'amplitude et un peigne spectral produit une fonction de pitch qui quanti fie la force de la structure harmonique d'une fréquence donnée. Les fonctions de pitch contiennent des pics parasites provoquant des erreurs d'estimation de F0. La combinaison des fonctions de pitch de chaque PDN et PDM permet d'atténuer ces pics parasites. Cette combinaison est nommée principe de Peigne à Suppression Harmonique (PSH). Deux implémentations du principe de PSH sont décrites dont une est évaluée de manière comparative à d'autres algorithmes existant dans les situations monopitch et bipitch. Quatre méthodologies sont proposées. Les performances obtenues sont largement à la hauteur de l'état de l'art (10% d'erreurs grossières en bipitch). Cette évaluation a permis de mettre en évidence l'influence critique de la décision voisé/non-voisé sur les taux d'erreurs.
Fichier principal
Vignette du fichier
these_signol2009.pdf (9.49 Mo) Télécharger le fichier
Loading...

Dates et versions

tel-00618687 , version 1 (02-09-2011)

Identifiants

  • HAL Id : tel-00618687 , version 1

Citer

François Signol. Estimation de fréquences fondamentales multiples en vue de la séparation de signaux de parole mélangés dans un même canal. Physique [physics]. Université Paris Sud - Paris XI, 2009. Français. ⟨NNT : ⟩. ⟨tel-00618687⟩
207 Consultations
260 Téléchargements

Partager

Gmail Facebook X LinkedIn More