Traitements pour la réduction de bruit. Application à la communication parlée. - TEL - Thèses en ligne Accéder directement au contenu
Thèse Année : 2005

Traitements pour la réduction de bruit. Application à la communication parlée.

Résumé

Because of the growing importance of mobile telecommunication, the need to enhance the sound pick-up, especially by reducing the inconvenience due to the noise, becomes more important. Short-term spectral attenuation techniques are widely used since they make it possible to respect real time constraints imposed by conversational speech applications. However, Noise reduction techniques are subject to a compromise between the effective level of noise reduction and the distorsion of the enhanced speech. It would be interesting to overcome this limitation and remove more noise while keeping an acceptable level of distorsion, particularly when the noise level is high. In the first part of this thesis, short-term spectral attenuation techniques are analyzed and theirlimitations are underlined. This analysis shows that it is possible to outperform state of the art techniques. In the second part, several new approaches are described and fully analyzed. We show that these techniques are able to solve partly or completely the limitations identified in the first part. We also take care of the design of noise reduction techniques that govern the global quality of the enhanced signal. The analysis of limitations in current noise reduction techniques allowed to find several new approaches able to solve them. The use of statistical models matching noise and speech signals to determine a noise reduction rule gives better results than using the classical Gaussian model. A more important concern is the limitations of the signal-to-noise ratio estimators which is a very important parameter that governs the performance of noise reduction techniques. The solutions proposed to overcome these limitations effectively succeed to limit the speech distorsions. However, the enhanced signal still suffers from degradations due to noise estimation errors and the impact of the phase. In fact, the noise estimation used to compute the signal-to-noise ratio suffers from many limitations especially for non-stationary noise. The phase parameter, though it is usually neglected, is also important for speech estimation particularly when the noise level is high. An original approach that takes advantage of the harmonic structure of speech to limit the harmonic distorsion has been proposed and outperforms the classical techniques. Besides, the design of these new approaches governs the global quality of the enhanced signal. Several solutions are proposed to avoid unpleasant artifacts such as "clicks" and musical noise. The performance of the proposed techniques is evaluated using objective measures completed, when required, by subjective tests. The obtained results show a significant improvement with respect to the reference techniques.
Avec l'avènement des télécommunications mobiles grand public, le besoin d'améliorer la prise de son, notamment en réduisant la gêne due au bruit, s'est fait de plus en plus présent. Les techniques de réduction du bruit sont soumises à un compromis entre le niveau effectif de réduction et la distorsion qui affecte le signal de parole. Au vu des performances actuelles, il est souhaitable de supprimer plus de bruit tout en conservant un niveau de dégradation acceptable du signal restauré, ceci en particulier lorsque le niveau de bruit est important. Les techniques qui ont suscité le plus l'intérêt au cours de ces 30 dernières années sont les approches par atténuation spectrale à court terme qui consistent à modifier une transformée à court terme du signal bruité en utilisant une règle de suppression. L'essor de cette famille de techniques s'explique essentiellement par le fait qu'elles permettent de respecter les contraintes de temps réel et de complexité inhérentes aux applications de communication parlée. La première partie de ce document est consacrée à l'analyse des techniques majeures de réduction du bruit par atténuation spectrale à court terme. Ce sera notamment l'occasion d'identifier les limitations, points de blocage et autres défauts de ces méthodes ainsi que de montrer qu'il existe une marge de progression intéressante en terme de qualité par rapport à ces différents points clés. La seconde partie est essentiellement consacrée à la description et l'analyse de solutions originales proposées en réponse aux limitations identifiées dans la première partie. Un soin particulier a également été apporté à la mise en œuvre qui fait partie intégrante des techniques de réduction de bruit et qui conditionne la qualité du signal restauré. L'analyse des limitations des techniques de réduction du bruit actuelles a permis de dégager plusieurs approches originales permettant de résoudre tout ou partie des problèmes identifiés. Ainsi, l'introduction de nouveaux modèles statistiques, adaptés aux signaux de parole et de bruit, pour déterminer l'expression d'une règle de suppression permet d'obtenir des résultats sensiblement meilleurs qu'en utilisant le modèle gaussien classique. Un problème d'ordre plus général concerne les défauts des estimateurs du rapport signal à bruit, paramètre fondamental qui conditionne les performances des techniques de réduction de bruit. La suppression de ces défauts conduit effectivement à une limitation des distorsions de la parole. Cependant, le signal restauré souffre toujours de certaines dégradations dues notamment aux erreurs d'estimation du bruit et à l'impact de la phase. En effet, l'estimation du bruit, qui constitue une étape clé des techniques de réduction de bruit, souffre de nombreuses limitations surtout lorsque le bruit n'a pas un caractère stationnaire. Dans une moindre mesure, la phase, qui est souvent négligée, a aussi une influence importante dans l'estimation du signal de parole, en particulier lorsque le niveau de bruit est élevé. Une approche originale qui tire parti de la structure voisée du signal de parole pour limiter les distorsions harmoniques engendrées par les techniques classiques est proposée et permet de dépasser les limites de performances des techniques classiques. Outre ces nouvelles approches, leur mise en œuvre conditionne également la qualité finale du signal restauré. Plusieurs points sensibles sont donc soulevés et des solutions sont données qui permettent d'éviter de nombreux artefacts ("clics", nasalisation, bruit musical) désagréables. Les approches proposées sont évaluées en utilisant des critères objectifs dont les résultats sont au besoin validés par des tests subjectifs. Les résultats obtenus montrent des améliorations significatives par rapport aux performances des techniques de référence.
Fichier principal
Vignette du fichier
Cyril_Plapous_Thesis.pdf (11.18 Mo) Télécharger le fichier
Loading...

Dates et versions

tel-00655991 , version 1 (03-01-2012)

Identifiants

  • HAL Id : tel-00655991 , version 1

Citer

Cyril Plapous. Traitements pour la réduction de bruit. Application à la communication parlée.. Traitement du signal et de l'image [eess.SP]. Université Rennes 1, 2005. Français. ⟨NNT : ⟩. ⟨tel-00655991⟩
774 Consultations
7301 Téléchargements

Partager

Gmail Facebook X LinkedIn More