A speaker recognition system based on vocal cords’ vibrations

Dany Ishak

Thèse Année : 2017

A speaker recognition system based on vocal cords’ vibrations

La conception d'un système ultrasonore passif couche mince pour l'évaluation de l'état vibratoire des cordes vocales

(1)

Dany Ishak

Fonction : Auteur

Institut d’Électronique, de Microélectronique et de Nanotechnologie - UMR 8520

Résumé

In this work, a speaker recognition approach using a contact microphone is developed and presented. The contact passive element is constructed from a piezoelectric material. In this context, the position of the piezoelectric transducer on the individual’s neck may greatly affect the quality of the collected signal and consequently the information extracted from it. Thus, the multilayered medium in which the sound propagates before being detected by the transducer is modeled. The best location on the individual’ neck to place a particular transducer element is determined by implementing Monte Carlo simulation techniques and consequently, the simulation results are verified using real experiments. The recognition is based on the signal generated from the vocal cords’ vibrations when an individual is speaking and not on the vocal signal at the output of the lips that is influenced by the resonances in the vocal tract. Therefore, due to the varying nature of the collected signal, the analysis was performed by applying the Short Term Fourier Transform technique to decompose the signal into its frequency components. These frequencies represent the vocal folds’ vibrations (50-1000 Hz). The features in terms of frequencies’ interval are extracted from the resulting spectrogram. Then, a 1-D vector is formed for identification purposes. The identification of the speaker is performed using two evaluation criteria, namely, the correlation similarity measure and the Principal Component Analysis (PCA) in conjunction with the Euclidean distance. The results show that a high percentage of recognition is achieved and the performance is much better than many existing techniques in the literature.

Dans ce travail, une approche de reconnaissance de l’orateur en utilisant un microphone de contact est développée et présentée. L'élément passif de contact est construit à partir d'un matériau piézoélectrique. La position du transducteur piézoélectrique sur le cou de l'individu peut affecter grandement la qualité du signal recueilli et par conséquent les informations qui en sont extraites. Ainsi, le milieu multicouche dans lequel les vibrations des cordes vocales se propagent avant d'être détectées par le transducteur est modélisé. Le meilleur emplacement sur le cou de l’individu pour attacher un élément transducteur particulier est déterminé en mettant en œuvre des techniques de simulation Monte Carlo et, par conséquent, les résultats de la simulation sont vérifiés en utilisant des expériences réelles. La reconnaissance est basée sur le signal généré par les vibrations des cordes vocales lorsqu'un individu parle et non sur le signal vocal à la sortie des lèvres qui est influencé par les résonances dans le conduit vocal. Par conséquent, en raison de la nature variable du signal recueilli, l'analyse a été effectuée en appliquant la technique de transformation de Fourier à court terme pour décomposer le signal en ses composantes de fréquence. Ces fréquences représentent les vibrations des cordes vocales (50-1000 Hz). Les caractéristiques en termes d'intervalle de fréquences sont extraites du spectrogramme résultant. Ensuite, un vecteur 1-D est formé à des fins d'identification. L'identification de l’orateur est effectuée en utilisant deux critères d'évaluation qui sont la mesure de la similarité de corrélation et l'analyse en composantes principales (ACP) en conjonction avec la distance euclidienne. Les résultats montrent qu'un pourcentage élevé de reconnaissance est atteint et que la performance est bien meilleure que de nombreuses techniques existantes dans la littérature.

Mots clés

Biometric Identification Collar Contact microphone Correlation Diagnostic Laryngophone Non acoustic sensor Piezoelectric transducer Pca Physiological microphone (P-Mic) Recursive stiffness matrix Speaker identification Stft Time-Frequency analysis Throat microphone

Analyse temps-Fréquentielle Capteur non acoustique Corrélation Diagnostique Identification biométrique Matrice de rigidité récursive Microphone de contact Microphone de la gorge Laryngophone

Domaines

Micro et nanotechnologies/Microélectronique

Fichier principal

Ishak_Dany2.pdf (3.15 Mo)

Origine : Version validée par le jury (STAR)

ABES STAR : Contact

https://theses.hal.science/tel-01732145

Soumis le : mercredi 14 mars 2018-14:46:07

Dernière modification le : mercredi 24 janvier 2024-09:54:18

Archivage à long terme le : mardi 4 septembre 2018-08:31:57

Dates et versions

tel-01732145 , version 1 (14-03-2018)

Identifiants

HAL Id : tel-01732145 , version 1

Citer

Dany Ishak. A speaker recognition system based on vocal cords’ vibrations. Micro and nanotechnologies/Microelectronics. Université de Valenciennes et du Hainaut-Cambresis; Université de Balamand (Tripoli, Liban), 2017. English. ⟨NNT : 2017VALE0043⟩. ⟨tel-01732145⟩

Exporter

BibTeX XML-TEI Dublin Core DC Terms EndNote DataCite

Collections

CNRS UNIV-VALENCIENNES IEMN STAR UNIV-LILLE THESES-UPHF

439 Consultations

1575 Téléchargements

A speaker recognition system based on vocal cords’ vibrations

La conception d'un système ultrasonore passif couche mince pour l'évaluation de l'état vibratoire des cordes vocales

Résumé

Mots clés

Domaines

Dates et versions

Identifiants

Citer

Exporter

Collections

Partager