Detection of emotions from video in non-controlled environment

Résumé : Dans notre communication quotidienne avec les autres, nous avons autant de considération pour l’interlocuteur lui-même que pour l’information transmise. En permanence coexistent en effet deux modes de transmission : le verbal et le non-verbal. Sur ce dernier thème intervient principalement l’expression faciale avec laquelle l’interlocuteur peut révéler d’autres émotions et intentions. Habituellement, un processus de reconnaissance d’émotions faciales repose sur 3 étapes : le suivi du visage, l’extraction de caractéristiques puis la classification de l’expression faciale. Pour obtenir un processus robuste apte à fournir des résultats fiables et exploitables, il est primordial d’extraire des caractéristiques avec de forts pouvoirs discriminants (selon les zones du visage concernées). Les avancées récentes de l’état de l’art ont conduit aujourd’hui à diverses approches souvent bridées par des temps de traitement trop couteux compte-tenu de l’extraction de descripteurs sur le visage complet ou sur des heuristiques mathématiques et/ou géométriques.En fait, aucune réponse bio-inspirée n’exploite la perception humaine dans cette tâche qu’elle opère pourtant régulièrement. Au cours de ces travaux de thèse, la base de notre approche fut ainsi de singer le modèle visuel pour focaliser le calcul de nos descripteurs sur les seules régions du visage essentielles pour la reconnaissance d’émotions. Cette approche nous a permis de concevoir un processus plus naturel basé sur ces seules régions émergentes au regard de la perception humaine. Ce manuscrit présente les différentes méthodologies bio-inspirées mises en place pour aboutir à des résultats qui améliorent généralement l’état de l’art sur les bases de référence. Ensuite, compte-tenu du fait qu’elles se focalisent sur les seules parties émergentes du visage, elles améliorent les temps de calcul et la complexité des algorithmes mis en jeu conduisant à une utilisation possible pour des applications temps réel.
Type de document :
Thèse
Image Processing. Université Claude Bernard - Lyon I, 2013. English. 〈NNT : 2013LYO10227〉
Liste complète des métadonnées

Littérature citée [93 références]  Voir  Masquer  Télécharger

https://tel.archives-ouvertes.fr/tel-01166539
Contributeur : Abes Star <>
Soumis le : mardi 23 juin 2015 - 11:05:38
Dernière modification le : mercredi 5 juillet 2017 - 01:10:00
Document(s) archivé(s) le : mardi 15 septembre 2015 - 21:40:34

Fichier

TH2013KhanRizwanAhmed.pdf
Version validée par le jury (STAR)

Identifiants

  • HAL Id : tel-01166539, version 2

Collections

Citation

Rizwan Ahmed Khan. Detection of emotions from video in non-controlled environment. Image Processing. Université Claude Bernard - Lyon I, 2013. English. 〈NNT : 2013LYO10227〉. 〈tel-01166539v2〉

Partager

Métriques

Consultations de
la notice

888

Téléchargements du document

325