Contribution à la détection et à la reconnaissance d'objets dans les images

Hedi Harzallah 1
1 LEAR - Learning and recognition in vision
Inria Grenoble - Rhône-Alpes, LJK - Laboratoire Jean Kuntzmann, INPG - Institut National Polytechnique de Grenoble
Résumé : Cette thèse s'intéresse au problème de la reconnaissance d'objets dans les images vidéo et plus particulièrement à celui de leur localisation. Elle a été conduite dans le contexte d'une collaboration scientifique entre l'INRIA Rhône-Alpes et MBDA France. De ce fait, une attention particulière a été accordée à l’applicabilité des approches proposées aux images infra-rouges. La méthode de localisation proposée repose sur l'utilisation d'une fenêtre glissante incluant une cascade à deux étages qui, malgré sa simplicité, permet d'allier rapidité et précision. Le premier étage est un étage de filtrage rejetant la plupart des faux positifs au moyen d’un classifieur SVM linéaire. Le deuxième étage élimine les fausses détections laissées par le premier étage avec un classifieur SVM non-linéaire plus lent, mais plus performant. Les fenêtres sont représentées par des descripteurs HOG et Bag-of-words. La seconde contribution de la thèse réside dans une méthode permettant de combiner localisation d'objets et catégorisation d'images. Ceci permet, d'une part, de prendre en compte le contexte de l'image lors de la localisation des objets, et d'autre part de s'appuyer sur la structure géométrique des objets lors de la catégorisation des images. Cette méthode permet d'améliorer les performances pour les deux tâches et produit des détecteurs et classifieurs dont la performance dépasse celle de l'état de l'art. Finalement, nous nous penchons sur le problème de localisation de catégories d'objets similaires et proposons de décomposer la tâche de localisation d'objets en deux étapes. Une première étape de détection permet de trouver les objets sans déterminer leurs positions tandis qu’une seconde étape d’identification permet de prédire la catégorie de l'objet. Nous montrons que cela permet de limiter les confusions entre les classes, principal problème observé pour les catégories d'objets visuellement similaires. La thèse laisse une place importante à la validation expérimentale, conduites sur la base PASCAL VOC ainsi que sur des bases d’images spécifiquement réalisées pour la thèse.
Type de document :
Thèse
Mathématiques générales [math.GM]. Université de Grenoble, 2011. Français. 〈NNT : 2011GRENM016〉
Liste complète des métadonnées

Littérature citée [88 références]  Voir  Masquer  Télécharger

https://tel.archives-ouvertes.fr/tel-00623278
Contributeur : Abes Star <>
Soumis le : vendredi 30 septembre 2011 - 11:12:37
Dernière modification le : jeudi 25 octobre 2018 - 13:24:26
Document(s) archivé(s) le : samedi 31 décembre 2011 - 02:25:27

Fichier

19220_HARZALLAH_2011_archivage...
Version validée par le jury (STAR)

Identifiants

  • HAL Id : tel-00623278, version 2

Collections

Citation

Hedi Harzallah. Contribution à la détection et à la reconnaissance d'objets dans les images. Mathématiques générales [math.GM]. Université de Grenoble, 2011. Français. 〈NNT : 2011GRENM016〉. 〈tel-00623278v2〉

Partager

Métriques

Consultations de la notice

2232

Téléchargements de fichiers

5313