Skip to Main content Skip to Navigation
Theses

Contributions to a fast and robust object recognition in images

Résumé : Dans cette thèse, nous présentons tout d'abord une contribution visant à pallier ce problème de robustesse pour la reconnaissance d'instances, puis une extension directe de cette contribution à la reconnaissance et la localisation de classes d'objets. Dans un premier temps, nous avons développé une méthode inspiré de l'appariement de graphe (i.e. graph matching) afin de traiter le problème de la reconnaissance rapide d'instances d'objets spécifiques dans des conditions bruitées. Cette méthode permet de rajouter facilement un nombre quelconque d’autres types de caractéristiques locales (e.g. contours, textures…) moins affectées par le bruit tout en contournant le problème de la normalisation et sans pénaliser la vitesse de détection. Nos expériences sur plusieurs bases de test ont montré la pertinence de notre approche. Notre approche est globalement légèrement moins robuste à l'occultation que les approches existantes, mais elle produit des performances supérieures aux approches standard en conditions bruitées. Dans un second temps, nous avons développé une approche pour la détection de classes d'objets dans le même esprit que celui du sac de mots visuels. Pour cela, nous utilisons nos cascades de micro-classifieurs pour reconnaître des mots visuels plus distinctifs que les mots basés simplement sur des points d'intérêts. L'apprentissage se divise en deux parties: dans un premier temps, nous générons des cascades de micro-classifieurs servant à reconnaître des parties locales des images modèles ; puis dans un second temps, nous utilisons un classifieur afin de modéliser la frontière de décision entre les images de classe et celles de non-classe. Nous montrons que l'association de mots classiques (à partir de points d'intérêts) et de nos mots plus distincts produit une amélioration significative des performances pour un temps de calcul assez faible.
Document type :
Theses
Complete list of metadatas

Cited literature [152 references]  Display  Hide  Download

https://tel.archives-ouvertes.fr/tel-00694442
Contributor : Abes Star :  Contact
Submitted on : Friday, May 4, 2012 - 11:52:24 AM
Last modification on : Wednesday, July 8, 2020 - 12:42:08 PM
Document(s) archivé(s) le : Sunday, August 5, 2012 - 2:31:36 AM

File

these.pdf
Version validated by the jury (STAR)

Identifiers

  • HAL Id : tel-00694442, version 1

Citation

Jérôme Revaud. Contributions to a fast and robust object recognition in images. Other [cs.OH]. INSA de Lyon, 2011. English. ⟨NNT : 2011ISAL0042⟩. ⟨tel-00694442⟩

Share

Metrics

Record views

448

Files downloads

350