Méthodes à noyaux pour la détection de piétons - TEL - Thèses en ligne Accéder directement au contenu
Thèse Année : 2006

Kernel Machines for Pedestrian Detection

Méthodes à noyaux pour la détection de piétons

Résumé

A lot of research have been carried out in the field of pedestrian detection using images and computers. The main obstacle is related with the pedestrian himself, which could not be easily characterized, due to its high variability. In particular, we have a scale, pose and appearance variability.
To bring an issue to these variabilities, the pedestrian representation should be carefully chosen. In our case, we first use a graph based representation. In fact, a labeled graph has interesting properties to reduce particularly the scale and pose variability.
A second representation is based on histogramms of oriented gradient, which computes some local histogramms of an image. This method has a good generalization capacity against variability. To apply this method on infrared images in order to detect pedestrians, we have to design a function to extract and analyse some windows from this image.
The second part of the pattern recognition process is the classification. In our case we use the Support Vector Machine classifier, which is based on an particular function : the kernel function. The aim is to compute the inner product between data.
For the graph method, we have to design an inner product between graphs. The aim is to compare two graphs by using bag-of-paths. That is to say, we extract some paths from graphs and we compare paths between them. The final kernel is obtained by combining all comparisons between paths.
We also studied different kinds of kernel functions more specific for the histogramm-based representation in order to improve the performance of the classifier when we are using the HOG descriptor.
La détection de piéton est un problème récurrent depuis de nombreuses années. La principale confrontation est liée à la grande variabilité du piéton en échelle, posture et apparence. Un algorithme efficace de reconnaissance de formes doit donc être capable d'affronter ces difficultés. En particulier, le choix d'une représentation pertinente et discriminante est un sujet difficile à résoudre. Dans notrre cas, nous avons envisagé deux approches. La première consiste à représenter la forme d'un objet à l'aide de graphes étiquetés. Selon les étiquettes apportées, le graphe possède en effet des propriétés intéressantes pour résoudre les problèmes de variabilité de taille et de posture. Cette méthode nécessite cependant une segmentation rigoureuse au préalable. Nous avons ensuite étudié une représentation constituée d'histogrammes locaux d'orientation de gradient. Cette méthode présente des résultats intéressants par ses capacités de généralisation. L'application de cette méthode sur des images infrarouges complètes nécessite cependant une fonction permettant d'extraire des fenêtres dans l'image afin d'analyser leur contenu et vérifier ainsi la présence ou non de piétons. La deuxième étape du processus de reconnaissance de formes concerne l'analyse de la représentation des données. Nous utilisons pour cela le classifieur Support Vector Machine bâti, entre autres, sur une fonction noyau calculant le produit scalaire entre les données support et la donnée évaluée. Dans le cas des graphes, nous utilisons une formulation de noyau de graphes calculé sur des "sacs de chemins". Le but consiste à extraire un ensemble de chemins de chaque graphe puis de comparer les chemins entre eux et combiner les comparaisons pour obtenir le noyau final. Pour analyser les histogrammes de gradient, nous avons étudié différentes formulations permettant d'obtenir les meilleures performances avec cette représentation qui peut être assimilée à une distribution de probabilités.
Fichier principal
Vignette du fichier
theseFSuard.pdf (7.81 Mo) Télécharger le fichier
Loading...

Dates et versions

tel-00375617 , version 1 (15-04-2009)

Identifiants

  • HAL Id : tel-00375617 , version 1

Citer

Frédéric Suard. Méthodes à noyaux pour la détection de piétons. Informatique [cs]. INSA de Rouen, 2006. Français. ⟨NNT : ⟩. ⟨tel-00375617⟩
241 Consultations
694 Téléchargements

Partager

Gmail Facebook X LinkedIn More