Recherche approximative de plus proches voisins avec contrôle probabiliste de la précision ; application à la recherche d'images par le contenu - TEL - Thèses en ligne Accéder directement au contenu
Thèse Année : 2004

Approximate search of nearest neighbors with probabilistic control of the accuracy; application to content-based image retrieval

Recherche approximative de plus proches voisins avec contrôle probabiliste de la précision ; application à la recherche d'images par le contenu

Résumé

This thesis is concerned with content-based image retrieval (CBIR) systems. These systems retrieve the images that are the most similar to a query one within an image database. This requires describing automatically the images such that the visual similarity between two images becomes proportional to the distance between their descriptors. Retrieving the most similar images of the query images is therefore achieved by searching for the nearest-neighbors of the descriptor of the query image. This search mode is however inherently expensive when the database is very large and even when multidimensional indexing techniques are used. The dimensionality curse problem makes these techniques inefficient in dimensional spaces. It is possible, however, tor educe the retrieval cost by searching for approximate neighbors of the query descriptors instead of searching for the exact result. In this thesis, this principle is used and a new approach for performing efficient approximate nearest-neighbor searches in high dimensional databases is proposed. This approach allows a fine and intuitive control over the precision of the search by setting the maximum probability to miss one of the exact nearest neighbors. In addition, this method is used to perform similarity searches within a CBIR system for image copy identification. The idea is to evaluate the method within a real system. This evaluation shows that it is efficient, reliable and its imprecision has only a little impact on the final results
Cette thèse s'intéresse aux systèmes de recherche d'images par le contenu, où le but est de rechercher les images les plus similaires à une image requête fournie en exemple. Pour cela, il est d'abord nécessaire de décrire les images stockées dans la base. L'objectif est de traduire la similarité visuelle entre images en une simple notion de proximité spatiale entre descripteurs. Ainsi, pour retrouver les images similaires à l'image requête, il suffit de retrouver les descripteurs les plus proches du descripteur de l'image requête. Ce mode de recherche, appelé recherche de plus proches voisins, est cependant extrêmement coûteux même lorsque les techniques s'indexation multidimensionnelles sont utilisées. Les performances de celles-ci se dégradent exponentiellement lorsque la dimension des descripteurs augmente (phénomène de la malédiction de la dimension). Il s'avère toutefois que l'on peut fortement réduire le coût de ces recherches en effectuant des recherches approximatives. Le principe est alors de négocier une réduction du temps de réponse contre l'introduction d'imprécisions durant la recherche. Ce travail reprend ce principe et propose une nouvelle méthode de recherche approximative de plus proches voisins qui permet un contrôle fin et intuitif de la précision de la recherche. Ce contrôle s'exprime au travers d'un seul paramètre qui indique la probabilité maximale de ne pas trouver un des plus proches voisins recherchés. Dans le but d'évaluer rigoureusement ses performances dans le cadre d'un système réel, la méthode proposée a été ensuite intégrée dans un système de recherche d'images pour la détection de copies. Les expérimentations effectuées montrent que la méthode proposée est efficace, fiable et son imprécision n'a qu'un impact mineur sur la qualité des résultats finaux.
Fichier principal
Vignette du fichier
these_Sid-Ahmed_Berrani.pdf (4.1 Mo) Télécharger le fichier

Dates et versions

tel-00532854 , version 1 (04-11-2010)

Identifiants

  • HAL Id : tel-00532854 , version 1

Citer

Sid-Ahmed Berrani. Recherche approximative de plus proches voisins avec contrôle probabiliste de la précision ; application à la recherche d'images par le contenu. Interface homme-machine [cs.HC]. Université Rennes 1, 2004. Français. ⟨NNT : ⟩. ⟨tel-00532854⟩
379 Consultations
923 Téléchargements

Partager

Gmail Facebook X LinkedIn More