Mesures de Distance dans le Contexte de la Recherche d'Images par le Contenu (CBIR)

Mawloud Mosbah

Résumé

Owing to the importance given, in the last recent decades, to the digital images available in most sectors of activity, image retrieval and exploration systems have gained a lot of attention and interest from many researchers. Review of literature reveals three main axes devoted to image search: text based image retrieval (TBIR), content based image retrieval (CBIR) and ontologies based image retrieval. TBIR was the first adopted image search technique. However, this approach suffers significantly due to the semantic gap characterizing the TBIR paradigm. These drawbacks derive mainly from the subjectivity and the difficulty of the annotation process. These difficulties lead then to the emergence of the dean new CBIR paradigm. This last approach is based on characterizing first the images (query and database) by signatures extracted directly from the images content. These characteristics are exploited in a later stage to draw a matching scheme between the query and the database. Unfortunately, this paradigm, which inherits the characteristics of computer vision and information retrieval domains, suffers itself from another kind of semantic gap. Indeed, there can be noticed another significant distance between the extracted low level features and the high level semantics content of the images. In that respect, many enhancement techniques for CBIR systems have been suggested during the years, like, fusion/combination of signatures, fusion/combination of descriptors, re-ranking techniques and attributes selection approach. This thesis addresses mainly enhancement of CBIR performances through re-ranking and adaptation techniques. As reported in (Mosbah & Boucheham, 2017a), we have explored two re-ranking strategies: (1) results re-ranking using pseudo relevance feedback via looking for correlation between the first ranked images, (2) employing of relevance feedback information given by the user through his/her judgement of some returned results. The adaptation is considered through the following aspects: region adaptation, threshold adaptation, matching measure adaptation and relevance feedback adaptation. The two considered approaches have lead to many proposed algorithms: re-ranking based on signatures (Mosbah & Boucheham, 2014d),(Mosbah & Boucheham, 2013),(Mosbah & Boucheham, 2012a), MVRA (Mosbah & Boucheham, 2014a), (Mosbah & Boucheham, 2015a), Incremental-KNN (Mosbah & Boucheham, 2014b), region adaptation (Mosbah & Boucheham, 2015a), matching measure adaptation (Mosbah & Boucheham, 2017c), threshold adaptation (Mosbah & Boucheham, 2016a) and relevance feedback adaptatioimportancen (Mosbah & Boucheham, 2015b)yielding encouraging results and opening new perspectives for future extensions. Owing to the great of the matching process for building very effective CBIR system, we elaborated, in (Mosbah & Boucheham, 2017b), a comparative study of different matching measures in terms of effectiveness and efficiency.

Vue l’importance octroyée durant ces dernières décennies à l’image numérique, existante presque dans la plupart des secteurs de la vie contemporaine (secteur de l’éducation, juridique, médical, industriel, etc.), les systèmes de recherche et d’exploration des bases d’images ont pris de l’importance et gagné de l’intérêt auprès de beaucoup de chercheurs. La consultation de la littérature montre trois grands axes consacrés à la recherche de l’image: la recherche à base du texte (TBIR), la recherche à base du contenu visuel de l’image (CBIR) et la recherche à base d’ontologies. Chronologiquement, c’est la recherche à base du texte qui a été adoptée au départ. Cependant, cette approche montre des carences assez significatives inhérentes essentiellement au fossé sémantique caractérisant le TBIR. Ces problèmes sont essentiellement dus aux aspects de subjectivité et la difficulté de l’annotation des images. Ces entraves ont mené à l’émergence du paradigme du CBIR. Cette approche, se base sur les caractéristiques de l’image même pour dégager des techniques de recherche et d’appariement requête-images de la base. Autrement dit, cette technique prend en compte la spécificité du contenu visuel de chaque image requête, ainsi que celui de chaque image dans la base pour établir un rapprochement entre ces deux entités. Malheureusement même l’approche CBIR, héritant les caractéristiques des deux grands domaines de recherche à savoir : la recherche d’information et la vision automatique, souffre aussi du problème du fossé sémantique qui rend l’utilisateur non satisfait des résultats retournés. Plusieurs approches d’amélioration des performances des systèmes CBIR ont alors émergé. Entre autres: La fusion/combinaison de plusieurs descripteurs, la fusion/combinaison de plusieurs signatures, le reclassement des résultats et la sélection de la signature adéquate (sélection d’attributs). Cette thèse s’inscrit dans le cadre de l’amélioration des performances d'un système CBIR via le reclassement et l’adaptation. Nous avons exploré deux pistes de reclassement comme il a été rapporté dans (Mosbah & Boucheham, 2017a) : (1) reclassement à base de pseudo contrôle de pertinence en cherchant une corrélation entre les premières images retournées et (2) reclassement par l’exploitation de l’information de contrôle de pertinence. L’adaptation, quant à elle, est élaborée sur plusieurs aspects : la région, le seuil, la mesure d’appariement et la méthode de contrôle de pertinence. Les deux approches ont mené à des méthodes proposées : reclassement à base de signatures (Mosbah & Boucheham, 2014d), (Mosbah & Boucheham, 2013), (Mosbah & Boucheham, 2012a), algorithme de vote majoritaire (Mosbah & Boucheham, 2014a), (Mosbah & Boucheham, 2015a), KNN incrémental (Mosbah & Boucheham, 2014b), adaptation de région (Mosbah & Boucheham, 2014c), adaptation de mesure d’appariement (Mosbah & Boucheham, 2017c), adaptation du seuil (Mosbah & Boucheham, 2016a) et adaptation de méthode de contrôle de pertinence (Mosbah & Boucheham,2015b) donnant des résultats encourageants et ouvrant des perspectives d’extensions futures. Convaincus de l’importance du processus d’appariement au bon fonctionnement du système CBIR, nous avons élaboré, dans (Mosbah & Boucheham, 2017b) une étude comparative de différentes mesures d’appariement en termes de performance et de temps de réponse.

Distance Measures in the Context of Content Based Image Retrieval (CBIR)

Mesures de Distance dans le Contexte de la Recherche d'Images par le Contenu (CBIR)

Résumé

Mots clés

Domaines

Dates et versions

Identifiants

Citer

Exporter

Partager