Learning methods for multi-label classification - TEL - Thèses en ligne Accéder directement au contenu
Thèse Année : 2013

Learning methods for multi-label classification

Méthodes d’apprentissage pour la classification multi-label

Résumé

Multi-label classification is an extension of traditional single-label classification, where classes are not mutually exclusive, and each example can be assigned to several classes simultaneously. It is encountered in various modern applications such as scene classification and video annotation. The main objective of this thesis is the development of new techniques to address the problem of multi-label classification. The first part of this manuscript studies the problem of multi-label classification in the context of the theory of belief functions. We propose a multi-label learning method that is able to take into account relationships between labels and to classify new instances using the formalism of uncertainty representation for set-valued variables. The second part deals with the problem of prototype selection in the framework of multi-label learning. We propose an editing algorithm based on the k-nearest neighbors rule in order to purify training datasets and improve the performances of multi-label classification algorithms. Experimental results on synthetic and real-world datasets show the effectiveness of our approaches.
La classification multi-label est une extension de la classification traditionnelle dans laquelle les classes ne sont pas mutuellement exclusives, chaque individu pouvant appartenir à plusieurs classes simultanément. Ce type de classification est requis par un grand nombre d’applications actuelles telles que la classification d’images et l’annotation de vidéos. Le principal objectif de cette thèse est la proposition de nouvelles méthodes pour répondre au problème de classification multi-label. La première partie de cette thèse s’intéresse au problème d’apprentissage multi-label dans le cadre des fonctions de croyance. Nous développons une méthode capable de tenir compte des corrélations entre les différentes classes et de classer les individus en utilisant le formalisme de représentation de l’incertitude pour les variables multi-valuées. La deuxième partie aborde le problème de l’édition des bases d’apprentissage pour la classification multi-label. Nous proposons un algorithme basé sur l’approche des k-plus proches voisins qui permet de détecter les exemples erronés dans l’ensemble d’apprentissage. Des expérimentations menées sur des jeux de données synthétiques et réelles montrent l’intérêt des approches étudiées.
Fichier principal
Vignette du fichier
thesis_UTC.pdf (1.81 Mo) Télécharger le fichier
Loading...

Dates et versions

tel-01435796 , version 1 (15-01-2017)

Identifiants

  • HAL Id : tel-01435796 , version 1

Citer

Sawsan Kanj. Learning methods for multi-label classification . Machine Learning [stat.ML]. Université de technologie de Compiègne; Université Libanaise (Liban), 2013. English. ⟨NNT : ⟩. ⟨tel-01435796⟩
399 Consultations
1834 Téléchargements

Partager

Gmail Facebook X LinkedIn More