Ensemble multi-label learning in supervised and semi-supervised settings

Résumé : L'apprentissage multi-label est un problème d'apprentissage supervisé où chaque instance peut être associée à plusieurs labels cibles simultanément. Il est omniprésent dans l'apprentissage automatique et apparaît naturellement dans de nombreuses applications du monde réel telles que la classification de documents, l'étiquetage automatique de musique et l'annotation d'images. Nous discutons d'abord pourquoi les algorithmes multi-label de l'etat-de-l'art utilisant un comité de modèle souffrent de certains inconvénients pratiques. Nous proposons ensuite une nouvelle stratégie pour construire et agréger les modèles ensemblistes multi-label basés sur k-labels. Nous analysons ensuite en profondeur l'effet de l'étape d'agrégation au sein des approches ensemblistes multi-label et étudions comment cette agrégation influece les performances de prédictive du modèle enfocntion de la nature de fonction cout à optimiser. Nous abordons ensuite le problème spécifique de la selection de variables dans le contexte multi-label en se basant sur le paradigme ensembliste. Trois méthodes de sélection de caractéristiques multi-label basées sur le paradigme des forêts aléatoires sont proposées. Ces méthodes diffèrent dans la façon dont elles considèrent la dépendance entre les labels dans le processus de sélection des varibales. Enfin, nous étendons les problèmes de classification et de sélection de variables au cadre d'apprentissage semi-supervisé. Nous proposons une nouvelle approche de sélection de variables multi-label semi-supervisée basée sur le paradigme de l'ensemble. Le modèle proposé associe des principes issues de la co-training en conjonction avec une métrique interne d'évaluation d'importnance des varaibles basée sur les out-of-bag. Testés de manière satisfaisante sur plusieurs données de référence, les approches développées dans cette thèse sont prometteuses pour une variété d'ap-plications dans l'apprentissage multi-label supervisé et semi-supervisé. Testés de manière satisfaisante sur plusieurs jeux de données de référence, les approches développées dans cette thèse affichent des résultats prometteurs pour une variété domaine d'applications de l'apprentissage multi-label supervisé et semi-supervisé
Type de document :
Thèse
Artificial Intelligence [cs.AI]. Université de Lyon, 2017. English. 〈NNT : 2017LYSE1333〉
Liste complète des métadonnées

https://tel.archives-ouvertes.fr/tel-01736344
Contributeur : Abes Star <>
Soumis le : vendredi 16 mars 2018 - 17:59:07
Dernière modification le : jeudi 19 avril 2018 - 14:38:03

Fichier

TH2017GHARROUDIOUADIE.pdf
Version validée par le jury (STAR)

Identifiants

  • HAL Id : tel-01736344, version 1

Citation

Ouadie Gharroudi. Ensemble multi-label learning in supervised and semi-supervised settings. Artificial Intelligence [cs.AI]. Université de Lyon, 2017. English. 〈NNT : 2017LYSE1333〉. 〈tel-01736344〉

Partager

Métriques

Consultations de la notice

356

Téléchargements de fichiers

34