The improvement of the Learning Environment in the context of Multi-label data - TEL - Thèses en ligne Accéder directement au contenu
Thèse Année : 2019

The improvement of the Learning Environment in the context of Multi-label data

Amélioration de l'environnement d'apprentissage dans le cadre de la classification multi-labels des données médicales

Résumé

Over the last few years, Multi-label Learning (MLL) has attracted the attention of a large community of researchers in many fields. Initially, it was applied for text categorization in which the annotation of a document that belongs to multiple categories require specific approaches. Thereafter, MLL is being increasingly required in other many real-world applications. In our work, we considered MLL for the medical aid diagnosis, our first research goal was the investigation of the advantages of using committee of learners to improve a Multilabel algorithm that adapts K-Nearest-Neighbors (KNN) to Multi-label problem called MLKNN using Bagging and Boosting. - Secondly, we gathered a medical Multi-label dataset that concerns Ambulatory Blood Pressure Monitoring (ABPM) which currently occupies a central place in the diagnosis and follow-up of hypertensive patients. We also proposed, an intelligent analysis of ABPM records using Multi-label Classification algorithms allowing the expert to analyze them more quickly and efficiently. In addition, it could help to investigate label dependencies and provide interesting insights. The satisfactory findings and interpretations of this work, conducted us to investigate more about the advantages of using Decision Trees (DT) to extract new and implicit correlations between different labels and features in a given dataset. For that, we reviewed recent works addressing Label dependencies based on several Multi-label algorithms based on DT. We presented also the main differences between the two defined types of Label correlation named Conditional and Unconditional (Marginal) Label dependence. Finally, we conducted a comparative study of six well-known algorithms in the literature, and we discussed the benefits of considering Label dependence using DT algorithm as a base classifier for both Transformation and Adaptation algorithms. Finally, potential further works and future directions of our thesis were highlighted.
Au cours des dernières années, l’apprentissage Multi-labels a attiré l’ attention d’une large communauté de chercheurs de plusieurs domaines. La catégorisation du texte était parmi les premières applications de ce type d’apprentissage dans laquelle un document peut être annoté par plusieurs labels à la fois. Par la suite, ce domaine de recherche a été étendu vers d’autres applications du monde réel. Dans notre thèse, nous nous sommes intéressés à l’ application de la Classification Multi-labels pour l’aide au diagnostic médical. Notre première piste de recherche a été consacrée à l’ étude des avantages de l’utilisation d’ un comité de modèles d’apprentissages à la place d’ un seul apprenant. L’ approche qui a été étudiée adapte l’algorithme du k-plus-proches-voisins au Multi-labels [1]. Deux stratégies de méthodes d’ Ensembles Homogènes ont été étudiées y compris le Bagging [2] et le Boosting [3]. La seconde contribution de notre travail concerne une collecte d’une nouvelle base de données médicale de la Mesure Ambulatoire de la Pression Artérielle (MAPA) [4], qui constitue un outil très puissant et largement sollicité par les cardiologues pour une meilleure prise en charge des patients hypertendus. Dans le même travail, nous avons proposé l’utilisation des méthodes Multi-labels pour une analyse automatique des données MAPA [5]. Une première étude de corrélation entre les six labels de cette base de données a été également réalisée et ce qui nous a permis de déduire l’importance d’étendre notre étude de dépendance de labels en utilisant des techniques plus spécialisées. La dernière partie de notre thèse a été consacrée à l’étude de ce concept en détails. Nous avons présenté une revue de la littérature des algorithmes étudiant également cette problématique, et nous avons appliqué six algorithmes Multi-labels issus des deux grandes familles de méthodes de Transformation et d’ Adaptation, basées sur les arbres de décision pour une meilleure interprétabilité des résultats. A la fin, les résultats retrouvés ont été discutés et plusieurs pistes de recherches pour le futur ont été proposées.
Fichier principal
Vignette du fichier
these_DOUIBI.pdf (30.84 Mo) Télécharger le fichier
Origine : Fichiers produits par l'(les) auteur(s)

Dates et versions

tel-03185694 , version 1 (30-03-2021)

Identifiants

  • HAL Id : tel-03185694 , version 1

Citer

Khalida Douibi, Nesma Settouti, Chikh Mohammed Amine, Jesse Read. The improvement of the Learning Environment in the context of Multi-label data. Machine Learning [cs.LG]. Université Abou Bekr Belkaid, Tlemcen (Algérie), 2019. English. ⟨NNT : ⟩. ⟨tel-03185694⟩
155 Consultations
19 Téléchargements

Partager

Gmail Facebook X LinkedIn More