The improvement of the Learning Environment in the context of Multi-label data

Khalida Douibi; Nesma Settouti; Chikh Mohammed Amine; Jesse Read

Thèse Année : 2019

The improvement of the Learning Environment in the context of Multi-label data

Amélioration de l'environnement d'apprentissage dans le cadre de la classification multi-labels des données médicales

(1, 2) , (1) , (3) , (2)

1
2
3

Khalida Douibi

Fonction : Auteur

Laboratoire Génie BioMédical [Tlemcen]

Laboratoire d'informatique de l'École polytechnique [Palaiseau]

Nesma Settouti

Fonction : Collaborateur
PersonId : 1251071
IdHAL : nesma-settouti
ORCID : 0000-0003-0460-9713

Laboratoire Génie BioMédical [Tlemcen]

Chikh Mohammed Amine

Fonction : Directeur scientifique
PersonId : 1031967

Université Aboubekr Belkaid - University of Belkaïd Abou Bekr [Tlemcen]

Jesse Read

Fonction : Directeur scientifique
PersonId : 751910
IdHAL : jesse-read
ORCID : 0000-0002-1013-6724

Laboratoire d'informatique de l'École polytechnique [Palaiseau]

Résumé

Over the last few years, Multi-label Learning (MLL) has attracted the attention of a large community of researchers in many fields. Initially, it was applied for text categorization in which the annotation of a document that belongs to multiple categories require specific approaches. Thereafter, MLL is being increasingly required in other many real-world applications. In our work, we considered MLL for the medical aid diagnosis, our first research goal was the investigation of the advantages of using committee of learners to improve a Multilabel algorithm that adapts K-Nearest-Neighbors (KNN) to Multi-label problem called MLKNN using Bagging and Boosting. - Secondly, we gathered a medical Multi-label dataset that concerns Ambulatory Blood Pressure Monitoring (ABPM) which currently occupies a central place in the diagnosis and follow-up of hypertensive patients. We also proposed, an intelligent analysis of ABPM records using Multi-label Classification algorithms allowing the expert to analyze them more quickly and efficiently. In addition, it could help to investigate label dependencies and provide interesting insights. The satisfactory findings and interpretations of this work, conducted us to investigate more about the advantages of using Decision Trees (DT) to extract new and implicit correlations between different labels and features in a given dataset. For that, we reviewed recent works addressing Label dependencies based on several Multi-label algorithms based on DT. We presented also the main differences between the two defined types of Label correlation named Conditional and Unconditional (Marginal) Label dependence. Finally, we conducted a comparative study of six well-known algorithms in the literature, and we discussed the benefits of considering Label dependence using DT algorithm as a base classifier for both Transformation and Adaptation algorithms. Finally, potential further works and future directions of our thesis were highlighted.

Au cours des dernières années, l’apprentissage Multi-labels a attiré l’ attention d’une large communauté de chercheurs de plusieurs domaines. La catégorisation du texte était parmi les premières applications de ce type d’apprentissage dans laquelle un document peut être annoté par plusieurs labels à la fois. Par la suite, ce domaine de recherche a été étendu vers d’autres applications du monde réel. Dans notre thèse, nous nous sommes intéressés à l’ application de la Classification Multi-labels pour l’aide au diagnostic médical. Notre première piste de recherche a été consacrée à l’ étude des avantages de l’utilisation d’ un comité de modèles d’apprentissages à la place d’ un seul apprenant. L’ approche qui a été étudiée adapte l’algorithme du k-plus-proches-voisins au Multi-labels [1]. Deux stratégies de méthodes d’ Ensembles Homogènes ont été étudiées y compris le Bagging [2] et le Boosting [3]. La seconde contribution de notre travail concerne une collecte d’une nouvelle base de données médicale de la Mesure Ambulatoire de la Pression Artérielle (MAPA) [4], qui constitue un outil très puissant et largement sollicité par les cardiologues pour une meilleure prise en charge des patients hypertendus. Dans le même travail, nous avons proposé l’utilisation des méthodes Multi-labels pour une analyse automatique des données MAPA [5]. Une première étude de corrélation entre les six labels de cette base de données a été également réalisée et ce qui nous a permis de déduire l’importance d’étendre notre étude de dépendance de labels en utilisant des techniques plus spécialisées. La dernière partie de notre thèse a été consacrée à l’étude de ce concept en détails. Nous avons présenté une revue de la littérature des algorithmes étudiant également cette problématique, et nous avons appliqué six algorithmes Multi-labels issus des deux grandes familles de méthodes de Transformation et d’ Adaptation, basées sur les arbres de décision pour une meilleure interprétabilité des résultats. A la fin, les résultats retrouvés ont été discutés et plusieurs pistes de recherches pour le futur ont été proposées.

Mots clés

Multi-label Classification Label Correlation Transformation methods Adaptation algorithms Medical Dataset ABPM.

Classification Multi-labels Corrélation des labels méthodes de Transformation algorithmes d’ Adaptation Données Médicales MAPA

Domaines

Apprentissage [cs.LG] Base de données [cs.DB] Ingénierie biomédicale

Fichier principal

these_DOUIBI.pdf (30.84 Mo)

Origine : Fichiers produits par l'(les) auteur(s)

Khalida Douibi : Connectez-vous pour contacter le contributeur

https://hal.science/tel-03185694

Soumis le : mardi 30 mars 2021-15:05:42

Dernière modification le : jeudi 26 octobre 2023-16:23:14

Dates et versions

tel-03185694 , version 1 (30-03-2021)

Identifiants

HAL Id : tel-03185694 , version 1

Citer

Khalida Douibi, Nesma Settouti, Chikh Mohammed Amine, Jesse Read. The improvement of the Learning Environment in the context of Multi-label data. Machine Learning [cs.LG]. Université Abou Bekr Belkaid, Tlemcen (Algérie), 2019. English. ⟨NNT : ⟩. ⟨tel-03185694⟩

Exporter

BibTeX XML-TEI Dublin Core DC Terms EndNote DataCite

Collections

X CNRS LIX X-LIX X-DEP-INFO UNIV-PARIS-SACLAY

155 Consultations

19 Téléchargements

The improvement of the Learning Environment in the context of Multi-label data

Amélioration de l'environnement d'apprentissage dans le cadre de la classification multi-labels des données médicales

Résumé

Mots clés

Domaines

Dates et versions

Identifiants

Citer

Exporter

Collections

Partager