Contextualisation, Visualisation et Evaluation en Apprentissage Non Supervisé

Résumé : Cette thèse se place dans le cadre de l'apprentissage non supervisé, qui consiste à former différents groupes à partir d'un ensemble de données, de telle manière que les données considérées comme les plus similaires soient associées au même groupe et qu'au contraire les données considérées comme différentes se retrouvent dans des groupes distincts, permettant ainsi d'extraire de la connaissance à partir de ces données. Nous proposons d'abord deux nouvelles méthodes qui prennent en compte le contexte dans lequel les groupes sont créés, c'est-à-dire le fait que les caractéristiques des différents groupes peuvent être définies sur différents sous-ensembles des attributs décrivant les données. Dans la mise en oeuvre de ces méthodes, nous avons également considéré les problématiques de la minimisation du nombre de connaissances a priori requises de la part de l'utilisateur et de la présentation des résultats sous forme compréhensible et visuelle. Nous présentons ensuite plusieurs extensions possibles de ces méthodes, dans le cadre de l'apprentissage supervisé puis face à des données semi-structurées représentées sous forme arborescente. Différentes expérimentations sur données artificielles puis sur données réelles sont présentées qui mettent en avant l'intérêt de ces méthodes. Le problème de l'évaluation des résultats produits par une méthode d'apprentissage non supervisé, et de la comparaison de telles méthodes, restant aujourd'hui un problème ouvert, nous proposons enfin une nouvelle méthode d'évaluation plus objective et quantitative que celles utilisées traditionnellement, et dont la pertinence est montrée expérimentalement.
Document type :
Theses
Complete list of metadatas

https://tel.archives-ouvertes.fr/tel-00617420
Contributor : Inria Mostrare <>
Submitted on : Monday, August 29, 2011 - 1:04:13 AM
Last modification on : Thursday, February 21, 2019 - 10:52:49 AM
Long-term archiving on : Wednesday, November 30, 2011 - 2:20:28 AM

Identifiers

  • HAL Id : tel-00617420, version 1

Citation

Laurent Candillier. Contextualisation, Visualisation et Evaluation en Apprentissage Non Supervisé. Autre [cs.OH]. Université Charles de Gaulle - Lille III, 2006. Français. ⟨tel-00617420⟩

Share

Metrics

Record views

692

Files downloads

1393