login
english version rss feed
Detailed view PhD thesis
Université de Nantes (10/12/2010), Marc GELGON (Dir.)
Attached file list to this document: 
PDF
these-bruneau.pdf(14.2 MB)
Contributions en classification automatique : agregation bayesienne de melanges de lois et visualisation interactive
Pierrick Bruneau1, 2

Internet, ainsi que des architectures r´ecentes telles que les r´eseaux de capteurs, sont le si`ege de masses de sources de donn´ees distribu´ees `a large ´echelle, en perp´etuelle croissance. Cette profusion, accompagn´ee du besoin d'outillage des utilisateurs, implique le d´eveloppement de techniques d'analyse et d'indexation adapt´ees. Les techniques de classification automatique concernent la caract´erisation de classes dans un ensemble d'´el´ements. Celles-ci sont tr`es souvent employ´ees pour la r´ealisation d'outils rendant l'information accessible aux utilisateurs. Dans le cadre de cette th`ese, nous avons contribu´e `a l'agr´egation de mod`eles de m´elange de distributions de probabilit´e. Cette classe de mod`eles est en effet souvent utilis´ee pour des tˆaches de cat´egorisation. Nos propositions, utilisant un formalisme bay´esien variationnel, sont caract´eris´ees par des coˆuts de calcul et de transmission r´eduits. Avec ces travaux, nous entendions fournir une solution partielle `a l'estimation de mod`eles sur des donn´ees distribu´ees. Nous avons ´egalement contribu´e `a la classification visuelle de donn´ees en flux. Pour ce faire, nous avons notamment employ´e des principes bio-mim´etiques, ou encore des r´esultats de la th´eorie des graphes. Outre la proposition d'interfaces efficaces pour un utilisateur, nous avons ´egalement envisag´e la mani`ere dont celui-ci peut r´etro-agir sur le processus de classification.
1:  INRIA - ATLAS
2:  LINA - Laboratoire d'Informatique de Nantes Atlantique
classification – clustering – agr´egation – mod`eles de m´elange – classification visuelle – r´etro-action utilisateur – donn´ees distribu´ees – estimation bay´esienne

Contributions to categorization learning, mixture models aggregation and interactive visualization
The internet and recent architectures such as sensor networks are currently witnessing tremendous and continuously growing amounts of data, often distributed on large scales. Combined with user expectations with respect to tooling, this encourages developing adequate techniques for analyzing and indexing. Classification and clustering tasks are about characterizing classes within data collections. These are often used as building blocks for designing tools aimed at making data accessible to users. In this document, we describe our contributions to mixture models aggregation. These models are classically used for content categorization. Using variational Bayesian principles, we aimed at designing low computation and transmission costs algorithms. Doing so, we aimed at proposing a building block for distributed density model estimation. We also contributed to visual classification applied to data streams. To this purpose, we employed bio-mimetic principles, and results from graph theory. More specifically, visual and dynamic abstractions of an underlying clustering process were proposed. We strived to provide users with efficient interfaces, while allowing using their actions as a feedback.
classification – clustering – aggregation – mixture models – visual classification – user feedback – distributed data – Bayesian learning

all articles on CCSd database...
all articles on CCSd database...
all articles on CCSd database...
all articles on CCSd database...
all articles on CCSd database...