s'authentifier
version française rss feed
Fiche détaillée HDR
Université Charles de Gaulle - Lille III (23/11/2006), Sophie Tison (Pr.)
Liste des fichiers attachés à ce document : 
PDF
main.pdf(2.8 MB)
Structures arborescentes et apprentissage automatique
Marc Tommasi1, 2

Le programme de recherches présenté dans cette synthèse s'inscrit dans la double problématique de l'étude des langages d'arbres et de l'apprentissage automatique à partir de données arborescentes.
À la base de ce travail se trouve la question de l'accès et de la manipulation automatique d'informations au format XML au sein d'un réseau d'applications réparties dans internet. La réalisation de ces applications est toujours du ressort de programmeurs spécialistes d'XML et reste hors de portée de l'utilisateur final. De plus, les développements récents d'internet poursuivent l'objectif d'automatiser les communications entre applications s'échangeant des flux de données XML. Le recours à des techniques d'apprentissage automatique est une réponse possible à cette situation.
Nous considèrons que les informations sont décrites dans un langage XML, et dans la perspective de ce mémoire, embarquées dans des données structurées sous forme arborescente. Les applications sont basées alors sur des opérations élémentaires que sont l'interrogation ou les requêtes dans ces documents arborescents ou encore la transformation de tels documents.
Nous abordons alors la question sous l'angle de la réalisation automatique de programmes d'annotation d'arbres, permettant de dériver des procédures de transformation ou d'exécution de requêtes. Le mémoire décrit les contributions apportées pour la manipulation et l'apprentissage d'ensembles d'arbres d'arité non bornée (comme le sont les arbres XML), et l'annotation par des méthodes de classification supervisée ou d'inférence statistique.
1 :  LIFL - Laboratoire d'Informatique Fondamentale de Lille
2 :  LIFL - GRAPPA
Grappa, Mostrare
Langages d'arbres – automates d'arbres – apprentissage automatique – XML – champs aléatoires – classification supervisée – extraction d'information

Tree Structures and Machine Learning
Trees – terms – tree automata – machine learning – XML – conditional random fields – supervised learning – classification – information extraction

tous les articles de la base du CCSd...
tous les articles de la base du CCSd...
tous les articles de la base du CCSd...