Apprentissage de représentation et auto-organisation modulaire pour un agent autonome

Bruno Scherrer 1
1 MAIA - Autonomous intelligent machine
INRIA Lorraine, LORIA - Laboratoire Lorrain de Recherche en Informatique et ses Applications
Résumé : Cette thèse étudie l'utilisation d'algorithmes connexionnistes pour résoudre des problèmes d'apprentissage par renforcement. Les algorithmes connexionnistes sont inspirés de la manière dont le cerveau traite l'information : ils impliquent un grand nombre d'unités simples fortement interconnectées, manipulant des informations numériques de manière distribuée et massivement parallèle. L'apprentissage par renforcement est une théorie computationnelle qui permet de décrire l'interaction entre un agent et un environnement : elle permet de formaliser précisément le problème consistant à atteindre un certain nombre de buts via l'interaction.

Nous avons considéré trois problèmes de complexité croissante et montré qu'ils admettaient des solutions algorithmiques connexionnistes : 1) L'apprentissage par renforcement dans un petit espace d'états : nous nous appuyons sur un algorithme de la littérature pour construire un réseau connexionniste ; les paramètres du problème sont stockés par les poids des unités et des connexions et le calcul du plan est le résultat d'une activité distribuée dans le réseau. 2) L'apprentissage d'une représentation pour approximer un problème d'apprentissage par renforcement ayant un grand espace d'états : nous automatisons le procédé consistant à construire une partition de l'espace d'états pour approximer un problème de grande taille. 3) L'auto-organisation en modules spécialisés pour approximer plusieurs problèmes d'apprentissage par renforcement ayant un grand espace d'états : nous proposons d'exploiter le principe "diviser pour régner" et montrons comment plusieurs tâches peuvent être réparties efficacement sur un petit nombre de modules fonctionnels spécialisés.
Type de document :
Thèse
Interface homme-machine [cs.HC]. Université Henri Poincaré - Nancy I, 2003. Français. 〈NNT : 2003NAN10018〉
Liste complète des métadonnées

https://tel.archives-ouvertes.fr/tel-00003377
Contributeur : Bruno Scherrer <>
Soumis le : mardi 16 septembre 2003 - 12:13:34
Dernière modification le : lundi 16 avril 2018 - 10:42:02
Document(s) archivé(s) le : mercredi 12 septembre 2012 - 10:30:39

Identifiants

  • HAL Id : tel-00003377, version 1

Citation

Bruno Scherrer. Apprentissage de représentation et auto-organisation modulaire pour un agent autonome. Interface homme-machine [cs.HC]. Université Henri Poincaré - Nancy I, 2003. Français. 〈NNT : 2003NAN10018〉. 〈tel-00003377〉

Partager

Métriques

Consultations de la notice

541

Téléchargements de fichiers

413