Skip to Main content Skip to Navigation
Theses

Représentations relationnelles et apprentissage interactif pour l'apprentissage efficace du comportement coopératif

Thibaut Munzer 1
1 Flowers - Flowing Epigenetic Robots and Systems
Inria Bordeaux - Sud-Ouest, U2IS - Unité d'Informatique et d'Ingénierie des Systèmes
Résumé : Cette thèse présente de nouvelles approches permettant l’apprentissage efficace et intuitif de plans de haut niveau pour les robots collaboratifs. Plus précisément, nous étudions l’application d’algorithmes d’apprentissage par démonstration dans des domaines relationnels. L’utilisation de domaines relationnels pour représenter le monde permet de simplifier la représentation de comportements concurrents et collaboratifs. Nous avons commencé par développer et étudier le premier algorithme d’apprentissage par renforcement inverse pour domaines relationnels. Nous avons ensuite présenté comment utiliser le formalisme RAP pour représenter des tâches collaboratives comprenant un robot et un opérateur humain. RAP est une extension des MDP relationnels qui permet de modéliser des activités concurrentes. Utiliser RAP nous a permis de représenter à la fois l’humain et le robot dans le même processus, mais également de modéliser des activités concurrentes du robot. Sous ce formalisme, nous avons montré qu’il était possible d’apprendre le comportement d’une équipe, à la fois comme une politique et une récompense. Si des connaissances a priori sur la tâche à réaliser sont disponibles, il est possible d’utiliser le même algorithme pour apprendre uniquement les préférences de l’opérateur. Cela permet de s’adapter à l’utilisateur. Nous avons montré que l’utilisation des représentations relationnelles permet d’apprendre des comportements collaboratifs à partir de peu de démonstrations.Ces comportements sont à la fois robustes au bruit, généralisables à de nouveaux états, et transférables à de nouveaux domaines (par exemple en ajoutant des objets). Nous avons également introduit une architecture d’apprentissage interactive qui permet au système de faire moins d’erreurs tout en demandant moins d’efforts à l’opérateur humain. Le robot, en estimant sa confiance dans ses décisions, est capable de demander des instructions quand il est incertain de l’activité à réaliser. Enfin, nous avons implémenté ces approches sur un robot et montré leurs impacts potentiels dans un scenario réaliste.
Document type :
Theses
Complete list of metadatas

Cited literature [77 references]  Display  Hide  Download

https://tel.archives-ouvertes.fr/tel-01526955
Contributor : Abes Star :  Contact
Submitted on : Tuesday, May 23, 2017 - 4:45:08 PM
Last modification on : Wednesday, July 3, 2019 - 10:48:04 AM
Document(s) archivé(s) le : Friday, August 25, 2017 - 12:45:27 AM

File

MUNZER_THIBAUT_2017.pdf
Version validated by the jury (STAR)

Identifiers

  • HAL Id : tel-01526955, version 1

Citation

Thibaut Munzer. Représentations relationnelles et apprentissage interactif pour l'apprentissage efficace du comportement coopératif. Autre [cs.OH]. Université de Bordeaux, 2017. Français. ⟨NNT : 2017BORD0574⟩. ⟨tel-01526955⟩

Share

Metrics

Record views

1100

Files downloads

307