Skip to Main content Skip to Navigation
Theses

Self-Exploration of Sensorimotor Spaces in Robots

Fabien Benureau 1
1 Flowers - Flowing Epigenetic Robots and Systems
Inria Bordeaux - Sud-Ouest, U2IS - Unité d'Informatique et d'Ingénierie des Systèmes
Résumé : La robotique développementale a entrepris, au courant des quinze dernières années, d'étudier les processus dévelopmentaux, similaires à ceux des systèmes biologiques, chez les robots. Le but est de créer des robots qui ont une enfance---qui rampent avant d'essayer de courir, qui jouent avant de travailler---et qui basent leurs décisions sur l'expérience de toute une vie, incarnés dans le monde réel. Dans ce contexte, cette thèse étudie l'exploration sensorimotrice---la découverte pour un robot de son propre corps et de son environnement proche---pendant les premiers stage du développement, lorsque qu'aucune expérience préalable du monde n'est disponible. Plus spécifiquement, cette thèse se penche sur comment générer une diversité d'effets dans un environnement inconnu. Cette approche se distingue par son absence de fonction de récompense ou de fitness définie par un expert, la rendant particulièrement apte à être intégrée sur des robots auto-suffisants. Dans une première partie, l'approche est motivée et le problème de l'exploration est formalisé, avec la définition de mesures quantitatives pour évaluer le comportement des algorithmes et d'un cadre architectural pour la création de ces derniers. Via l'examen détaillé de l'exemple d'un bras robot à multiple degrés de liberté, la thèse explore quelques unes des problématiques fondamentales que l'exploration sensorimotrice pose, comme la haute dimensionalité et la redondance sensorimotrice. Cela est fait en particulier via la comparaison entre deux stratégies d'exploration: le babillage moteur et le babillage dirigé par les objectifs. Plusieurs algorithmes sont proposés tour à tour et leur comportement est évalué empiriquement, étudiant les interactions qui naissent avec les contraintes développementales, les démonstrations externes et les synergies motrices. De plus, parce que même des algorithmes efficaces peuvent se révéler terriblement inefficaces lorsque leurs capacités d'apprentissage ne sont pas adaptés aux caractéristiques de leur environnement, une architecture est proposée qui peut dynamiquement choisir la stratégie d'exploration la plus adaptée parmi un ensemble de stratégies. Mais même avec de bons algorithmes, l'exploration sensorimotrice reste une entreprise coûteuse---un problème important, étant donné que les robots font face à des contraintes fortes sur la quantité de données qu'ils peuvent extraire de leur environnement; chaque observation prenant un temps non-négligeable à récupérer. Dans une deuxième partie, l'algorithme reuse est proposé. Il permet d'exploiter dans un nouvel environnement inconnu les trajectoires d'explorations établies dans un précédent environnement. L'objectif est d'améliorer l'exploration du nouvel environnement, avec l'unique contrainte que les deux environnements doivent partager le même espace moteur---ce qui est souvent le cas, étant donné que le corps d'un robot a tendance à rester similaire lors du passage d'une environnement à un autre. Aucune supposition contraignante n'est faite sur les espaces sensoriels des deux environnements, qui peuvent différer arbitrairement ; il en va de même pour les stratégies d'exploration et les algorithmes d'apprentissage. Si les dynamiques latentes des deux environnements sont similaires, l'algorithme reuse peut apporter une amélioration de l'exploration. Ceci est illustré sur un robot réel, qui interagit avec différents objets en réalité augmentée. Une expérience permet ensuite de montrer que l'algorithme reuse peut démontrer une capacité à permettre l'acquisition de savoir-faire complexes, se reposant sur des savoir-faire plus simples. Cela permet de guider l'acquisition de savoir-faire en manipulant exclusivement l'environnement dans lequel le robot est plongé, sans avoir besoin de créer une fonction de récompense ou de fitness. De plus, des expériences sont conduites qui montrent que l'exploration dans le monde réel peut bénéficier de la réutilisation de trajectoires d'exploration obtenues en simulation, même si celles-ci sont simplifiées de manière importante. À travers cette thèse, les contributions les plus importantes sont les descriptions algorithmiques et les résultats expérimentaux. De manière à permettre la reproduction et la réexamination sans contrainte de tous les résultats, l'ensemble du code est mis à disposition. L'exploration sensorimotrice est un mécanisme fondamental du développement des systèmes biologiques. La séparer délibérément des mécanismes d'apprentissage et l'étudier pour elle-même dans cette thèse permet d'éclairer des problèmes importants que les robots se développant seuls seront amenés à affronter.
Document type :
Theses
Complete list of metadatas

https://hal.archives-ouvertes.fr/tel-01251324
Contributor : Fabien C. Y. Benureau <>
Submitted on : Thursday, January 14, 2016 - 4:04:29 PM
Last modification on : Wednesday, November 6, 2019 - 12:00:05 PM
Document(s) archivé(s) le : Friday, April 15, 2016 - 4:40:22 PM

Identifiers

  • HAL Id : tel-01251324, version 1

Collections

Citation

Fabien Benureau. Self-Exploration of Sensorimotor Spaces in Robots. Robotics [cs.RO]. Université de Bordeaux, 2015. English. ⟨tel-01251324v1⟩

Share

Metrics

Record views

160

Files downloads

63