Action Model Learning for Socio-Communicative Human Robot Interaction

Ankuj Arora 1
1 LIG Laboratoire d'Informatique de Grenoble - ADELE
LIG - Laboratoire d'Informatique de Grenoble
Résumé : Conduite dans le but de rendre les robots comme socio-communicatifs, les chercheurs ont cherché à mettre au point des robots dotés de compétences sociales et de «bon sens» pour les rendre acceptables. Cette intelligence sociale ou «sens commun» du robot est ce qui finit par déterminer son acceptabilité sociale à long terme.Cependant, ce n'est pas commun. Les robots peuvent donc seulement apprendre à être acceptables avec l'expérience. Cependant, en enseignant à un humanoïde, les subtilités d'une interaction sociale ne sont pas évidentes. Même un échange de dialogue standard intègre le panel le plus large possible de signes qui interviennent dans la communication et sont difficiles à codifier (synchronisation entre l'expression du corps, le visage, le ton de la voix, etc.). Dans un tel scénario, l'apprentissage du modèle comportemental du robot est une approche prometteuse. Cet apprentissage peut être réalisé avec l'aide de techniques d'IA. Cette étude tente de résoudre le problème de l'apprentissage des modèles comportementaux du robot dans le paradigme automatisé de planification et d'ordonnancement (APS) de l'IA. Dans le domaine de la planification automatisée et de l'ordonnancement (APS), les agents intelligents nécessitent un modèle d'action (plans d'actions dont les exécutions entrelacées effectuent des transitions de l'état système) afin de planifier et résoudre des problèmes réels. Au cours de cette thèse, nous présentons deux nouveaux systèmes d'apprentissage qui facilitent l'apprentissage des modèles d'action et élargissent la portée de ces nouveaux systèmes pour apprendre les modèles de comportement du robot. Ces techniques peuvent être classées dans les catégories non optimale et optimale. Les techniques non optimales sont plus classiques dans le domaine, ont été traitées depuis des années et sont de nature symbolique. Cependant, ils ont leur part de quirks, ce qui entraîne un taux d'apprentissage moins élevé que souhaité. Les techniques optimales sont basées sur les progrès récents dans l'apprentissage en profondeur, en particulier la famille à long terme (LSTM) de réseaux récurrents récurrents. Ces techniques sont de plus en plus séduisantes par la vertu et produisent également des taux d'apprentissage plus élevés. Cette étude met en vedette ces deux techniques susmentionnées qui sont testées sur des repères d'IA pour évaluer leurs prouesses. Ils sont ensuite appliqués aux traces HRI pour estimer la qualité du modèle de comportement du robot savant. Ceci est dans l'intérêt d'un objectif à long terme d'introduire l'autonomie comportementale dans les robots, afin qu'ils puissent communiquer de manière autonome avec les humains sans avoir besoin d'une intervention de «magicien».
Type de document :
Thèse
Artificial Intelligence [cs.AI]. Université Grenoble Alpes, 2017. English. 〈NNT : 2017GREAM081〉
Liste complète des métadonnées

Littérature citée [20 références]  Voir  Masquer  Télécharger

https://tel.archives-ouvertes.fr/tel-01876157
Contributeur : Abes Star <>
Soumis le : mardi 18 septembre 2018 - 11:10:07
Dernière modification le : jeudi 11 octobre 2018 - 08:48:03

Fichier

ARORA_2017_archivage.pdf
Version validée par le jury (STAR)

Identifiants

  • HAL Id : tel-01876157, version 1

Collections

Citation

Ankuj Arora. Action Model Learning for Socio-Communicative Human Robot Interaction. Artificial Intelligence [cs.AI]. Université Grenoble Alpes, 2017. English. 〈NNT : 2017GREAM081〉. 〈tel-01876157〉

Partager

Métriques

Consultations de la notice

102

Téléchargements de fichiers

70