Renforcements naturels pour la collaboration homme-machine

Résumé : Nous modélisons une chaîne de traitement de documents comme un processus de décision markovien, et nous utilisons l’apprentissage par renforcement afin de permettre à l’agent d’apprendre à construire des chaînes adaptées à la volée, et de les améliorer en continu. Nous construisons une plateforme qui nous permet de mesurer l’impact sur l’apprentissage de divers modèles, services web, algorithmes, paramètres, etc. Nous l’appliquons dans un contexte industriel, spécifiquement à une chaîne visant à extraire des événements dans des volumes massifs de documents provenant de pages web et d’autres sources ouvertes. Nous visons à réduire la charge des analystes humains, l’agent apprenant à améliorer la chaîne, guidé par leurs retours (feedback) sur les événements extraits. Pour ceci, nous explorons des types de retours différents, d’un feedback numérique requérant un important calibrage, à un feedback qualitatif, beaucoup plus intuitif et demandant peu, voire pas du tout, de calibrage. Nous menons des expériences, d’abord avec un feedback numérique, puis nous montrons qu’un feedback qualitatif permet toujours à l’agent d’apprendre efficacement.
Type de document :
Thèse
Human-Computer Interaction [cs.HC]. Normandie Université, 2017. English. 〈NNT : 2017NORMC206〉
Liste complète des métadonnées

Littérature citée [135 références]  Voir  Masquer  Télécharger

https://tel.archives-ouvertes.fr/tel-01517109
Contributeur : Abes Star <>
Soumis le : mardi 2 mai 2017 - 16:41:08
Dernière modification le : mardi 5 juin 2018 - 10:14:13
Document(s) archivé(s) le : jeudi 3 août 2017 - 13:32:59

Fichier

2017-NICART-ESTHER-VO.pdf
Version validée par le jury (STAR)

Identifiants

  • HAL Id : tel-01517109, version 1

Citation

Esther Nicart. Renforcements naturels pour la collaboration homme-machine. Human-Computer Interaction [cs.HC]. Normandie Université, 2017. English. 〈NNT : 2017NORMC206〉. 〈tel-01517109〉

Partager

Métriques

Consultations de la notice

434

Téléchargements de fichiers

267