Vers l’universalité des représentations visuelle et multimodales

Résumé : En raison de ses enjeux sociétaux, économiques et culturels, l’intelligence artificielle (dénotée IA) est aujourd’hui un sujet d’actualité très populaire. L’un de ses principaux objectifs est de développer des systèmes qui facilitent la vie quotidienne de l’homme, par le biais d’applications telles que les robots domestiques, les robots industriels, les véhicules autonomes et bien plus encore. La montée en popularité de l’IA est fortement due à l’émergence d’outils basés sur des réseaux de neurones profonds qui permettent d’apprendre simultanément, la représentation des données (qui était traditionnellement conçue à la main), et la tâche à résoudre (qui était traditionnellement apprise à l’aide de modèles d’apprentissage automatique). Ceci résulte de la conjonction des avancées théoriques, de la capacité de calcul croissante ainsi que de la disponibilité de nombreuses données annotées. Un objectif de longue date de l’IA est de concevoir des machines inspirées des humains, capables de percevoir le monde, d’interagir avec les humains, et tout ceci de manière évolutive (c’est `a dire en améliorant constamment la capacité de perception du monde et d’interaction avec les humains). Bien que l’IA soit un domaine beaucoup plus vaste, nous nous intéressons dans cette thèse, uniquement à l’IA basée apprentissage (qui est l’une des plus performante, à ce jour). Celle-ci consiste `a l’apprentissage d’un modèle qui une fois appris résoud une certaine tâche, et est généralement composée de deux sous-modules, l’un représentant la donnée (nommé ”représentation”) et l’autre prenant des décisions (nommé ”résolution de tâche”). Nous catégorisons, dans cette thèse, les travaux autour de l’IA, dans les deux approches d’apprentissage suivantes : (i) Spécialisation : apprendre des représentations à partir de quelques tâches spécifiques dans le but de pouvoir effectuer des tâches très spécifiques (spécialisées dans un certain domaine) avec un très bon niveau de performance; ii) Universalité : apprendre des représentations à partir de plusieurs tâches générales dans le but d’accomplir autant de tâches que possible dansdifférents contextes. Alors que la spécialisation a été largement explorée par la communauté de l’apprentissage profond, seules quelques tentatives implicites ont été réalisée vers la seconde catégorie, à savoir, l’universalité. Ainsi, le but de cette thèse est d’aborder explicitement le problème de l’amélioration de l’universalité des représentations avec des méthodes d’apprentissage profond, pour les données d’image et de texte. [...]
Type de document :
Thèse
Sciences de l'information et de la communication. Université Paris-Saclay, 2018. Français. 〈NNT : 2018SACLC038〉
Liste complète des métadonnées

Littérature citée [78 références]  Voir  Masquer  Télécharger

https://tel.archives-ouvertes.fr/tel-01828934
Contributeur : Abes Star <>
Soumis le : mardi 3 juillet 2018 - 15:42:06
Dernière modification le : mardi 2 octobre 2018 - 03:42:50
Document(s) archivé(s) le : lundi 1 octobre 2018 - 08:47:56

Fichier

77286_TAMAAZOUSTI_2018_archiva...
Version validée par le jury (STAR)

Identifiants

  • HAL Id : tel-01828934, version 1

Citation

Youssef Tamaazousti. Vers l’universalité des représentations visuelle et multimodales. Sciences de l'information et de la communication. Université Paris-Saclay, 2018. Français. 〈NNT : 2018SACLC038〉. 〈tel-01828934〉

Partager

Métriques

Consultations de la notice

877

Téléchargements de fichiers

294