Architectures massivement parallèles et vision artificielle bas-niveau

Résumé : Ce travail de thèse étudie l'apport à la vision bas-niveau des architectures de calcul massivement parallèles. Nous reprenons l'évolution récente de l'architecture des ordinateurs, en mettant en avant les solutions massivement parallèles qui se sont imposées récemment, les GPU. L'exploitation des potentialités de ces architectures impose une modification des méthodes de programmation. Nous montrons qu'il est possible d'utiliser un nombre restreint de schémas ("patterns") de calcul pour résoudre un grand nombre de problématiques de vision bas niveau. Nous présentons ensuite un nouveau modèle pour estimer la complexité de ces solutions. La suite du travail consiste à appliquer ces modèles de programmation à des problématiques de vision bas-niveau. Nous abordons d'abord le calcul du flot optique, qui est le champ de déplacement d'une image à une autre, et dont l'estimation est une brique de base de très nombreuses applications en traitement vidéo. Nous présentons un code sur GPU, nommé FOLKI qui permet d'atteindre une très bonne qualité de résultats sur séquences réelles pour un temps de calcul bien plus faible que les solutions concurrentes actuelles. Une application importante de ces travaux concerne la vélocimétrie par imagerie de particules dans le domaine de la mécanique des fluides expérimentale. La seconde problématique abordée est la super-résolution (SR). Nous proposons d'abord un algorithme très rapide de SR utilisant le flot optique FOLKI pour recaler les images. Ensuite différentes solutions à coût de calcul croissant sont développées, qui permettent une amélioration de précision et de robustesse. Nous présentons des résultats très originaux de SR sur des séquences affectées de mouvement complexes, comme des séquences de piétons ou des séquences aériennes de véhicules en mouvement. Enfin le dernier chapitre aborde rapidement des extensions en cours de nos travaux à des contextes de mesure 3D, dans des domaines comme la physique expérimentale ou la robotique.
Type de document :
Thèse
Vision par ordinateur et reconnaissance de formes [cs.CV]. Université Paris-Nord - Paris XIII, 2013. Français
Liste complète des métadonnées

Littérature citée [44 références]  Voir  Masquer  Télécharger

https://tel.archives-ouvertes.fr/tel-00820700
Contributeur : Aurélien Plyer <>
Soumis le : lundi 6 mai 2013 - 14:39:42
Dernière modification le : mercredi 13 décembre 2017 - 09:03:31
Document(s) archivé(s) le : lundi 19 août 2013 - 15:30:12

Fichier

Identifiants

  • HAL Id : tel-00820700, version 1

Collections

Citation

Aurélien Plyer. Architectures massivement parallèles et vision artificielle bas-niveau. Vision par ordinateur et reconnaissance de formes [cs.CV]. Université Paris-Nord - Paris XIII, 2013. Français. 〈tel-00820700〉

Partager

Métriques

Consultations de la notice

335

Téléchargements de fichiers

1394