Skip to Main content Skip to Navigation
Theses

Improving Latent Representations of ConvNets for Visual Understanding

Résumé : Depuis le début de la décennie, les réseaux de neurones convolutifs profonds pour le traitement d'images ont démontré leur capacité à produire d'excellent résultats. Pour cela, ces modèles transforment une image en une succession de représentations latentes. Dans cette thèse, nous travaillerons à l'amélioration de la qualité de ces représentations latentes. Dans un premier temps, nous travaillons à la régularisation de ces représentations pour les rendre plus robustes aux variations intra-classe et améliorer les performances de classification via une pénalité basée sur des métriques liées à la théorie de l'information. Dans un second temps, nous proposons de structurer l'information en deux sous-espaces latents complémentaires, résolvant un conflit entre l'invariance des représentations et la reconstruction. La structuration en deux espaces permet ainsi de relâcher la contrainte posée par les architectures classiques, permettant ainsi d'obtenir de meilleurs résultats en classification semi-supervisé. Enfin, nous nous intéressons au disentangling, c'est-à-dire la séparation de facteurs sémantiques indépendants. Nous poursuivons nos travaux de structuration des espaces latent et utilisons des coûts adverses pour assurer une séparation efficace de l'information. Cela permet d'améliorer la qualité des représentations ainsi que l'édition sémantique d'images.
Complete list of metadatas

Cited literature [191 references]  Display  Hide  Download

https://hal.archives-ouvertes.fr/tel-02309812
Contributor : Thomas Robert <>
Submitted on : Wednesday, October 9, 2019 - 4:00:26 PM
Last modification on : Monday, June 15, 2020 - 10:35:27 AM

File

These_ThomasRobert.pdf
Files produced by the author(s)

Identifiers

  • HAL Id : tel-02309812, version 1

Citation

Thomas Robert. Improving Latent Representations of ConvNets for Visual Understanding. Computer Vision and Pattern Recognition [cs.CV]. Sorbonne Université, 2019. English. ⟨tel-02309812⟩

Share

Metrics

Record views

365

Files downloads

730