Adversarial attacks : a theoretical journey - TEL - Thèses en ligne Accéder directement au contenu
Thèse Année : 2022

Adversarial attacks : a theoretical journey

Attaques adverses : un point de vue théorique

Résumé

This thesis investigates the problem of classification in presence of adversarial attacks. Anadversarial attack is a small and humanly imperceptible perturbation of input designed tofool start-of-the-art machine learning classifiers. In particular, deep learning systems, usedin safety critical AI systems as self-driving cars are at stake with the eventuality of such attacks. What is even more striking is the ease to create such adversarial examples and the difficulty to defend against them while keeping a high level of accuracy. Robustness to adversarial perturbations is a still misunderstood field in academics. In this thesis, we aim at understanding better the nature of the adversarial attacks problem from a theoretical perspective.
Cette thèse étudie le problème de classification en présence d’attaques adverses. Une attaque adverse est une petite perturbation humainement imperceptible de l’entrée d’un algorithme, construite pour tromper les meilleurs classifieurs d’apprentissage automatique. En particulier, les réseaux de neurones profonds (« deep learning »), utilisés dans des systèmes critiques d’intelligence artificielle comme les voitures autonomes, présentent des risques considérables avec l’éventualité de telles attaques. Il est d’autant plus surprenant qu’il est très facile de créer des attaques adverses et qu’il est difficile de se défendre contre celles-ci en gardant un haut niveau de précision. La robustesse aux perturbations adverses est encore mal comprise par la communauté scientifique. Dans cette thèse, notre but est de comprendre mieux la nature de ce problème en adoptant un point de vue théorique.
Fichier principal
Vignette du fichier
2022UPSLD037.pdf (25.17 Mo) Télécharger le fichier
Origine : Version validée par le jury (STAR)

Dates et versions

tel-04056444 , version 1 (03-04-2023)

Identifiants

  • HAL Id : tel-04056444 , version 1

Citer

Laurent Meunier. Adversarial attacks : a theoretical journey. Operations Research [math.OC]. Université Paris sciences et lettres, 2022. English. ⟨NNT : 2022UPSLD037⟩. ⟨tel-04056444⟩
94 Consultations
7 Téléchargements

Partager

Gmail Facebook X LinkedIn More