Adversarial attacks : a theoretical journey

Laurent Meunier

Thèse Année : 2022

Adversarial attacks : a theoretical journey

Attaques adverses : un point de vue théorique

(1)

Laurent Meunier

Fonction : Auteur
PersonId : 1244072
IdRef : 268875650

Laboratoire d'analyse et modélisation de systèmes pour l'aide à la décision

Résumé

This thesis investigates the problem of classification in presence of adversarial attacks. Anadversarial attack is a small and humanly imperceptible perturbation of input designed tofool start-of-the-art machine learning classifiers. In particular, deep learning systems, usedin safety critical AI systems as self-driving cars are at stake with the eventuality of such attacks. What is even more striking is the ease to create such adversarial examples and the difficulty to defend against them while keeping a high level of accuracy. Robustness to adversarial perturbations is a still misunderstood field in academics. In this thesis, we aim at understanding better the nature of the adversarial attacks problem from a theoretical perspective.

Cette thèse étudie le problème de classification en présence d’attaques adverses. Une attaque adverse est une petite perturbation humainement imperceptible de l’entrée d’un algorithme, construite pour tromper les meilleurs classifieurs d’apprentissage automatique. En particulier, les réseaux de neurones profonds (« deep learning »), utilisés dans des systèmes critiques d’intelligence artificielle comme les voitures autonomes, présentent des risques considérables avec l’éventualité de telles attaques. Il est d’autant plus surprenant qu’il est très facile de créer des attaques adverses et qu’il est difficile de se défendre contre celles-ci en gardant un haut niveau de précision. La robustesse aux perturbations adverses est encore mal comprise par la communauté scientifique. Dans cette thèse, notre but est de comprendre mieux la nature de ce problème en adoptant un point de vue théorique.

Mots clés

Machine Learning Adversarial Attacks Robustness Optimal Transport Game Theory Dynamical Systems

Apprentissage automatique Attaques adverses Robustesse Transport Optimal Théorie des Jeux Systèmes Dynamiques

Domaines

Recherche opérationnelle [math.OC]

Fichier principal

2022UPSLD037.pdf (25.17 Mo)

Origine : Version validée par le jury (STAR)

ABES STAR : Contact

https://theses.hal.science/tel-04056444

Soumis le : lundi 3 avril 2023-14:58:14

Dernière modification le : samedi 20 avril 2024-03:15:25

Dates et versions

tel-04056444 , version 1 (03-04-2023)

Identifiants

HAL Id : tel-04056444 , version 1

Citer

Laurent Meunier. Adversarial attacks : a theoretical journey. Operations Research [math.OC]. Université Paris sciences et lettres, 2022. English. ⟨NNT : 2022UPSLD037⟩. ⟨tel-04056444⟩

Exporter

BibTeX XML-TEI Dublin Core DC Terms EndNote DataCite

Collections

CNRS UNIV-DAUPHINE STAR LAMSADE-DAUPHINE TDS-MACS PSL

94 Consultations

7 Téléchargements

Adversarial attacks : a theoretical journey

Attaques adverses : un point de vue théorique

Résumé

Mots clés

Domaines

Dates et versions

Identifiants

Citer

Exporter

Collections

Partager