Skip to Main content Skip to Navigation
Theses

Plug-in methods in classification

Résumé : Ce manuscrit étudie plusieurs problèmes de classification sous contraintes. Dans ce cadre de classification, notre objectif est de construire un algorithme qui a des performances aussi bonnes que la meilleure règle de classification ayant une propriété souhaitée. Fait intéressant, les méthodes de classification de type plug-in sont bien appropriées à cet effet. De plus, il est montré que, dans plusieurs configurations, ces règles de classification peuvent exploiter des données non étiquetées, c'est-à-dire qu'elles sont construites de manière semi-supervisée. Le Chapitre 1 décrit deux cas particuliers de la classification binaire - la classification où la mesure de performance est reliée au F-score, et la classification équitable. A ces deux problèmes, des procédures semi-supervisées sont proposées. En particulier, dans le cas du F-score, il s'avère que cette méthode est optimale au sens minimax sur une classe usuelle de distributions non-paramétriques. Aussi, dans le cas de la classification équitable, la méthode proposée est consistante en terme de risque de classification, tout en satisfaisant asymptotiquement la contrainte d’égalité des chances. De plus, la procédure proposée dans ce cadre d'étude surpasse en pratique les algorithmes de pointe. Le Chapitre 3 décrit le cadre de la classification multi-classes par le biais d'ensembles de confiance. Là encore, une procédure semi-supervisée est proposée et son optimalité presque minimax est établie. Il est en outre établi qu'aucun algorithme supervisé ne peut atteindre une vitesse de convergence dite rapide. Le Chapitre 4 décrit un cas de classification multi-labels dans lequel on cherche à minimiser le taux de faux-négatifs sous réserve de contraintes de type presque sûres sur les règles de classification. Dans cette partie, deux contraintes spécifiques sont prises en compte: les classifieurs parcimonieux et ceux soumis à un contrôle des erreurs négatives à tort. Pour les premiers, un algorithme supervisé est fourni et il est montré que cet algorithme peut atteindre une vitesse de convergence rapide. Enfin, pour la seconde famille, il est montré que des hypothèses supplémentaires sont nécessaires pour obtenir des garanties théoriques sur le risque de classification
Document type :
Theses
Complete list of metadatas

Cited literature [164 references]  Display  Hide  Download

https://tel.archives-ouvertes.fr/tel-02400552
Contributor : Abes Star :  Contact
Submitted on : Monday, December 9, 2019 - 3:27:08 PM
Last modification on : Thursday, March 19, 2020 - 12:26:03 PM
Document(s) archivé(s) le : Tuesday, March 10, 2020 - 9:08:59 PM

File

TH2019PESC2027.pdf
Version validated by the jury (STAR)

Identifiers

  • HAL Id : tel-02400552, version 1

Collections

Citation

Evgenii Chzhen. Plug-in methods in classification. Optimization and Control [math.OC]. Université Paris-Est, 2019. English. ⟨NNT : 2019PESC2027⟩. ⟨tel-02400552⟩

Share

Metrics

Record views

216

Files downloads

285