On the stability of document analysis algorithms : application to hybrid document hashing technologies

Résumé : Un nombre incalculable de documents est imprimé, numérisé, faxé, photographié chaque jour. Ces documents sont hybrides : ils existent sous forme papier et numérique. De plus les documents numériques peuvent être consultés et modifiés simultanément dans de nombreux endroits. Avec la disponibilité des logiciels d’édition d’image, il est devenu très facile de modifier ou de falsifier un document. Cela crée un besoin croissant pour un système d’authentification capable de traiter ces documents hybrides. Les solutions actuelles reposent sur des processus d’authentification séparés pour les documents papiers et numériques. D’autres solutions reposent sur une vérification visuelle et offrent seulement une sécurité partielle. Dans d’autres cas elles nécessitent que les documents sensibles soient stockés à l’extérieur des locaux de l’entreprise et un accès au réseau au moment de la vérification. Afin de surmonter tous ces problèmes, nous proposons de créer un algorithme de hachage sémantique pour les images de documents. Cet algorithme de hachage devrait fournir une signature compacte pour toutes les informations visuellement significatives contenues dans le document. Ce condensé permettra la création de systèmes de sécurité hybrides pour sécuriser tout le document. Ceci peut être réalisé grâce à des algorithmes d’analyse du document. Cependant ceux-ci ont besoin d’être porté à un niveau de performance sans précédent, en particulier leur fiabilité qui dépend de leur stabilité. Après avoir défini le contexte de l’étude et ce qu’est un algorithme stable, nous nous sommes attachés à produire des algorithmes stables pour la description de la mise en page, la segmentation d’un document, la reconnaissance de caractères et la description des zones graphiques.
Type de document :
Thèse
Data Structures and Algorithms [cs.DS]. Université de La Rochelle, 2016. English. 〈NNT : 2016LAROS019〉
Liste complète des métadonnées

Littérature citée [209 références]  Voir  Masquer  Télécharger

https://tel.archives-ouvertes.fr/tel-01661433
Contributeur : Abes Star <>
Soumis le : mardi 12 décembre 2017 - 00:02:08
Dernière modification le : jeudi 17 mai 2018 - 04:12:01

Fichier

2016Eskenazi94744.pdf
Version validée par le jury (STAR)

Identifiants

  • HAL Id : tel-01661433, version 1

Collections

Citation

Sébastien Eskenazi. On the stability of document analysis algorithms : application to hybrid document hashing technologies. Data Structures and Algorithms [cs.DS]. Université de La Rochelle, 2016. English. 〈NNT : 2016LAROS019〉. 〈tel-01661433〉

Partager

Métriques

Consultations de la notice

451

Téléchargements de fichiers

93