Skip to Main content Skip to Navigation
Habilitation à diriger des recherches

Algorithmes, mots et textes aléatoires

Julien Clément 1
1 Equipe AMACC - Laboratoire GREYC - UMR6072
GREYC - Groupe de Recherche en Informatique, Image, Automatique et Instrumentation de Caen
Résumé : Dans ce mémoire, j'examine différents aspects d'un objet simple mais omniprésent en informatique: la séquence de symboles (appelée selon le contexte mot ou chaîne de caractères). La notion de mot est au carrefour de domaines comme la théorie de l'information et la théorie des langages. S'il est simple, il reste fondamental: nous n'avons, au plus bas niveau, que cela à disposition puisqu'il arrive toujours un moment où une donnée doit être encodée en symboles stockables en mémoire. La quantité d'information croissante de données mise à disposition et qu'on peut stocker, par exemple des génomes d'individus ou des documents numérisés, justifie que les algorithmes et les structures de données qui les manipulent soient optimisés. En conséquence, les besoins d'analyse se font sentir pour guider le choix et la conception des programmes qui manipulent ces données. L'analyse en moyenne est ici particulièrement adaptée puisque les données atteignent une variété et des volumes tellement importants que c'est le cas typique qui traduit le mieux la complexité et non pas le cas le pire. Cela évidemment pose le problème de la modélisation de données qui reste encore très épineux. En effet on souhaite deux choses contradictoires: un modèle au plus près des données, qui traduise vraiment leurs spécificités, mais aussi un modèle permettant de donner des résultats, c'est-à-dire de prédire les performances (et on comprend vite que le modèle doit donc rester relativement simple pour qu'il subsiste un espoir de le traiter!). Les méthodes sont le plus souvent celles de la combinatoire analytique et font appel à un objet mathématique, les séries génératrices, pour mener les analyses à bien.
Document type :
Habilitation à diriger des recherches
Complete list of metadatas

Cited literature [94 references]  Display  Hide  Download

https://tel.archives-ouvertes.fr/tel-00913127
Contributor : Julien Clément <>
Submitted on : Tuesday, December 3, 2013 - 11:44:37 AM
Last modification on : Tuesday, February 5, 2019 - 12:12:41 PM
Document(s) archivé(s) le : Monday, March 3, 2014 - 10:50:10 PM

Identifiers

  • HAL Id : tel-00913127, version 1

Citation

Julien Clément. Algorithmes, mots et textes aléatoires. Algorithme et structure de données [cs.DS]. Université de Caen, 2011. ⟨tel-00913127⟩

Share

Metrics

Record views

230

Files downloads

2248