Skip to Main content Skip to Navigation
Theses

Algorithmes de traitement de flux XML : masses de données, mémoire externe et performances extensibles

Résumé : Plusieurs applications modernes nécessitent un traitement de flux massifs de données XML, cela crée de défis techniques. Parmi ces derniers, il y a la conception et la mise en ouvre d'outils pour optimiser le traitement des requêtes XPath et fournir une estimation précise des coûts de ces requêtes traitées sur un flux massif de données XML. Dans cette thèse, nous proposons un nouveau modèle de prédiction de performance qui estime a priori le coût (en termes d'espace utilisé et de temps écoulé) pour les requêtes structurelles de Forward XPath. Ce faisant, nous réalisons une étude expérimentale pour confirmer la relation linéaire entre le traitement de flux, et les ressources d'accès aux données. Par conséquent, nous présentons un modèle mathématique (fonctions de régression linéaire) pour prévoir le coût d'une requête XPath donnée. En outre, nous présentons une technique nouvelle d'estimation de sélectivité. Elle se compose de deux éléments. Le premier est le résumé path tree: une présentation concise et précise de la structure d'un document XML. Le second est l'algorithme d'estimation de sélectivité: un algorithme efficace de flux pour traverser le synopsis path tree pour estimer les valeurs des paramètres de coût. Ces paramètres sont utilisés par le modèle mathématique pour déterminer le coût d'une requête XPath donnée. Nous comparons les performances de notre modèle avec les approches existantes. De plus, nous présentons un cas d'utilisation d'un système en ligne appelé "online stream-querying system". Le système utilise notre modèle de prédiction de performance pour estimer le coût (en termes de temps / mémoire) d'une requête XPath donnée. En outre, il fournit une réponse précise à l'auteur de la requête. Ce cas d'utilisation illustre les avantages pratiques de gestion de performance avec nos techniques
Document type :
Theses
Complete list of metadatas

Cited literature [83 references]  Display  Hide  Download

https://tel.archives-ouvertes.fr/tel-00779309
Contributor : Abes Star :  Contact
Submitted on : Tuesday, January 22, 2013 - 9:02:10 AM
Last modification on : Wednesday, September 4, 2019 - 1:52:06 PM
Document(s) archivé(s) le : Saturday, April 1, 2017 - 8:07:02 AM

File

TH2011PEST1002_complete.pdf
Version validated by the jury (STAR)

Identifiers

  • HAL Id : tel-00779309, version 1

Collections

Citation

Muath Alrammal. Algorithmes de traitement de flux XML : masses de données, mémoire externe et performances extensibles. Other [cs.OH]. Université Paris-Est, 2011. English. ⟨NNT : 2011PEST1002⟩. ⟨tel-00779309⟩

Share

Metrics

Record views

647

Files downloads

362