Managing large-scale, distributed systems research experiments with control-flows

Tomasz Buchert 1
1 MADYNES - Management of dynamic networks and services
Inria Nancy - Grand Est, LORIA - NSS - Department of Networks, Systems and Services
Résumé : L'expérimentation sur les systèmes modernes comme les superordinateurs, les infrastructures cloud ou les réseaux P2P, est devenue complexe à cause des difficultés techniques et méthodologiques. La réalisation correcte d'expériences et l'analyse des résultats obtenus est difficile, même en possédant toute l'expertise nécessaire sur le domaine d'étude et la technologie utilisée. De plus, les expériences à grande échelle échouent souvent en raison du comportements aléatoires du matériel et du logiciel, menaçant les principes de la recherche expérimentale comme la fiabilité et la reproductibilité des résultats. Cette situation inquiétante de la recherche sur les systèmes distribués à grande échelle nécessite la découverte de nouvelles approches pour la structuration, le contrôle et l'interprétation d'expériences. Ce travail explore l'utilisation de control-flows (processus métier) comme un modèle pour la représentation d'expériences à grande échelle dans le domaine des systèmes distribués. Il analyse les avantages, inconvénients et limitations de cette approche, ainsi que des considérations pratiques pour leur implantation future. Trois contributions principales peuvent être distinguées. D'abord, nous analysons l'état actuel des outils pour le contrôle d'expériences. Nous montrons les fonctionnalités manquantes et permettons de comprendre les difficultés partagées par toutes les approches. Cette analyse se termine avec la construction d'une hiérarchie des propriétés qui peut être utilisée pour l'évaluation des outils qui contrôlent les expériences. La deuxième contribution consiste en un design et une implantation d'un système de contrôle d'expériences qui se base sur le modèle de control-flows. Nous montrons que cette méthodologie est capable du contrôle efficace et robuste des expériences à grande échelle et offre des fonctionnalités nécessaires, dont certains ne sont pas présentes dans les approches existantes. La dernière contribution porte sur la conception et l'implantation d'un système pour la collection de provenance pendant l'exécution d'expériences sur les systèmes distribués. Elle utilise intensément le modèle de control-flows et améliore l'approche présentée précédemment. Le prototype de ce système est capable d'une collection de provenance de manière efficace et automatique. Les résultats obtenus montrent que le modèle proposé est une approche viable du contrôle d'expériences dans les systèmes distribués. De plus, les améliorations possibles sont mentionnées à la fin du document.
Type de document :
Thèse
Distributed, Parallel, and Cluster Computing [cs.DC]. Université de Lorraine, 2016. English
Liste complète des métadonnées

Littérature citée [198 références]  Voir  Masquer  Télécharger

https://tel.archives-ouvertes.fr/tel-01273964
Contributeur : Tomasz Buchert <>
Soumis le : lundi 15 février 2016 - 02:52:08
Dernière modification le : jeudi 11 janvier 2018 - 06:25:23
Document(s) archivé(s) le : samedi 12 novembre 2016 - 20:10:17

Fichier

Identifiants

  • HAL Id : tel-01273964, version 1

Citation

Tomasz Buchert. Managing large-scale, distributed systems research experiments with control-flows. Distributed, Parallel, and Cluster Computing [cs.DC]. Université de Lorraine, 2016. English. 〈tel-01273964〉

Partager

Métriques

Consultations de la notice

497

Téléchargements de fichiers

714