Machine learning algorithms for behavior prediction in cloud computing architectures
Algorithmes d'apprentissage automatique pour la prédiction de comportement dans les architectures de cloud computing
Résumé
Cloud computing solutions provide applications, storage capabilities, and computational resources through a network. although the multiple advantages of these technologies have made them ubiquitous, loading times of several seconds of these services can jeopardize the users' experience. the idea is to analyze the user behavior to predict the utilization of applications and significantly reduce its launching time by loading them in advance.we propose a modeling and user behavior prediction pipeline that effectively reduces the launching time of applications. our approach shows several advantages. it is well suited for customers with scarce data (e.g., new customers) since it allows to introduce domain knowledge or set conditions. it allows to change the estimation approach to switch from batch to on-line training and scale linearly with the number of user. its modular architecture makes it robust, easy to debug, and allows for progressive improvement of the system. the solution remains general, and it can also be applied to the prediction of other types of events (with the time and date of the events being the only requirement for our pipeline to work).the performance of the pipeline has been tested with real-world data. we found that under a default initialization of the parameters, we can half the average launching time of a group from 13s to 6.5s with at most 20% overhead and, if required, even achieve 2.6s with at most 40% overhead. finally, the proposed solution was implemented and fully integrated into an application virtualization software, deployed to customers around the world, and repeatedly tested under real conditions to validate the performance.
Les solutions de cloud computing fournissent des applications, des capacités de stockage et des ressources de calcul via un réseau. Les multiples avantages de ces technologies les ont rendues omniprésentes. Cependant, des temps de chargement de plusieurs secondes de ces services peuvent compromettre l'expérience des utilisateurs. L’idée est d’analyser le comportement des utilisateurs pour prévoir l’utilisation des applications et réduire considérablement leur temps de lancement en les chargeant a l’avance. Nous proposons un pipeline de modélisation et de prédiction du comportement des utilisateurs qui présente plusieurs avantages. Il convient aux clients disposant de peu de données, car il permet d’introduire une connaissance du domaine. Pour avoir de bonnes performances, il n’est pas nécessaire que les données soient partagées par les clients. Il permet aussi de choisir entre l'approche d'estimation par lots ou en ligne. L'architecture modulaire de notre solution la rend robuste, facile a débuguer et permet une amélioration progressive du système. Nous avons testé les performances du pipeline avec des données réelles. Nous avons pu, avec une initialisation par défaut des paramètres, diviser par deux le temps de lancement moyen d'un groupe de 13 s a 6,5 s avec au maximum 20% de consommation de ressources additionnelles, et si nécessaire, même atteindre 2,6 s avec au maximum 40% de consommation de ressources additionnelles. Enfin, la solution proposée a été mise en œuvre et entièrement intégrée dans un logiciel de virtualisation d’applications déployé auprès de clients du monde entier et testée a plusieurs reprises dans des conditions réelles pour valider les performances.
Domaines
Base de données [cs.DB]
Origine : Version validée par le jury (STAR)