Future internet metrology : characterization, quantification and prediction of web browsing quality - TEL - Thèses en ligne Accéder directement au contenu
Thèse Année : 2020

Future internet metrology : characterization, quantification and prediction of web browsing quality

Métrologie de l'internet du futur : caractérisation, quantification et prédiction de la qualité de la navigation web

Résumé

Web browsing is one of the main Internet services where a wide set of actors are involved and evolves constantly. New Internet protocols, Content Delivery Networks (CDN) or web browsers’evolutions are meant to improve web pages’ loading times. In order to better understand the Quality of Experience (QoE) perceived by end-users, it is of prime importance to identify how web pages’ content is composed and delivered as well as providing are levant QoE metric. In this thesis, we have designed a new tool, Web View, meant to perform automatic Web browsing and measures several aspects of the Web browsing eco-system. We have also introduced a new web metric, the Time for Full Visual Rendering (TFVR). From more than 18 Trillion measurements performed over 2.5 years on the Top 10,000 Alexa websites, we have used statistical techniques to identify the key parameters qualifying and quantifying web browsing quality. This set of factors has been confirmed by a machine learning process, which gives as output the set of rules to predict web pages’ loading times. For websites where fluctuations in loading times happen regularly, we have used the Hierarchical Dirich let Process Hidden Markov Model (HDP-HMM) to enrich our rulesbased models in order to increase the correctness in prediction rates. The evaluation of our decision treebased model on never assessed websites shows that we can correctly predict web browsing quality. This work aims at helping network operators and service providers to increase the Quality of Service (QoS) offered to their customers.
La navigation Web est l'un des principaux services de l’Internet où un large éventail d'acteurs est impliqué et évolue de manière constante. Les nouveaux protocoles de l’Internet, les réseaux de diffusion de contenu (CDN) ou encore les évolutions des différents navigateurs Web sont destinés à améliorer les temps de chargement des pages. Pour mieux comprendre la Qualité d'Expérience (QoE) perçue par les utilisateurs, il est donc essentiel d’identifier comment le contenu des pages est constitué et délivré et de fournir une métrique de QoE pertinente. Dans cette thèse, nous avons conçu un nouvel outil, Web View, destiné à effectuer des sessions de navigation Web automatisées et mesurant de nombreuses informations liées à l’écosystème du Web. Nous avons aussi défini une nouvelle métrique Web, le Time for Full Visual Rendering (TFVR). À partir de plus de 18 trillions de mesures effectuées pendant 2,5 ans sur les 10,000 sites Web les plus visités (selon la classification Alexa), nous avons utilisé des techniques statistiques pour identifier les paramètres clés qualifiant et quantifiant la qualité de la navigation Web. Cet ensemble de facteurs a été confirmé par un processus d'apprentissage automatique, donnant en sortie un ensemble de règles pour prédire les temps de chargement des pages Web. Pour les pages Web où des fluctuations dans les temps de chargement sont fréquentes, nous avons utilisé des modèles de chaines de Markov cachées suivant un processus de Dirichlet hiérarchique (HDP-HMM) pour enrichir notre modèle et ainsi augmenter le taux de prédiction correspondant. L'évaluation de notre modèle basé sur un arbre de décision sur des sites Web jamais mesurés montre que nous pouvons prédire correctement la qualité de la navigation Web. Ces travaux visent ainsi à permettre aux opérateurs de réseaux et aux fournisseurs de services d’augmenter la Qualité de Service (QoS) offerte à leurs clients.
Fichier principal
Vignette du fichier
2020IMTA0186_Saverimoutou-Antoine.pdf (25.86 Mo) Télécharger le fichier
Origine : Version validée par le jury (STAR)

Dates et versions

tel-03130648 , version 1 (03-02-2021)

Identifiants

  • HAL Id : tel-03130648 , version 1

Citer

Antoine Saverimoutou. Future internet metrology : characterization, quantification and prediction of web browsing quality. Web. Ecole nationale supérieure Mines-Télécom Atlantique, 2020. English. ⟨NNT : 2020IMTA0186⟩. ⟨tel-03130648⟩
185 Consultations
59 Téléchargements

Partager

Gmail Facebook X LinkedIn More