Modélisation de parcours du Web et calcul de communautés par émergence
Résumé
The modelization of the Web graph and the modelization and the extraction of communities in the graph of the Web are the subject of this thesis, which is divided into two parts. The first part makes an analysis of large graphs and introduced a new model of random crawls. We starts by defining the common properties of networks, then gives some random models for the generation of networks. To finish, we proposes a new model of random crawls.
Then, the second part proposes two models of emergence of community in the networks. After a remainder on the algorithms of classification: PageRank and HITS is presented the gravitational model in which the nodes of a network are mobile and interact to the links between them. The communities emerge quickly after some iterations. The second model is an improvement of the first, the nodes have now an objective which consists in reaching their communities.
Then, the second part proposes two models of emergence of community in the networks. After a remainder on the algorithms of classification: PageRank and HITS is presented the gravitational model in which the nodes of a network are mobile and interact to the links between them. The communities emerge quickly after some iterations. The second model is an improvement of the first, the nodes have now an objective which consists in reaching their communities.
Le graphe du Web, plus précisément le crawl qui permet de l'obtenir et les communautés qu'il contient est le sujet de cette thèse, qui est divisée en deux parties.
La première partie fait une analyse des grand réseaux d'interactions et introduit un nouveau modèle de crawls du Web. Elle commence par définir les propriétés communes des réseaux d'interactions, puis donne quelques modèles graphes aléatoires générant des graphes semblables aux réseaux d'interactions. Pour finir, elle propose un nouveau modèle de crawls aléatoires.
La second partie propose deux modèles de calcul de communautés par émergence dans le graphe du Web. Après un rappel sur les mesures d'importances, PageRank et HITS est présenté le modèle gravitationnel dans lequel les nœuds d'un réseau sont mobile et interagissent entre eux grâce aux liens entre eux. Les communautés émergent rapidement au bout de quelques itérations. Le second modèle est une amélioration du premier, les nœuds du réseau sont dotés d'un objectif qui consiste à atteindre sa communautés.
La première partie fait une analyse des grand réseaux d'interactions et introduit un nouveau modèle de crawls du Web. Elle commence par définir les propriétés communes des réseaux d'interactions, puis donne quelques modèles graphes aléatoires générant des graphes semblables aux réseaux d'interactions. Pour finir, elle propose un nouveau modèle de crawls aléatoires.
La second partie propose deux modèles de calcul de communautés par émergence dans le graphe du Web. Après un rappel sur les mesures d'importances, PageRank et HITS est présenté le modèle gravitationnel dans lequel les nœuds d'un réseau sont mobile et interagissent entre eux grâce aux liens entre eux. Les communautés émergent rapidement au bout de quelques itérations. Le second modèle est une amélioration du premier, les nœuds du réseau sont dotés d'un objectif qui consiste à atteindre sa communautés.
Loading...