Trajectoire de l'information dans les médias sociaux - TEL - Thèses en ligne Accéder directement au contenu
Thèse Année : 2020

Information Trajectory in social media

Trajectoire de l'information dans les médias sociaux

Résumé

The work presented in this thesis, made in collaboration with the company Bertin IT, aims to study the way information spreads in social media text corpora. We present the information Trajectory model, a way to depict information propagation when the pieces of information mutate alongside their propagation. Information propagation and information mutation are generally dissociated in the literature. The information Trajectory model makes the joint representation of these two phenomenons possible. We describe a two-step method for computing an approximation of the information Trajectory. First, we approximate the propagation structure by computing coherent document chains. Then, we describe a way to exploit this structure in order to extract, characterize and label the propagating information pieces. We run two evaluation campains which experimentally show that our method is relevant. We also describe our works for using the information Trajectory. From the computed Trajectory approximations, we can efficiently navigate in consequent corpora. We can detect and analyze subtlety between two similar information pieces with different propagation histories, and we can discover low-signal information inside the corpus.
Les travaux présentés dans cette thèse, réalisés en collaboration avec l'entreprise Bertin IT, ont pour objectif d'étudier la manière dont l'information chemine dans des corpus de documents tirés des médias sociaux. Nous présentons le modèle de la Trajectoire de l'information, une manière de représenter la propagation d'informations qui mutent en même temps qu'elles se propagent dans des corpus de documents textuels. Dans la littérature, la question de la propagation est généralement dissociée de la question de la mutation de l'information. Le modèle de la Trajectoire permet de représenter les deux phénomènes conjointement ce qui est tout à fait innovant. Nous détaillons une méthode pour approcher la Trajectoire de l'information en deux temps. Nous commençons par estimer sa structure de propagation à l'aide de la notion de chaînes cohérentes. Ensuite, nous décrivons une méthode pour extraire de cette structure les différentes informations qui se propagent ainsi que pour les nommer. Nous démontrons expérimentalement la pertinence de chaque méthode à l'aide de campagnes d'évaluation par des experts. Nous présentons également nos travaux pour exploiter les objets que nous construisons. Les trajectoires que nous calculons permettent par exemple de naviguer efficacement dans de grand corpus de documents, de détecter et d'analyser la nuance entre deux propagations d'informations similaires, et de découvrir des informations qui correspondent à des signaux faibles potentiels.
Fichier principal
Vignette du fichier
these_internet_huyghues-despointes_c.pdf (4.53 Mo) Télécharger le fichier
Origine : Version validée par le jury (STAR)

Dates et versions

tel-03405160 , version 1 (27-10-2021)

Identifiants

  • HAL Id : tel-03405160 , version 1

Citer

Charles Huyghues-Despointes. Trajectoire de l'information dans les médias sociaux. Informatique et langage [cs.CL]. Université de Lyon, 2020. Français. ⟨NNT : 2020LYSE2088⟩. ⟨tel-03405160⟩
255 Consultations
150 Téléchargements

Partager

Gmail Facebook X LinkedIn More