Étude des facteurs de pertinence dans la recherche de microblogs. - TEL - Thèses en ligne Accéder directement au contenu
Thèse Année : 2014

Study of salient factors for microblog search.     

Étude des facteurs de pertinence dans la recherche de microblogs.

Firas Damak
  • Fonction : Auteur
  • PersonId : 960713
  • IdRef : 183750705

Résumé

This work deals with the context of social information retrieval (IR), more particularly the retrieval of microblogs. The IR models must adapt to the specificities of microblogs. Our contributions are at several levels: - We conducted an analysis of failure of a conventional model search. We selected relevant microblogs. However, they are not found by the search pattern. Then, we identified the factors preventing their return. We found that the main problem is the shortness of microblogs. - To offset the impact of the shortness of microblogs, we proposed and tested several solutions: to extend the queries by (i) exploiting news articles, (ii) applying techniques of relevance feedback of the state of art which often proved effective. We finally extended microblogs thanks to the links (URLs) they contain. Our experiments have shown that the use of URLs and the expansion of the query are crucial for IR in microblogs.- A second part of our work is concerned with the study of the features used to identify relevant microblogs. In general, we have shown that the features related to URLs posted in tweets are the most discriminating. The features related to the authors do not reflect the relevance. - To take into account the temporal aspect when selecting relevant microblogs, we have proposed three methods that incorporate time in the calculation of relevance. However, this integration of time did not show any positive impact in our methods.   
Notre travail se situe dans le contexte de recherche d'information (RI) sociale et s'intéresse plus particulièrement à la recherche de microblogs. Les modèles de RI doivent s'adapter aux spécificités des microblogs : fraîcheur, aspect social et spécificités syntaxiques doivent ainsi être pris en compte. Nos travaux visent à améliorer la qualité des résultats de recherche d'information adhoc dans les microblogs. Nos contributions se situent à plusieurs niveaux : -Nous avons mené à une analyse de défaillance d'un modèle de recherche usuel. Nous avons trouvé que le problème principal vient de la concision des microblogs. Cette concision engendre une correspondance limitée entre les termes des microblogs et les termes des requêtes, même s'ils sont sémantiquement similaires.-Afin de compenser l'impact de la concision des microblogs, nous avons proposé d'étendre les requêtes (i) en exploitant des ressources de type actualités, (ii) en applicant des techniques de réinjection de pertinence. Nous avons enfin étendu les microblogs grâce aux liens (URLs) qu'ils contiennent. Nos expérimentations ont montré que l'emploi des URLs et l'expansion de requêtes sont primordiales pour la RI dans les microblogs. - Nous avons repris les critères souvent utilisés dans l'état de l'art et nous les avons évalués. Nous avons montré que les critères en relation avec les URLs sont les plus discriminants. -Afin de prendre en compte l'aspect temporel dans la restitution des microblogs pertinents, nous avons proposé trois méthodes qui intègrent le temps dans le calcul de la pertinence. Cette intégration du temps n'a cependant pas montré son intérêt dans nos méthodes.  
Fichier principal
Vignette du fichier
these.pdf (5.55 Mo) Télécharger le fichier
Loading...

Dates et versions

tel-01074732 , version 1 (15-10-2014)

Identifiants

  • HAL Id : tel-01074732 , version 1

Citer

Firas Damak. Étude des facteurs de pertinence dans la recherche de microblogs.. Recherche d'information [cs.IR]. Université Paul Sabatier, 2014. Français. ⟨NNT : ⟩. ⟨tel-01074732⟩
344 Consultations
810 Téléchargements

Partager

Gmail Facebook X LinkedIn More