Prominent microblog users prediction during crisis events : using phase-aware and temporal modeling of users behavior

Résumé : Durant les situations de crise, telles que les catastrophes, le besoin de recherche d’informations (RI) pertinentes partagées dans les microblogs en temps réel est inévitable. Cependant, le grand volume et la variété des flux d’informations partagées en temps réel dans de telles situations compliquent cette tâche. Contrairement aux approches existantes de RI basées sur l’analyse du contenu, nous proposons de nous attaquer à ce problème en nous basant sur les approches centrées utilisateurs tout en levant un certain nombre de verrous méthodologiques et technologiques inhérents : 1) à la collection des données partagées par les utilisateurs à évaluer, 2) à la modélisation de leurs comportements, 3) à l’analyse des comportements, et 4) à la prédiction et le suivi des utilisateurs primordiaux en temps réel. Dans ce contexte, nous détaillons les approches proposées dans cette thèse afin de prédire les utilisateurs primordiaux qui sont susceptibles de partager les informations pertinentes et exclusives ciblées et de permettre aux intervenants d’urgence d’accéder aux informations requises quel que soit le format (i.e. texte, image, vidéo, lien hypertexte) et en temps réel. Ces approches sont centrées sur trois principaux aspects. Nous avons tout d’abord étudié l’efficacité de différentes catégories de mesures issues de la littérature et proposées dans cette thèse pour représenter le comportement des utilisateurs. En nous basant sur les mesures pertinentes résultant de cette étude, nous concevons des nouvelles caractéristiques permettant de mettre en évidence la qualité des informations partagées par les utilisateurs selon leurs comportements. Le deuxième aspect consiste à proposer une approche de modélisation du comportement de chaque utilisateur en nous basant sur les critères suivants : 1) la modélisation des utilisateurs selon l’évolution de l’évènement, 2) la modélisation de l’évolution des activités des utilisateurs au fil du temps à travers une représentation sensible au temps, 3) la sélection des caractéristiques les plus discriminantes pour chaque phase de l’évènement. En se basant sur cette approche de modélisation, nous entraînons différents modèles de prédiction qui apprennent à différencier les comportements des utilisateurs primordiaux de ceux qui ne le sont pas durant les situations de crise. Les algorithmes SVM et MOG-HMMs ont été utilisés durant la phase d’apprentissage. La pertinence et l’efficacité des modèles de prédiction appris ont été validées à l’aide des données collectées par notre système multi-agents MASIR durant deux inondations qui ont eu lieu en France et des vérités terrain appropriées à ces collections.
Type de document :
Thèse
Information Retrieval [cs.IR]. Université de La Rochelle, 2016. English. 〈NNT : 2016LAROS026〉
Liste complète des métadonnées

Littérature citée [119 références]  Voir  Masquer  Télécharger

https://tel.archives-ouvertes.fr/tel-01663067
Contributeur : Abes Star <>
Soumis le : mercredi 13 décembre 2017 - 16:44:38
Dernière modification le : jeudi 14 décembre 2017 - 01:01:04

Fichier

2016Bizid97635.pdf
Version validée par le jury (STAR)

Identifiants

  • HAL Id : tel-01663067, version 1

Collections

Citation

Imen Bizid. Prominent microblog users prediction during crisis events : using phase-aware and temporal modeling of users behavior. Information Retrieval [cs.IR]. Université de La Rochelle, 2016. English. 〈NNT : 2016LAROS026〉. 〈tel-01663067〉

Partager

Métriques

Consultations de la notice

417

Téléchargements de fichiers

50