Event detection and analysis on short text messages

Amosse Edouard 1, 2
2 WIMMICS - Web-Instrumented Man-Machine Interactions, Communities and Semantics
CRISAM - Inria Sophia Antipolis - Méditerranée , SPARKS - Scalable and Pervasive softwARe and Knowledge Systems
Résumé : Les réseaux sociaux ont transformé le Web d'un mode lecture, où les utilisateurs pouvaient seulement consommer les informations, à un mode interactif leur permettant de les créer, partager et commenter. Un défi majeur du traitement d'information dans les médias sociaux est lié à la taille réduite des contenus, leur nature informelle et le manque d'informations contextuelles. D'un autre côté, le web contient des bases de connaissances structurées à partir de concepts d'ontologies, utilisables pour enrichir ces contenus. Cette thèse explore le potentiel d'utiliser les bases de connaissances du Web de données, afin de détecter, classifier et suivre des événements dans les médias sociaux, particulièrement Twitter. On a abordé 3 questions de recherche : i) Comment extraire et classifier les messages qui rapportent des événements ? ii) Comment identifier des événements précis ? iii) Étant donné un événement, comment construire un fil d'actualité représentant les différents sous-événements ? Les travaux de la thèse ont contribué à élaborer des méthodes pour la généralisation des entités nommées par des concepts d'ontologies pour mitiger le sur-apprentissage dans les modèles supervisés ; une adaptation de la théorie des graphes pour modéliser les relations entre les entités et les autres termes et ainsi caractériser des événements pertinents ; l'utilisation des ontologies de domaines et les bases de connaissances dédiées, pour modéliser les relations entre les caractéristiques et les acteurs des événements. Nous démontrons que l'enrichissement sémantique des entités par des informations du Web de données améliore la performance des modèles d'apprentissages supervisés et non supervisés.
Type de document :
Thèse
Other [cs.OH]. Université Côte d'Azur, 2017. English. 〈NNT : 2017AZUR4079〉
Liste complète des métadonnées

Littérature citée [139 références]  Voir  Masquer  Télécharger

https://tel.archives-ouvertes.fr/tel-01679673
Contributeur : Abes Star <>
Soumis le : mercredi 10 janvier 2018 - 10:27:34
Dernière modification le : jeudi 29 mars 2018 - 09:45:23

Fichier

2017AZUR4079.pdf
Version validée par le jury (STAR)

Identifiants

  • HAL Id : tel-01679673, version 1

Collections

Citation

Amosse Edouard. Event detection and analysis on short text messages. Other [cs.OH]. Université Côte d'Azur, 2017. English. 〈NNT : 2017AZUR4079〉. 〈tel-01679673〉

Partager

Métriques

Consultations de la notice

409

Téléchargements de fichiers

809