Skip to Main content Skip to Navigation
Theses

Event detection and analysis on short text messages

Amosse Edouard 1, 2
2 WIMMICS - Web-Instrumented Man-Machine Interactions, Communities and Semantics
CRISAM - Inria Sophia Antipolis - Méditerranée , Laboratoire I3S - SPARKS - Scalable and Pervasive softwARe and Knowledge Systems
Résumé : Les réseaux sociaux ont transformé le Web d'un mode lecture, où les utilisateurs pouvaient seulement consommer les informations, à un mode interactif leur permettant de les créer, partager et commenter. Un défi majeur du traitement d'information dans les médias sociaux est lié à la taille réduite des contenus, leur nature informelle et le manque d'informations contextuelles. D'un autre côté, le web contient des bases de connaissances structurées à partir de concepts d'ontologies, utilisables pour enrichir ces contenus. Cette thèse explore le potentiel d'utiliser les bases de connaissances du Web de données, afin de détecter, classifier et suivre des événements dans les médias sociaux, particulièrement Twitter. On a abordé 3 questions de recherche : i) Comment extraire et classifier les messages qui rapportent des événements ? ii) Comment identifier des événements précis ? iii) Étant donné un événement, comment construire un fil d'actualité représentant les différents sous-événements ? Les travaux de la thèse ont contribué à élaborer des méthodes pour la généralisation des entités nommées par des concepts d'ontologies pour mitiger le sur-apprentissage dans les modèles supervisés ; une adaptation de la théorie des graphes pour modéliser les relations entre les entités et les autres termes et ainsi caractériser des événements pertinents ; l'utilisation des ontologies de domaines et les bases de connaissances dédiées, pour modéliser les relations entre les caractéristiques et les acteurs des événements. Nous démontrons que l'enrichissement sémantique des entités par des informations du Web de données améliore la performance des modèles d'apprentissages supervisés et non supervisés.
Document type :
Theses
Complete list of metadatas

Cited literature [139 references]  Display  Hide  Download

https://tel.archives-ouvertes.fr/tel-01679673
Contributor : Abes Star :  Contact
Submitted on : Wednesday, January 10, 2018 - 10:27:34 AM
Last modification on : Tuesday, May 26, 2020 - 6:50:56 PM

File

2017AZUR4079.pdf
Version validated by the jury (STAR)

Identifiers

  • HAL Id : tel-01679673, version 1

Collections

Citation

Amosse Edouard. Event detection and analysis on short text messages. Other [cs.OH]. Université Côte d'Azur, 2017. English. ⟨NNT : 2017AZUR4079⟩. ⟨tel-01679673⟩

Share

Metrics

Record views

792

Files downloads

6995