Skip to Main content Skip to Navigation
Theses

Modèles thématiques pour la découverte non supervisée de points de vue sur le Web

Thibaut Thonet 1
1 IRIT-IRIS - Recherche d’Information et Synthèse d’Information
IRIT - Institut de recherche en informatique de Toulouse
Résumé : Les plateformes en ligne telles que les blogs et les réseaux sociaux permettent aux internautes de s'exprimer sur des sujets d'une grande variété (produits commerciaux, politique, services, etc.). Cet important volume de données d'opinions peut être exploré et exploité grâce à des techniques de fouille de texte connues sous le nom de fouille d'opinions ou analyse de sentiments. Contrairement à la majorité des travaux actuels en fouille d'opinions, qui se focalisent sur les opinions simplement positives ou négatives (ou un intermédiaire entre ces deux extrêmes), nous nous intéressons dans cette thèse aux points de vue. La fouille de point de vue généralise l'opinion au delà de son acception usuelle liée à la polarité (positive ou négative) et permet l'étude d'opinions exprimées plus subtilement, telles que les opinions politiques. Nous proposons dans cette thèse des approches non supervisées - ne nécessitant aucune annotation préalable - basées sur des modèles thématiques probabilistes afin de découvrir simultanément les thèmes et les points de vue exprimés dans des corpus de textes d'opinion. Dans notre première contribution, nous avons exploré l'idée de différencier mots d'opinions (spécifiques à la fois à un point de vue et à un thème) et mots thématiques (dépendants du thème mais neutres vis-à-vis des différents points de vue) en nous basant sur les parties de discours, inspirée par des pratiques similaires dans la littérature de fouille d'opinions classique - restreinte aux opinions positives et négatives. Notre seconde contribution se focalise quant à elle sur les points de vue exprimés sur les réseaux sociaux. Notre objectif est ici d'analyser dans quelle mesure l'utilisation des interactions entre utilisateurs, en outre de leur contenu textuel généré, est bénéfique à l'identification de leurs points de vue. Nos différentes contributions ont été évaluées et comparées à l'état de l'art sur des collections de documents réels.
Document type :
Theses
Complete list of metadatas

Cited literature [210 references]  Display  Hide  Download

https://tel.archives-ouvertes.fr/tel-01655278
Contributor : Abes Star :  Contact
Submitted on : Friday, December 14, 2018 - 11:43:07 AM
Last modification on : Sunday, June 14, 2020 - 3:28:21 AM

File

2017TOU30167bis.pdf
Files produced by the author(s)

Identifiers

  • HAL Id : tel-01655278, version 2

Citation

Thibaut Thonet. Modèles thématiques pour la découverte non supervisée de points de vue sur le Web. Web. Université Paul Sabatier - Toulouse III, 2017. Français. ⟨NNT : 2017TOU30167⟩. ⟨tel-01655278v2⟩

Share

Metrics

Record views

215

Files downloads

478