Data veracity assessment: enhancing Truth Discovery using a priori knowledge

Résumé : La notion de véracité des données retient de plus en plus l'attention en raison du problème de la désinformation. Avec de plus en plus d'informations en ligne publiées, il devient essentiel de développer des modèles qui évaluent automatiquement la véracité des informations. En effet, l'évaluation de la véracité des données est très difficile pour l'être humain. Il est affecté par le biais de confirmation qui lui empêche d'évaluer objectivement la fiabilité des informations. De plus, la quantité d'informations disponibles de nos jours rend cette tâche difficile. La puissance de calcul de l'ordinateur est donc necessaire. Il est essentiel de développer des méthodes capables d’automatiser cette tâche. Dans cette thèse, nous nous concentrons sur les modèles de découverte de la vérité. Ces approches résolvent le problème de la véracité des données lorsque des valeurs conflictuelles concernant les mêmes propriétés d'entités du monde réel sont fournies par plusieurs sources. Ils visent à identifier les valeures véritables parmi celles qui sont en conflit. Plus précisément, il s’agit de modèles non supervisés qui reposent sur l’argument selon lequel les informations vraies sont fournies par des sources fiables et les sources fiables fournissent des informations vraies. La contribution principale de cette thèse consiste à améliorer les modèles de découverte de la vérité en considérant à priori les connaissances exprimées dans des ontologies. Cette connaissance peut faciliter l'identification de assertions vrais. Deux aspects particuliers des ontologies sont considérés. La prise en compte de la hiérarchisation des concepts de l’ontologie et l’identification de motifs dans les connaissances qui permet, en exploitant certaines règles d’association, de renforcer la confiance dans certaines assertions. Des expériences menées à la fois sur des ensembles de données synthétiques et réels ont montré que la connaissance a priori améliore les modèles existants et ouvre la voie à un monde de l'information plus fiable. Le code de calcul ainsi que les jeux de données synthétiques et réels sont rendus disponibles à la communauté.
Type de document :
Thèse
Computer Science [cs]. IMT Mines Alès, 2018. English
Liste complète des métadonnées

https://hal.archives-ouvertes.fr/tel-01914278
Contributeur : Valentina Beretta <>
Soumis le : jeudi 15 novembre 2018 - 17:19:59
Dernière modification le : lundi 11 février 2019 - 18:22:02
Document(s) archivé(s) le : samedi 16 février 2019 - 12:21:18

Fichier

beretta_thesis_final.pdf
Fichiers produits par l'(les) auteur(s)

Identifiants

  • HAL Id : tel-01914278, version 1

Collections

Citation

Valentina Beretta. Data veracity assessment: enhancing Truth Discovery using a priori knowledge. Computer Science [cs]. IMT Mines Alès, 2018. English. 〈tel-01914278〉

Partager

Métriques

Consultations de la notice

181

Téléchargements de fichiers

149