Skip to Main content Skip to Navigation
Theses

Data veracity assessment: enhancing Truth Discovery using a priori knowledge

Résumé : La notion de véracité des données retient de plus en plus l'attention en raison du problème de la désinformation. Avec de plus en plus d'informations en ligne publiées, il devient essentiel de développer des modèles qui évaluent automatiquement la véracité des informations. En effet, l'évaluation de la véracité des données est très difficile pour l'être humain. Il est affecté par le biais de confirmation qui lui empêche d'évaluer objectivement la fiabilité des informations. De plus, la quantité d'informations disponibles de nos jours rend cette tâche difficile. La puissance de calcul de l'ordinateur est donc necessaire. Il est essentiel de développer des méthodes capables d’automatiser cette tâche. Dans cette thèse, nous nous concentrons sur les modèles de découverte de la vérité. Ces approches résolvent le problème de la véracité des données lorsque des valeurs conflictuelles concernant les mêmes propriétés d'entités du monde réel sont fournies par plusieurs sources. Ils visent à identifier les valeures véritables parmi celles qui sont en conflit. Plus précisément, il s’agit de modèles non supervisés qui reposent sur l’argument selon lequel les informations vraies sont fournies par des sources fiables et les sources fiables fournissent des informations vraies. La contribution principale de cette thèse consiste à améliorer les modèles de découverte de la vérité en considérant à priori les connaissances exprimées dans des ontologies. Cette connaissance peut faciliter l'identification de assertions vrais. Deux aspects particuliers des ontologies sont considérés. La prise en compte de la hiérarchisation des concepts de l’ontologie et l’identification de motifs dans les connaissances qui permet, en exploitant certaines règles d’association, de renforcer la confiance dans certaines assertions. Des expériences menées à la fois sur des ensembles de données synthétiques et réels ont montré que la connaissance a priori améliore les modèles existants et ouvre la voie à un monde de l'information plus fiable. Le code de calcul ainsi que les jeux de données synthétiques et réels sont rendus disponibles à la communauté.
Document type :
Theses
Complete list of metadatas

Cited literature [165 references]  Display  Hide  Download

https://hal.archives-ouvertes.fr/tel-01914278
Contributor : Valentina Beretta <>
Submitted on : Thursday, November 15, 2018 - 5:19:59 PM
Last modification on : Wednesday, June 24, 2020 - 4:18:24 PM
Document(s) archivé(s) le : Saturday, February 16, 2019 - 12:21:18 PM

File

beretta_thesis_final.pdf
Files produced by the author(s)

Identifiers

  • HAL Id : tel-01914278, version 1

Collections

Citation

Valentina Beretta. Data veracity assessment: enhancing Truth Discovery using a priori knowledge. Computer Science [cs]. IMT Mines Alès, 2018. English. ⟨tel-01914278⟩

Share

Metrics

Record views

327

Files downloads

453