Multilinguisation d'ontologies dans le cadre de la recherche d'information translingue dans des collections d'images accompagnées de textes spontanés

Résumé : Le Web est une source proliférante d'objets multimédia, décrits dans différentes langues natu- relles. Afin d'utiliser les techniques du Web sémantique pour la recherche de tels objets (images, vidéos, etc.), nous proposons une méthode d'extraction de contenu dans des collections de textes multilingues, paramétrée par une ou plusieurs ontologies. Le processus d'extraction est utilisé pour indexer les objets multimédia à partir de leur contenu textuel, ainsi que pour construire des requêtes formelles à partir d'énoncés spontanés. Il est basé sur une annotation interlingue des textes, conservant les ambiguïtés de segmentation et la polysémie dans des graphes. Cette première étape permet l'utilisation de processus de désambiguïsation “factorisés” au niveau d'un lexique pivot (de lexèmes interlingues). Le passage d'une ontologie en paramètre du système se fait en l'alignant de façon automatique avec le lexique interlingue. Il est ainsi possible d'utiliser des ontologies qui n'ont pas été conçues pour une utilisation multilingue, et aussi d'ajouter ou d'étendre l'ensemble des langues et leurs couvertures lexicales sans modifier les ontologies. Un démonstrateur pour la recherche multilingue d'images, développé pour le projet ANR OMNIA, a permis de concrétiser les approches proposées. Le passage à l'échelle et la qualité des annotations produites ont ainsi pu être évalués.
Type de document :
Thèse
Autre [cs.OH]. Université de Grenoble, 2012. Français. 〈NNT : 2012GRENM031〉
Liste complète des métadonnées

Littérature citée [9 références]  Voir  Masquer  Télécharger

https://tel.archives-ouvertes.fr/tel-00743652
Contributeur : Abes Star <>
Soumis le : vendredi 19 octobre 2012 - 15:52:19
Dernière modification le : jeudi 11 octobre 2018 - 08:48:03
Document(s) archivé(s) le : dimanche 20 janvier 2013 - 03:43:04

Fichier

21440_ROUQUET_2012_archivage1....
Version validée par le jury (STAR)

Identifiants

  • HAL Id : tel-00743652, version 1

Citation

David Rouquet. Multilinguisation d'ontologies dans le cadre de la recherche d'information translingue dans des collections d'images accompagnées de textes spontanés. Autre [cs.OH]. Université de Grenoble, 2012. Français. 〈NNT : 2012GRENM031〉. 〈tel-00743652〉

Partager

Métriques

Consultations de la notice

891

Téléchargements de fichiers

2006