Interopérabilité sémantique multilingue des ressources lexicales en données lexicales liées ouvertes

Résumé : Lorsqu’il s’agit de la construction de ressources lexico-sémantiques multilingues, la première chose qui vient à l’esprit, est la nécessité que les ressources à aligner partagent le même format de données et la même représentation (interopérabilité représentationnelle). Avec l’apparition de standards tels que LMF et leur adaptation au web sémantique pour la production de ressources lexico-sémantiques multilingues en tant que données lexicales liées ouvertes (Ontolex), l’interopérabilité représentationnelle n’est plus un verrou majeur. Cependant, en ce qui concerne l’interopérabilité des alignements multilingues, le choix et la construction d’un pivot interlingue est l’un des obstacles principaux. Pour nombre de ressources (par exemple BabelNet, EuroWordNet), le choix est fait d’utiliser l’anglais, ou une autre langue, comme pivot interlingue. Ce choix mène à une perte de contraste dans les cas où des sens du pivot ont des lexicalisations différentes dans la même acception dans plusieurs autres langues. L’utilisation d’un pivot à acceptions interlingues, solution proposée il y a déjà plus de 20 ans, pourrait être viable. Néanmoins, leur construction manuelle est trop ardue du fait du manque d’experts et leur construction automatique pose problème du fait de l’absence d’une formalisation et d’une caractérisation axiomatique permettant de garantir leurs propriétés. Nous proposons dans cette thèse de d’abord formaliser l’architecture à pivot interlingue par acceptions, en développant une axiomatisation garantissant leurs propriétés. Nous proposons ensuite des algorithmes de construction initiale automatique en utili- sant les propriétés combinatoires du graphe des alignements bilingues ainsi que des algorithmes de mise à jour. Dans un deuxième temps, nous étudions les implications de l’application de ces algorithmes sur DBNary (une ressource en données lexicales liées ouvertes extraite à partir de Wiktionary).
Type de document :
Thèse
Intelligence artificielle [cs.AI]. Université Grenoble Alpes, 2016. Français
Liste complète des métadonnées

https://tel.archives-ouvertes.fr/tel-01425123
Contributeur : Andon Tchechmedjiev <>
Soumis le : mardi 3 janvier 2017 - 13:03:38
Dernière modification le : jeudi 11 octobre 2018 - 08:48:03
Document(s) archivé(s) le : mardi 4 avril 2017 - 13:18:46

Fichier

Identifiants

  • HAL Id : tel-01425123, version 1

Collections

Citation

Andon Tchechmedjiev. Interopérabilité sémantique multilingue des ressources lexicales en données lexicales liées ouvertes. Intelligence artificielle [cs.AI]. Université Grenoble Alpes, 2016. Français. 〈tel-01425123〉

Partager

Métriques

Consultations de la notice

272

Téléchargements de fichiers

633