Espaces vectoriels sémantiques : enrichissement et interprétation de requêtes dans un système d'information distribué et hétérogène - TEL - Thèses en ligne Accéder directement au contenu
Thèse Année : 2008

Semantic Vector Spaces: Query Enrichment and Interpretation in a Distributed and Heterogeneous Information System

Espaces vectoriels sémantiques : enrichissement et interprétation de requêtes dans un système d'information distribué et hétérogène

Résumé

Information systems face a relevance problem in retrieval due to the huge increase of available data. Moreover, the number of networking devices grows up and jeopardizes the client/server architecture model. A new architecture is then emerging: peer-to-peer networks (P2P). But they are greedy in network resources (queries flood the network) and offer limited functionalities (key word search). In both fields, IR and P2P systems, research are going deeper on the use of semantics. In computer science, semantics based approaches generally relies on the definition of ontologies. Huge and distributed development of ontologies leads to a semantic heterogeneity. A classical solution relies on the use of mappings between parts of two ontologies. But this solution is difficult to obtain and not always complete. Unshared parts of two ontologies are often not managed, which leads to a loss of information. Our solution, EXSI2D, uses a special query expansion, called structuring expansion, on query initiator's side. Then she can specify the dimensions of her query without any modification of the query itself. Information provider is also allowed to interpret the structuring expansion within her own ontologies. Thus each participant of a semantic heterogeneous information system is able to use all her ontology, including the unshared parts. We also present a solution to the use of EXSI2D in a P2P system, thanks to SPARTANBFS, a “frugal”protocol for unstructured P2P systems.
Les systèmes d'information font face à un problème de pertinence dans les recherches dû à l'augmentation considérable des données accessibles. De plus, le nombre d'appareils communicants ne cesse de croître et de menacer le modèle client/serveur. Une nouvelle architecture distribuée tend donc à s'imposer : les réseaux pair-à-pair (P2P). Mais ils sont peu économes en ressource réseau (une requête inonde le réseau) et offrent des fonctionnalités limitées (recherche par mots-clés). Dans les deux communautés, RI et systèmes P2P, les recherches penchent vers l'utilisation de sémantique. En informatique, les approches basées sur la sémantique nécessitent souvent de définir des ontologies. Le développement important et distribué des ontologies génère une hétérogénéité sémantique. La solution classique est d'utiliser des correspondances entre parties de deux ontologies. Mais c'est une solution qui est difficile à obtenir et qui n'est pas toujours complète. Souvent les parties non-partagées de deux ontologies ne sont pas gérées, ce qui entraîne une perte d'information. Notre solution : EXSI2D, utilise une expansion particulière, appelée expansion structurante, du côté de l'initiateur de requêtes. Cela lui permet de préciser les dimensions de sa requête sans modifier la requête elle-même. EXSI2D offre aussi la possibilité au fournisseur d'information d'interpréter l'expansion structurante dans sa propre ontologie. Ainsi, il est possible à chaque participant d'un système d'information sémantiquement hétérogène d'utiliser toute son ontologie, y compris les parties non partagées. Nous montrons aussi l'utilisation d'EXSI2D dans un système P2P, grâce à SPARTANBFS, un protocole « frugal » pour systèmes P2P non structurés.
Fichier principal
Vignette du fichier
these.pdf (2.53 Mo) Télécharger le fichier
Loading...

Dates et versions

tel-00457820 , version 1 (18-02-2010)

Identifiants

  • HAL Id : tel-00457820 , version 1

Citer

Anthony Ventresque. Espaces vectoriels sémantiques : enrichissement et interprétation de requêtes dans un système d'information distribué et hétérogène. Informatique [cs]. Université de Nantes, 2008. Français. ⟨NNT : ⟩. ⟨tel-00457820⟩
224 Consultations
1011 Téléchargements

Partager

Gmail Facebook X LinkedIn More