Prolexbase. Un dictionnaire relationnel multilingue de noms propres : conception, implémentation et mise en ligne - TEL - Thèses en ligne Accéder directement au contenu
Thèse Année : 2006

Prolexbase. An electronic relational multilingual dictionary of proper names: design, implementation and uploading

Prolexbase. Un dictionnaire relationnel multilingue de noms propres : conception, implémentation et mise en ligne

Résumé

This thesis presents the different stages of the design and implementation of an electronic relational multilingual dictionary of proper names for automatic processing. A study of different works in the world of electronic dictionaries and in the domain of proper names in linguistics and in NLP has allowed us to propose a model of proper names. This model is organized in two parts: a part common to all languages and a specific part for a given language. The first part contains a metaconceptual level, which encompasses the concepts of type, supertype and existence, and the conceptual part, with the conceptual proper name and four relations (synonymy, hyperonymy, meronymy and accessibility). The second part contains a linguistic level (prolexemes, aliases, derivatives and relations which depend on the language) and an instance level (with the inflected form of the prolexeme, the aliases and the derivatives). We have implemented our model trough a relational database. An interface of consultation and a collaborative work interface have been developed. The database is available at the CNRTL website.
Cette thèse présente les différentes étapes de la conception et de l’implémentation d’un dictionnaire électronique relationnel multilingue de noms propres, destiné à des processus automatiques. Une étude de différents travaux dans le monde des dictionnaires électroniques et dans le domaine des noms propres en linguistique et en TAL nous a permis de proposer une modélisation des noms propres. Cette modélisation repose sur une architecture en deux parties : une partie qui ne dépend pas des langues et une partie qui dépend de la langue. La première partie est formée d’un niveau métaconceptuel, regroupant les concepts de type, de supertype et d’existence, et d’un niveau conceptuel, qui comprend le concept de nom propre conceptuel et quatre relations (la synonymie, l’hyperonymie, la méronymie et l’accessibilité). Le seconde partie comprend le niveau linguistique (prolexème, alias, dérivés et les relations qui dépendent de la langue) et le niveau des instances (formé de l’ensemble des formes fléchies du prolexème, des alias et des dérivés). Nous avons implémenté notre modèle sous la forme d’une base de données relationnelle. Une interface de consultation et une interface de travail collaboratif ont été créées. La base est actuellement sur le site du CNRTL.
Fichier principal
Vignette du fichier
TheseMickaelTran.pdf (8.23 Mo) Télécharger le fichier
Origine : Publication financée par une institution
Loading...

Dates et versions

tel-01726999 , version 1 (08-03-2018)

Identifiants

  • HAL Id : tel-01726999 , version 1

Citer

Mickaël Tran. Prolexbase. Un dictionnaire relationnel multilingue de noms propres : conception, implémentation et mise en ligne. Traitement du texte et du document. Université de Tours, 2006. Français. ⟨NNT : ⟩. ⟨tel-01726999⟩
291 Consultations
307 Téléchargements

Partager

Gmail Facebook X LinkedIn More