Génie logiciel pour le génie linguiciel - TEL - Thèses en ligne Accéder directement au contenu
Thèse Année : 1994

Software engineering for the lingware engineering

Génie logiciel pour le génie linguiciel

Résumé

The aim of this thesis is the study of various modern engineering techniques which can be used for the development of Natural Language Processing systems. The first part presents the state of the art in NLP concerning Specialised Languages for Linguistic Programming. We identify integrability, genericity and extensibility as the most crucial properties of NLP systems. The definition of an object model (LEAF) and the enhancement of an architural model (WhiteBoard) are the first two answers to integrability. A first approach to genericity and extensibility is also provided by a reengineering experiment of the LT language. The second part gives a thorough account of the problems linked to genericity and exemplifies them with the definition of an original linguistic representation language (DECOR). This language can be made both generic and dynamic by the introduction of internal and external protocols. The third part concerns the reengineering of two specialized langages (ATEF and ROBRA). This experiment allows us to introduce a good extensibility in the engines of these languages, using object and protocol oriented programming techniques. A common question to these three parts comes up with the identification of the limits and difficulties concerning the journey to integrability, genericity and extensibility. These obstacles come mainly from of the increasing complexity of the appropriate protocols, which may easily cause the developer to lose control over the implementation.
Cette thèse concerne l'étude de différentes techniques modernes de génie logiciel qui peuvent être mises en ¦uvre pour développer des systèmes de Traitement Automatique des Langues Naturelles de façon générique et extensible. La première partie fait le point sur l'état de l'art en TALN à propos des Langages Spécialisés pour la Programmation Linguistique et permet d'identifier l'intégrabilité, l'extensibilité et la généricité comme trois qualités qu'il est souhaitable de fournir aux systèmes de TALN. La définition d'un modèle à objets (LEAF) et l'affinage d'un modèle d'architecture (tableau blanc) constituent deux premiers éléments de réponse au problème de l'intégration. Une première approche de la généricité et de l'extensibilité est également présentée avec une expérience de réingéniérie du langage LT. La seconde partie approfondit les problèmes de généricité et les illustre avec la définition d'un langage original de représentation linguistique (DECOR). L'introduction de protocoles internes et externes permet de rendre ce langage particulièrement générique et dynamique. La troisième partie fait état de la réingériérie de deux langages spécialisés (ATEF et ROBRA). Cette expérience permet d'introduire une grande extensibilité dans les moteurs de ces langages par une programmation par objets et protocoles. Une question transverse à ces trois parties concerne l'identification des limites et des écueils liés à la recherche de l'intégrabilité, de l'extensibilité et de la généricité. Ces difficultés viennent principalement de la complexité croissante des protocoles adéquats, dont la maîtrise pourrait rapidement échapper au développeur si l'on n'y prend garde.
Fichier principal
Vignette du fichier
tel-00005104.pdf (1.21 Mo) Télécharger le fichier
Loading...

Dates et versions

tel-00005104 , version 1 (25-02-2004)

Identifiants

  • HAL Id : tel-00005104 , version 1

Citer

Mathieu Lafourcade. Génie logiciel pour le génie linguiciel. Interface homme-machine [cs.HC]. Université Joseph-Fourier - Grenoble I, 1994. Français. ⟨NNT : ⟩. ⟨tel-00005104⟩

Collections

UGA IMAG CNRS UJF
422 Consultations
1094 Téléchargements

Partager

Gmail Facebook X LinkedIn More