11045 articles  [version française]
Detailed view PhD thesis
Université de Grenoble (23/09/2011), Thomas Lebarbe (Dir.)
Available versions:
Attached file list to this document: 
PDF
22774_ANDRA_ANI_2011_archivage.pdf(6.7 MB)
Immersion dans des documents scientifiques et techniques : unités, modèles théoriques et processus
Vanessa Andreani1

Cette thèse aborde la problématique de l'accès à l'information scientifique et technique véhiculée par de grands ensembles documentaires. Pour permettre à l'utilisateur de trouver l'information qui lui est pertinente, nous avons oeuvré à la définition d'un modèle répondant à l'exigence de souplesse de notre contexte applicatif industriel ; nous postulons pour cela la nécessité de segmenter l'information tirée des documents en plans ontologiques. Le modèle résultant permet une immersion documentaire, et ce grâce à trois types de processus complémentaires : des processus endogènes (exploitant le corpus pour analyser le corpus), exogènes (faisant appel à des ressources externes) et anthropogènes (dans lesquels les compétences de l'utilisateur sont considérées comme ressource) sont combinés. Tous concourent à l'attribution d'une place centrale à l'utilisateur dans le système, en tant qu'agent interprétant de l'information et concepteur de ses connaissances, dès lors qu'il est placé dans un contexte industriel ou spécialisé.
1:  LIDILEM - LInguistique et DIdactique des Langues Étrangères et Maternelles
Traitement automatique des langues – Ergonomie – Représentation des connaissances – Ontologies – Entités nommées

Immersion in scientific and technical documents : units, theoretical models and processes
This thesis adresses the issue of accessing scientific and technical information conveyed by large sets of documents. To enable the user to find his own relevant information, we worked on a model meeting the requirement of flexibility imposed by our industrial application context ; to do so, we postulated the necessity of segmenting information from documents into ontological facets. The resulting model enables a documentary immersion, thanks to three types of complementary processes : endogenous processes (exploiting the corpus to analyze the corpus), exogenous processes (using external resources) and anthropogenous ones (in which the user's skills are considered as a resource) are combined. They all contribute to granting the user a fundamental role in the system, as an interpreting agent and as a knowledge creator, provided that he is placed in an industrial or specialised context.
Natural language processing – Ergonomics – Knowledge representation – Ontologies – Named entities