Reconnaissance d'implications textuelles à forte composante linguistique - TEL - Thèses en ligne Accéder directement au contenu
Thèse Année : 2008

Linguistic based computational treatment of textual entailment recognition

Reconnaissance d'implications textuelles à forte composante linguistique

Résumé

In this thesis, I investigate how lexical resources based on the organisation of lexical knowledge in classes which share common (syntactic, semantic, etc.) features support natural language processing and in particular symbolic recognition of textual entailment. First, I present a robust and wide coverage approach to lexico-structural verb paraphrase recognition based on Levin's (1993) classification of English verbs. Then, I show that by extending Levin's framework to general inference patterns, a classification of English adjectives can be obtained that compared with previous approaches, provides a more fine grained semantic characterisation of their inferential properties. Further, I develop a compositional semantic framework to assign a semantic representation to adjectives based on an ontologically promiscuous approach \citep{Hobbs85} and thereby supporting first order inference for all types of adjectives including extensional ones. Finally, I present a test suite for adjectival inference I developed as a resource for the evaluation of computational systems handling natural language inference.
Dans cette thèse, j'étudie la manière dont les ressources lexicales basées sur l'organisation de la connaissance lexicale dans des classes qui partagent des propriétés communes (syntactiques, sémantiques, etc.) permettent le traitement automatique de la langue naturelle et en particulier la reconnaissance symbolique d'implications textuelles. Tout d'abord, je présente une approche robuste et à large couverture sur la reconnaissance de paraphrases verbales lexico-structurelle basée sur la classification de verbes anglais par Levin. Puis, je montre qu'en étendant le cadre proposé par Levin pour traiter les modèles d'inférence généraux, on obtient une classification d'adjectifs anglais qui, comparée à des approches antérieures, propose une caractérisation sémantique à grain plus fin de leurs propriétés déductives. De plus, je développe un cadre sémantique compositionnel pour assigner à des adjectifs une représentation sémantique sur la base d'une approche ontologiquement variée (Hobbs85) et qui permet ainsi l'inférence de premier ordre pour tous les types d'adjectifs, y compris les adjectifs extensionnels. Enfin, je présente un corpus de test pour l'inférence basée sur les adjectifs que j'ai développée comme ressource pour l'évaluation de systèmes de traitement automatique de l'inférence de la langue naturelle.
Fichier principal
Vignette du fichier
dissE.pdf (1016.5 Ko) Télécharger le fichier
Loading...

Dates et versions

tel-00338608 , version 1 (13-11-2008)

Identifiants

  • HAL Id : tel-00338608 , version 1

Citer

Marilisa Amoia. Reconnaissance d'implications textuelles à forte composante linguistique. Informatique [cs]. Universität des Saarlandes Saarbrücken, 2008. Français. ⟨NNT : ⟩. ⟨tel-00338608⟩
159 Consultations
518 Téléchargements

Partager

Gmail Facebook X LinkedIn More