Mise au point d'un formalisme syntaxique de haut niveau pour le traitement automatique des langues

Résumé : La linguistique informatique a pour objet de construire un modèle formel des connaissances linguistiques, et d’en tirer des algorithmes permettant le traitement automatique des langues. Pour ce faire, elle s’appuie fréquemment sur des grammaires dites génératives, construisant des phrases valides par l’application successive de règles de réécriture. Une approche alternative, basée sur la théorie des modèles, vise à décrire la grammaticalité comme une conjonction de contraintes de bonne formation, en s’appuyant sur des liens profonds entre logique et automates pour produire des analyseurs efficaces. Notre travail se situe dans ce dernier cadre. En s’appuyant sur plusieurs résultats existants en informatique théorique, nous proposons un outil de modélisation linguistique expressif, conçu pour faciliter l’ingénierie grammaticale. Celui-ci considère dans un premier temps la structure abstraite des énoncés, et fournit un langage logique s’appuyant sur les propriétés lexicales des mots pour caractériser avec concision l’ensemble des phrases grammaticalement correctes. Puis, dans un second temps, le lien entre ces structures abstraites et leurs représentations concrètes (en syntaxe et en sémantique) est établi par le biais de règles de linéarisation qui exploitent la logique et le lambda-calcul. Par suite, afin de valider cette approche, nous proposons un ensemble de modélisations portant sur des phénomènes linguistiques divers, avec un intérêt particulier pour le traitement des langages présentant des phénomènes d’ordre libre (c’est-à-dire qui autorisent la permutation de certains mots ou groupes de mots dans une phrase sans affecter sa signification), ainsi que pour leur complexité algorithmique.
Type de document :
Thèse
Informatique. Université de Bordeaux, 2015. Français. 〈NNT : 2015BORD0330〉
Liste complète des métadonnées

https://tel.archives-ouvertes.fr/tel-01267716
Contributeur : Abes Star <>
Soumis le : jeudi 4 février 2016 - 17:54:06
Dernière modification le : jeudi 11 janvier 2018 - 06:20:17
Document(s) archivé(s) le : samedi 12 novembre 2016 - 09:58:30

Fichier

KIRMAN_JEROME_2015.pdf
Version validée par le jury (STAR)

Identifiants

  • HAL Id : tel-01267716, version 1

Collections

Citation

Jerome Kirman. Mise au point d'un formalisme syntaxique de haut niveau pour le traitement automatique des langues. Informatique. Université de Bordeaux, 2015. Français. 〈NNT : 2015BORD0330〉. 〈tel-01267716〉

Partager

Métriques

Consultations de la notice

364

Téléchargements de fichiers

241