Repérage et typage d'expressions temporelles pour l'annotation sémantique automatique de pages Web - Application au e-tourisme

Résumé : Cette thèse présente Adetoa, système dédié au repérage et à l'annotation sémantique automatique d'expressions temporelles dans des pages Web pour une application de e-tourisme. Une étude linguistique détaillée a permis de mettre en avant les caractéristiques et la complexité de l'expression de la temporalité dans les pages Web touristiques. Une étude sémiotique de ce type de pages a montré que les données y étaient organisées de manière fort variée, ne présentant aucune régularité, ce qui rend difficile voire parfois impossible l'automatisation de leur analyse. Ces analyses ont mené à l'élaboration d'un ensemble important de transducteurs (avec Unitex) pour les tâches de repérage et d'annotation des expressions temporelles, ce qui constitue une ressource pouvant être généralisée. De plus, d'autres informations du domaine touristique sont repérées : les objets du tourisme et les adresses. Des transducteurs de liage permettent de grouper toutes les informations concernant une même offre touristique. Pour l'annotation et l'intégration d'Adetoa à la chaîne de traitement du projet Eiffel, un schéma d'annotation et des règles de transformations ont été mis au point. Sans en être un calque direct, le schéma d'annotation suit une ontologie du tourisme. Il permet ainsi de rester au plus près des expressions linguistiques de manière à les caractériser finement. L'ontologie a ensuite pu être adaptée en conséquence, pour un meilleur stockage des données dans la base de connaissance qui lui correspond. L'évaluation d'Adetoa, présentée dans cette thèse, a montré des résultats satisfaisants aussi bien d'un point de vue théorique que pour cette application industrielle.
Type de document :
Thèse
Liste complète des métadonnées

Littérature citée [45 références]  Voir  Masquer  Télécharger

https://tel.archives-ouvertes.fr/tel-00530785
Contributeur : Stéphanie Weiser <>
Soumis le : vendredi 29 octobre 2010 - 19:48:53
Dernière modification le : jeudi 5 juillet 2018 - 01:26:45
Document(s) archivé(s) le : dimanche 30 janvier 2011 - 03:08:56

Fichier

Identifiants

  • HAL Id : tel-00530785, version 1

Collections

Citation

Stéphanie Weiser, Stéphanie Weiser. Repérage et typage d'expressions temporelles pour l'annotation sémantique automatique de pages Web - Application au e-tourisme. Linguistique. Université de Nanterre - Paris X, 2010. Français. ⟨tel-00530785⟩

Partager

Métriques

Consultations de la notice

1018

Téléchargements de fichiers

1212