Extraction d'informations à partir de documents juridiques : application à la contrefaçon de marques - TEL - Thèses en ligne Access content directly
Theses Year : 2006

Information extraction from legal documents : application to trademark counterfeiting

Extraction d'informations à partir de documents juridiques : application à la contrefaçon de marques

Abstract

As part of our research is based on the extraction and analysis of knowledge from a documentary data source types that characterize legal counterfeit brand names. This discipline reflects perfectly all constraints belonging to the different areas involved in the context of knowledge extraction from documents: electronic documents, databases, statistics, artificial intelligence and man / machine interaction. However, the performance of these methods are closely related to the quality of the data used. In our research context, every decision is overseen by an editor (the magistrate) and depends heavily on the editorial context, limiting information extraction processes. So we are interested in decisions likely to bias learning materials. We see the foundations of them, determine their strategic importance and if necessary we offer tailored solutions to redirect the observed bias towards a better representation of documents. We offer a supervised exploratory approach to assess the quality of data involved, determining the properties skewing the quality of established knowledge and an interactive and collaborative platform modeling process leading to knowledge discovery in order to integrate effectively the expertise of the expert.
Le cadre de nos recherches repose sur l'extraction et l'analyse de connaissances à partir d'une source de données documentaire de type juridique caractérisant les contrefaçons de marques nominatives. Cette discipline reflète parfaitement toutes les contraintes appartenant aux différents domaines intervenant dans le cadre de l'extraction de connaissances à partir de documents : document électronique, bases de données, statistiques, intelligence artificielle et interaction homme/machine. Cependant, les performances de ces méthodes sont étroitement liées à la qualité des données utilisées. Dans notre contexte de recherche, chaque décision est supervisée par un rédacteur (le magistrat) et dépend étroitement du contexte rédactionnel, limitant les procédés d'extraction d'information. Nous nous intéressons donc aux décisions susceptibles de biaiser l'apprentissage des documents. Nous observons les fondements de celles-ci, déterminons leur importance stratégique et le cas échéant nous proposons des solutions adaptées afin de réorienter le biais observé vers une meilleure représentation des documents. Nous proposons une approche exploratoire supervisée pour évaluer la qualité des données impliquées, en déterminant les propriétés biaisant la qualité de la connaissance établie ainsi qu'une plate-forme interactive et collaborative de modélisation des processus conduisant à l'extraction de connaissances afin d'intégrer efficacement le savoir-faire de l'expert.

Domains

Other [cs.OH]
Fichier principal
Vignette du fichier
prenaux-these.pdf (1.94 Mo) Télécharger le fichier

Dates and versions

tel-00090673 , version 1 (01-09-2006)

Identifiers

  • HAL Id : tel-00090673 , version 1

Cite

Pierre Renaux. Extraction d'informations à partir de documents juridiques : application à la contrefaçon de marques. Autre [cs.OH]. Université de Caen, 2006. Français. ⟨NNT : ⟩. ⟨tel-00090673⟩
244 View
658 Download

Share

Gmail Facebook X LinkedIn More