A document automatic indexing method based on the structural properties exploitation: application to a technical corpus
Une méthode d'indexation automatique des documents fondée sur l'exploitation de leurs propriétés structurelles : application à un corps technique
Résumé
Stratégie d'indexation automatique de textes en langue naturelle. Intérêts aux aspects structurels du document pour: ― la définition d'une stratégie globale d'indexation fondée sur l'exploitation de la structure logique du document, ainsi que d'éléments textuels particuliers (titres ...) ― la définition de termes d'indexation à partir de celle de syntagmes de la langue naturelle. Les termes d'indexation sont normalisés via une base de connaissances prédéfinie. Les principaux algorithmes utilisés sont présentés, ainsi que les résultats d'expérimentation sur un corpus technique (normes d'exploitation et de fonctionnement du NET).