Approche hybride pour le résumé automatique de textes. Application à la langue arabe. - TEL - Thèses en ligne Accéder directement au contenu
Thèse Année : 2012

Hybrid approach for the automatic abstract of texts. Application with the Arab language.

Approche hybride pour le résumé automatique de textes. Application à la langue arabe.

Mohamed Hedi Maaloul
  • Fonction : Auteur
  • PersonId : 933099

Résumé

This thesis falls within the framework of Natural Language Processing. The problems of automatic summarization of Arabic documents which was approached, in this thesis, are based on two points. The first point relates to the criteria used to determine the essential content to extract. The second point focuses on the means to express the essential content extracted in the form of a text targeting the user potential needs. In order to show the feasibility of our approach, we developed the "L.A.E" system, based on a hybrid approach which combines a symbolic analysis with a numerical processing. The evaluation results are encouraging and prove the performance of the proposed hybrid approach.These results showed, initially, the applicability of the approach in the context of mono documents without restriction as for their topics (Education, Sport, Science, Politics, Interaction, etc), their content and their volume. They also showed the importance of the machine learning in the phase of classification and selection of the sentences forming the final extract.
Cette thèse s'intègre dans le cadre du traitement automatique du langage naturel. La problématique du résumé automatique de documents arabes qui a été abordée, dans cette thèse, s'est cristallisée autour de deux points. Le premier point concerne les critères utilisés pour décider du contenu essentiel à extraire. Le deuxième point se focalise sur les moyens qui permettent d'exprimer le contenu essentiel extrait sous la forme d'un texte ciblant les besoins potentiels d'un utilisateur. Afin de montrer la faisabilité de notre approche, nous avons développé le système "L.A.E", basé sur une approche hybride qui combine une analyse symbolique avec un traitement numérique. Les résultats d'évaluation de ce système sont encourageants et prouvent la performance de l'approche hybride proposée. Ces résultats, ont montré, en premier lieu, l'applicabilité de l'approche dans le contexte de documents sans restriction quant à leur thème (Éducation, Sport, Science, Politique, Reportage, etc.), leur contenu et leur volume. Ils ont aussi montré l'importance de l'apprentissage dans la phase de classement et sélection des phrases forment l'extrait final.
Fichier principal
Vignette du fichier
These.pdf (6.83 Mo) Télécharger le fichier
Origine : Fichiers produits par l'(les) auteur(s)
Loading...

Dates et versions

tel-00756111 , version 1 (22-11-2012)
tel-00756111 , version 2 (25-09-2013)
tel-00756111 , version 3 (14-10-2017)

Identifiants

  • HAL Id : tel-00756111 , version 3

Citer

Mohamed Hedi Maaloul. Approche hybride pour le résumé automatique de textes. Application à la langue arabe.. Traitement du texte et du document. Université de Provence - Aix-Marseille I, 2012. Français. ⟨NNT : ⟩. ⟨tel-00756111v3⟩
1199 Consultations
3783 Téléchargements

Partager

Gmail Facebook X LinkedIn More