Skip to Main content Skip to Navigation
Theses

Detection of automatically generated texts

Résumé : Le texte généré automatiquement a été utilisé dans de nombreuses occasions à des buts différents. Il peut simplement passer des commentaires générés dans une discussion en ligne à une tâche beaucoup plus malveillante, comme manipuler des informations bibliographiques. Ainsi, cette thèse introduit d'abord différentes méthodes pour générer des textes libres ayant trait à un certain sujet et comment ces textes peuvent être utilisés. Par conséquent, nous essayons d'aborder plusieurs questions de recherche. La première question est comment et quelle est la meilleure méthode pour détecter un document entièrement généré.Ensuite, nous irons un peu plus loin et montrer la possibilité de détecter quelques phrases ou un petit paragraphe de texte généré automatiquement en proposant une nouvelle méthode pour calculer la similarité des phrases en utilisant leur structure grammaticale. La dernière question est comment détecter un document généré automatiquement sans aucun échantillon, ceci est utilisé pour illustrer le cas d'un nouveau générateur ou d'un générateur dont il est impossible de collecter des échantillons dessus.Cette thèse étudie également l'aspect industriel du développement. Un aperçu simple d'un flux de travail de publication d'un éditeur de premier plan est présenté. À partir de là, une analyse est effectuée afin de pouvoir intégrer au mieux notre méthode de détection dans le flux de production.En conclusion, cette thèse a fait la lumière sur de multiples questions de recherche importantes concernant la possibilité de détecter des textes générés automatiquement dans différents contextes. En plus de l'aspect de la recherche, des travaux d'ingénierie importants dans un environnement industriel réel sont également réalisés pour démontrer qu'il est important d'avoir une application réelle pour accompagner une recherche hypothétique.
Document type :
Theses
Complete list of metadatas

Cited literature [71 references]  Display  Hide  Download

https://tel.archives-ouvertes.fr/tel-01919207
Contributor : Abes Star :  Contact
Submitted on : Monday, November 12, 2018 - 11:52:06 AM
Last modification on : Friday, July 3, 2020 - 4:46:51 PM
Document(s) archivé(s) le : Wednesday, February 13, 2019 - 1:59:19 PM

File

NGUYEN_MINH_TIEN_2018_diffusio...
Version validated by the jury (STAR)

Identifiers

  • HAL Id : tel-01919207, version 1

Collections

Citation

Minh Tien Nguyen. Detection of automatically generated texts. Document and Text Processing. Université Grenoble Alpes, 2018. English. ⟨NNT : 2018GREAM025⟩. ⟨tel-01919207⟩

Share

Metrics

Record views

223

Files downloads

146