Modeling and optimization of an online publishing application - TEL - Thèses en ligne Accéder directement au contenu
Thèse Année : 2022

Modeling and optimization of an online publishing application

Contribution à l’optimisation d’un processus de publication scientifique

Résumé

In recent years, the number of scientific articles increased constantly. In addition to publish, senior scientists are also asked to conduct peer review and be members of journal boards where they are in charge of making final decisions regarding new articles’ acceptance. We propose within this PhD thesis a set of tools to be used by authors, peer-reviewers and Editors-in-Chief with the purpose of automating parts of their activities. Those tools are based on two research topics : document comparison and Named Entity Recognition (NER).Regarding the document comparison, 12 existing XML diff algorithms were evaluated regarding their comparison capacities for JATS XMLdocuments. Most of those algorithms only support basic edit pattern detection. Due to that, a new XML diff algorithm called jats-diff and able to make abijection between author edits on one side and changes detected on their respective XML versions on the other side was developed, allowing the extraction of effective changes made by the authors. Regarding the NER, five deep-learning models were evaluated and the "review-annotation" model based on SciBERT was trained. Use of this model allows extracting of meaningful information from the review requests categorized as requested changes. Finally, the correlation of the effective changes provided by jats-diff and the requested changes provided by the "review-annotation" model was carriedout. This combined information will allow the Editor-in-Chief to assess the requested changes asked by the reviewer and the effective changes made by the authors with the purpose of making the final decision.
Le nombre d'articles scientifiques n'a cessé d'augmenter ces dernières années. En plus de devoir publier, les scientifiques sont également invités à examiner des articles par les pairs et sont membres de comités de revues où ils sont chargés de prendre des décisions concernant l'acceptation d'articles. Nous proposons dans cette thèse un ensemble d'outils à utiliser par les auteurs, les relecteurs et les éditeurs dans le but d'automatiser une partie de leurs activités. Ces outils sont basés sur deux domaines de recherche : la comparaison de documents et la reconnaissance d’entités nommées (NER). En ce qui concerne la comparaison de documents, 12 outils de comparaison XML existants ont été évalués quant à leurs capacités de comparer des articles. La plupart de ces outils ne prennent en charge que la détection de modifications de bas niveau, un nouvel algorithme de comparaison XML,appelé jats-diff, a été développé et permet de détecter les modifications effectuées par les auteurs lors de la révision de l'article. Quant au NER, cinq modèles d'apprentissage profond ont été évalués et le modèle "review-annotation" basé sur SciBERT a été entraîné. L'utilisation de ce modèle permet d'analyser les commentaires des relecteurs et d'extraire des informations significatives sur les corrections qui ont été demandées aux auteurs. Enfin, la corrélation des modifications effectuées par les auteurs (jats-diff) avec les informations sur les corrections demandées par les relecteurs(review-annotation) a été réalisée. Ces informations combinées permettront d'assister la prise de décision de l'éditeur dans la révision d’articles scientifiques.
Fichier principal
Vignette du fichier
2022MULH5450_these_CUCULOVIC.pdf (5.36 Mo) Télécharger le fichier
Origine : Version validée par le jury (STAR)

Dates et versions

tel-04082203 , version 1 (26-04-2023)

Identifiants

  • HAL Id : tel-04082203 , version 1

Citer

Milos Cuculovic. Modeling and optimization of an online publishing application. Automatic. Université de Haute Alsace - Mulhouse, 2022. English. ⟨NNT : 2022MULH5450⟩. ⟨tel-04082203⟩
64 Consultations
64 Téléchargements

Partager

Gmail Facebook X LinkedIn More