Le traitement automatique des langues face à l'évolution des usages de la langue - TEL - Thèses en ligne Accéder directement au contenu
Hdr Année : 2023

Natural Language Processing Facing the Language Uses Evolution

Le traitement automatique des langues face à l'évolution des usages de la langue

Cyril Grouin

Résumé

In this habilitation thesis, I present the research I have conducted on language productions from speakers made on social networks. This habilitation thesis is organized into two main parts: first, the impact of speakers on their language, the latter being considered here as the object of study, and second, the impact of users on the tools and resources used in natural language processing. Due to cultural differences on the one hand, and technical and societal evolutions on the other hand (such as the use of French inclusive language), the NLP domain is in constant evolution in order to tackle this linguistic variability, which is representative of the individual diversity. We have considered the opportunity to study inferences for opinion mining in Chinese, as a complementary way to the identification of emotion/sentiment/opinion words. Social networks are a valid source of relevant testimonies in pharmacovigilance, for the detection of side effects or drug misuse, and in a pandemic context. While computer technology now makes it possible to encode more information, especially statistical information, and although gender stereotypes have been identified in current transformers models, our work combining morpho-syntactic information with vector representations confirms the complementary of linguistic information in several classical NLP tasks. The future scientific obstacles to be removed will come from the now more present imbrication of multimodality in language productions.
Dans ce manuscrit, je présente les recherches que j'ai menées sur les productions langagières des locuteurs d'une langue sur les réseaux sociaux. Mon manuscrit s'articule autour de deux angles d'analyse : l'impact des utilisateurs sur la langue, cette dernière étant alors envisagée comme objet d'étude, et l'impact des utilisateurs, au travers de leurs productions langagières, sur les outils et ressources utilisés pour le traitement automatique des langues. Face aux différences culturelles d'une part et aux évolutions techniques et sociétales d'autre part, telle que l'apparition du français inclusif, le traitement automatique des langues est lui-même en constante évolution pour faire face à cette variabilité linguistique, représentative de la diversité individuelle. Nous avons constaté l'opportunité d'étudier les inférences pour de la fouille d'opinion en chinois en complément des mots porteurs d'opinion/sentiment/émotion. Les réseaux sociaux constituent une source de témoignages pertinente en pharmacovigilance pour la détection des effets secondaires ou du mésusage médicamenteux, ou encore en contexte pandémique. Alors que l'informatique permet désormais d'encoder davantage d'informations, notamment d'ordre statistique, et bien que des stéréotypes de genre aient été identifiés dans les modèles transformers actuels, les travaux combinant des informations morpho-syntaxiques aux représentations vectorielles confirment la complémentarité des informations linguistiques dans plusieurs tâches classiques du TAL. Les prochains verrous scientifiques à lever viendront de l'imbrication désormais plus marquée de la multimodalité dans les productions langagières.
Fichier principal
Vignette du fichier
hdr_grouin_v5.pdf (1.99 Mo) Télécharger le fichier
Origine : Fichiers produits par l'(les) auteur(s)
Licence : CC BY ND - Paternité - Pas de modifications

Dates et versions

tel-04217062 , version 1 (25-09-2023)

Licence

Paternité - Pas de modifications

Identifiants

  • HAL Id : tel-04217062 , version 1

Citer

Cyril Grouin. Le traitement automatique des langues face à l'évolution des usages de la langue. Informatique et langage [cs.CL]. Université Paris-Saclay, 2023. ⟨tel-04217062⟩
64 Consultations
43 Téléchargements

Partager

Gmail Facebook X LinkedIn More