Interroger le texte scientifique - TEL - Thèses en ligne Accéder directement au contenu
Hdr Année : 2016

Questioning scientific texts

Interroger le texte scientifique

Résumé

Textual documents are familiar and prominent information vehicles in our information society. With the advent of online platforms and social media, text is multi-faceted, embodied as web pages, blog posts, comments, tweets, tags, and so on. Readers who used to be passive consumers of information are nowadays also information producers. Interpersonal information flows weave online social networks spanning our relational circles and way beyond.In this context, a wide array of subtleties need to be incorporated into any models of information retrieval. These include the nature and format of the texts, the spatio-temporal contexts of the users, and their intentions (e.g., to inform, share, complement, criticise or correct). Part one of this dissertation synthesises my contributions to Information Retrieval. I modelled the above factors in order to assess their effects on searching text in the social media. My research programme developed ways of questioning texts in order to reveal information on their contents, authors and readers. Scientific texts were used because of the richness of their contents and their associated metadata. Part two of this dissertation presents my contributions to Scientometrics, namely the quantitative study of science and innovation. I explore scientific texts and their underlying networks (e.g., lexicons, references, authors, institutions) in order to reveal value-added knowledge that sheds light on how knowledge in science is created, communicated, and shared.This dissertation lays the groundwork for an interdisciplinary research programme in Computing, Scientometrics and the Sociology of Science. It envisions mining scientific literature in order to ease access to it (a link with Information Retrieval) as well eliciting levers behind the emergence and dynamics of social structures and knowledge in science (a link with Scientometrics).
Les documents textuels sont des vecteurs d’information familiers et incontournables de notre société de l’information. Avec l’essor des plateformes numériques et des médias sociaux, le texte se décline désormais en pages web, billets de blogs, commentaires, tweets et tags, entre autres. Auparavant consommateurs passifs, les lecteurs se muent à leur tour en producteurs de contenus. En résultent des échanges interpersonnels qui tissent des réseaux sociaux numériques s’étendant bien au-delà de nos cercles relationnels.Dans ce contexte, nature et format des textes, intentions de leurs auteurs (informer, rediffuser, critiquer, compléter, corriger, etc.), contexte spatio-temporel ainsi que véracité et fraîcheur variables des informations sont autant de subtilités à intégrer dans les modèles de recherche d’information. La première partie de ce mémoire présente une synthèse de résultats en recherche d’information visant à modéliser ces facteurs pour améliorer la pertinence des recherches sur des corpus textuels, notamment issus de médias sociaux. Le programme de recherche que je développe vise également à « interroger le texte » pour révéler des informations au sujet de son contenu, de ses auteurs et de ses lecteurs. Le texte scientifique a été choisi comme cible pour la richesse de son contenu et de ses méta- données. Ainsi, la deuxième partie du mémoire synthétise des résultats en scientométrie, terme désignant l’étude quantitative des sciences et de l’innovation. Il s’est agi de questionner des textes scientifiques et les réseaux sous-jacents (lexique, références, auteurs, institutions, etc.) pour faire émerger des connaissances à forte valeur ajoutée et apporter un éclairage sur la création et la diffusion des savoirs scientifiques.Les deux volets articulés dans ce mémoire concourent à définir un programme de recherche interdisciplinaire à la croisée de l’informatique, la scientométrie et la sociologie des sciences. Son ambition consiste à interroger le texte scientifique pour en améliorer l’accès (via la recherche d’information) tout en contribuant à éliciter les ressorts de la genèse et de l’évolution des mondes sociaux et des savoirs en sciences (via la scientométrie).
Fichier principal
Vignette du fichier
Memoire_HDR_Guillaume_Cabanac_2016.pdf (6.67 Mo) Télécharger le fichier
Presentation_HDR_Guillaume_Cabanac_2016.pdf (21.81 Mo) Télécharger le fichier
Loading...

Dates et versions

tel-01413878 , version 1 (11-12-2016)

Licence

Paternité - Pas d'utilisation commerciale - Pas de modification

Identifiants

  • HAL Id : tel-01413878 , version 1

Citer

Guillaume Cabanac. Interroger le texte scientifique. Réseaux sociaux et d'information [cs.SI]. Université Toulouse 3 - Paul Sabatier, 2016. ⟨tel-01413878⟩
857 Consultations
909 Téléchargements

Partager

Gmail Facebook X LinkedIn More