Explorer, visualiser, décider : un paradigme méthodologique pour la production de connaissances à partir des big data - TEL - Thèses en ligne Accéder directement au contenu
Thèse Année : 2018

Explore, visualise, decide: a methodological paradigm for knowledge production based on Big Data Analysis

Explorer, visualiser, décider : un paradigme méthodologique pour la production de connaissances à partir des big data

Résumé

The aim of this Ph.D. thesis in philosophy of science was to answer a practical problem that arose while I was working as an analyst for a software company: how to produce valid knowledge by manipulating large amounts of data that I did not create, and that are not the result of a recognized scientific method? Using my field experience, I propose a methodological paradigm for the construction, exploration and interpretation of Big Data. By methodological paradigm, I mean a theoretical and practical framework that provides keys to developing a method adapted to the data and epistemic project under consideration. By drawing a distinction between the myth of big data and actual practices, I show how digital data are technically and epistemologically constructed from the footprints ("traces") left by individuals. This construction is based on a logic of constitution that requires an interpretative framework and an epistemic continuity between the data and the knowledge we seek to produce. The cultural sciences ("sciences de la culture") thus provide a necessary, but not sufficient, framework to ensure this continuity. Computation, embodied by data sciences and artificial intelligence, materializes and instruments this continuity at the cost of renouncing to be considered as an end in itself. The mediations of interpretation, narrative and software design materialize, show and contextualize the knowledge thus produced. Finally, this knowledge is legitimized by its ability to propose or facilitate decisions and actions.
L'enjeu de cette thèse de philosophie des sciences était de répondre à un problème pratique, qui s'est présenté à moi alors que je travaillais comme analyste sur des données massives chez un éditeur de logiciel : comment produire des connaissances valides en manipulant de grandes masses de données que je n'ai pas constituées et qui ne sont pas le fruit d'une méthode scientifique reconnue ? En m'appuyant sur mon expérience de terrain, je propose un paradigme méthodologique pour la construction, l'exploration et l'interprétation des données massives. Par paradigme méthodologique, on entend un cadre théorique et pratique qui fournit autant de clés pour développer une méthode adaptée aux données et au projet épistémique envisagés. En faisant la part du mythe des big data et des pratiques effectives, je montre comment les données numériques, toujours déjà manipulables, sont construites techniquement et épistémologiquement à partir des traces laissées par les individus et leurs médiations sur les supports informatiques. Cette construction s'appuie sur une logique de constitution qui requiert un cadre interprétatif et une continuité épistémique entre la donnée et les connaissances que l'on cherche à produire. Les sciences de la culture fournissent ainsi un cadre nécessaire, mais pas suffisant, à assurer cette continuité. Le calcul, incarné par les sciences des données et l'intelligence artificielle, actualise et instrumente cette continuité au prix du renoncement à s'envisager comme fin en soi. Ni le cadre théorique, ni le calcul, ne suffisent toutefois à rendre intelligibles les connaissances ainsi produites : c'est la médiation de l'interprétation, du récit et de la conception logicielle (ou design) qui matérialise, donne à voir et contextualise les connaissances ainsi produites. Ces dernières, enfin, ne sont pas légitimées par leur pur caractère véridictionnel, mais par leur capacité à proposer ou faciliter des décisions d'action, bien souvent en entreprise, elles-mêmes productrices de nouvelles traces numériques manipulables.
Fichier principal
Vignette du fichier
181218 - Texte complet - HD.pdf (4.24 Mo) Télécharger le fichier
Origine : Fichiers produits par l'(les) auteur(s)
Loading...

Dates et versions

tel-01960545 , version 1 (19-12-2018)

Identifiants

  • HAL Id : tel-01960545 , version 1

Citer

Eglantine Schmitt. Explorer, visualiser, décider : un paradigme méthodologique pour la production de connaissances à partir des big data. Histoire, Philosophie et Sociologie des sciences. Université de technologie de Compiègne, 2018. Français. ⟨NNT : ⟩. ⟨tel-01960545⟩
1466 Consultations
1687 Téléchargements

Partager

Gmail Facebook X LinkedIn More