P. Arnould and M. Jacquemot, Guide de bonnes pratiques : Gestion et valorisation des données de la recherche, 2016.

K. J. Arrow, Economic Welfare and the Allocation of Resources for Invention, The Rate and Direction of Inventive Activity: Economic and Social Factors, pp.609-635, 1962.

B. Arruabarrena, G. Kembellec, and G. Chartron, Data littératie & SHS : développer des compétences pour l'analyse des données, pp.14-15, 2019.

C. Awre, J. Baxter, B. Clifford, J. Colclough, A. Cox et al., Research Data Management as a "wicked problem, Library Review, vol.64, pp.356-71, 2015.

M. Bates,

J. , Information and knowledge: an evolutionary framework for information science, Information Research, vol.10, issue.4, p.239, 2005.

N. Becard, C. Castets-renard, G. Chassang, M. Dantant, L. Freyt-caffin et al., Ouverture des données de recherche. Guide d'analyse du cadre juridique en France. Ministère de l'Enseignement supérieur, de la Recherche et de l'Innovation, 2017.

. Bensaude and B. Vincent, The politics of buzzwords at the interface of technoscience, market and society: The case of "public engagement in science, Public Understanding of Science, vol.23, issue.3, pp.238-53, 2014.

S. Bernecker and F. Dretske, Knowledge: Readings in contemporary epistemology, 2000.

D. Bertaux, L'approche biographique : sa validité méthodologique, ses potentialités'. Cahiers internationaux de sociologie, pp.197-225, 1980.

C. L. Borgman, The conundrum of sharing research data', Journal of the American Society for Information Science and Technology, vol.63, issue.6, pp.1059-78, 2012.

C. L. Borgman, Big data, little data, no data: scholarship in the networked world, 2015.

C. L. Borgman, P. T. Darch, A. E. Sands, and M. S. Golshan, The durability and fragility of knowledge infrastructures: Lessons learned from astronomy, Proceedings of the Association for Information Science and Technology, vol.53, pp.1-10, 2016.

J. Bouchez, Autour de « l'économie du savoir » : ses composantes, ses dynamiques et ses enjeux, Savoirs, vol.34, issue.1, pp.9-45, 2014.

P. Bourdieu, La spécificité du champ scientifique et les conditions sociales du progrès de la raison, Sociologie et sociétés, vol.7, issue.1, pp.91-118, 1975.

E. Broudoux, Dispositifs info-communicationnels numériques : éditorialisation et autorité. Habilitation à diriger des recherches, 2018.

I. Bruno, À vos marques®, prêts... cherchez ! La stratégie européenne de Lisbonne, vers un marché de la recherche, 2008.

I. Bruno, S. Grazulis, J. R. Helliwell, S. N. Kabekkodu, B. Mcmahon et al., Crystallography and Databases, Data Science Journal, vol.16, issue.38, pp.1-17, 2017.

M. K. Buckland, Information as thing', Journal of the American Society for Information Science, vol.42, issue.5, pp.351-60, 1991.

M. Byrne, Making Progress Toward Open Data: Reflections on Data Sharing at PLOS ONE'. PLOS Blogs, 2017.

F. Cabrera, Les données de la recherche en sciences humaines et sociales : enjeux et pratiques. Enquête exploratoire. Mémoire d'études de l'INTD, Conservatoire National des Arts et Métiers, 2014.

S. Cacaly, Dictionnaire encyclopédique de l'information et de la documentation, 1997.

. Calzada, J. Prado, and M. A. Marzal, Incorporating data literacy into information literacy programs: core competencies and contents, Libri, vol.63, issue.2, pp.123-134, 2013.

A. Cartier, M. Moysan, and N. Reymonet, Réaliser un plan de gestion de données : guide de rédaction, 2015.

G. Chartron, Scénarios prospectifs pour l'édition scientifique, Hermes, La Revue, vol.57, issue.2, pp.123-132, 2010.

G. Chartron, Stratégie, politique et reformulation de l'open access'. Revue française des sciences de l'information et de la communication, 2016.

G. Chartron, L'Open science au prisme de la Commission européenne'. Education et sociétés, N°, vol.41, issue.1, pp.177-93, 2018.

M. Dacos and P. Mounier, Humanités numériques : État des lieux et positionnement de la recherche française dans le contexte international. Rapport de recherche, 2015.

M. Deboin, Découvrir de nouveaux métiers liés aux données de la recherche, 2018.

C. Delay-artous, Où sont les données de la recherche ? Essai de cartographie, Systèmes d'organisation des connaissances et humanités numériques. Actes du 10ème colloque ISKO France 2015. Londres: ISTE Editions, pp.187-203, 2017.

J. Denis and D. Pontille, Travailleurs de l'écrit, matières de l'information'. Revue d'anthropologie des connaissances, vol.6, pp.1-20, 2012.

H. Dillaerts, Ouverture et partage des résultats de la recherche dans l'économie de la connaissance européenne : quelle(s) liberté(s) de circulation pour, 2017.

, Communication & management, issue.14, pp.39-54

S. Duchesne and G. Garcia, beQuali : une archive qualitative au service des sciences sociales, L'Harmattan, pp.35-56, 2014.
URL : https://hal.archives-ouvertes.fr/halshs-00922690

P. N. Edwards, Computer Models, Climate Data, and the Politics of Global Warming, 2010.

L. Floridi, Semantic Conceptions of Information, The Stanford Encyclopedia of Philosophy, 2005.

D. Foray and B. Lundvall, Une introduction à l'économie fondée sur la connaissance, 1997.

, Économie de la connaissance et des organisations. Entreprises, territoires, réseaux. Paris: L'Harmattan, pp.16-37

R. Gaillard, De l'Open data à l'Open research data : quelle(s) politique(s) pour les données de recherche ? Mémoire de fin d'étude du diplôme de conservateur, Ecole Nationale Supérieure des Sciences de l'Information et des Bibliothèques, 2014.

S. Goëta, Instaurer des données, instaurer des publics : une enquête sociologique dans les coulisses de l'open data, 2016.

S. Goëta, Données recherchent publics" : les politiques d"open data à l"épreuve de la réutilisation, pp.137-54, 2018.

W. O. Hagstrom, The Scientific Community, 1965.

S. O. Hansson, Les incertitudes de la société du savoir'. Revue internationale des sciences sociales, vol.171, pp.43-51, 2002.

S. Harnad, Publicly Retrievable FTP Archives for Esoteric Science and Scholarship: A Subversive Proposal, Network Services Conference, 1994.

T. Hey, S. Tansley, and K. Tolle, The Fourth Paradigm: Data-Intensive Scientific Discovery, 2009.

F. Ibekwe-sanjuan and F. Paquienséguy, Big Data -Open Data : Quelles valeurs ? Quels enjeux ? Actes du colloque 'Document numérique et société, pp.15-29, 2015.

E. S. Lander, L. M. Linton, B. Birren, C. Nusbaum, M. C. Zody et al., Initial sequencing and analysis of the human genome', Nature, vol.409, issue.6822, pp.860-921, 2001.

B. Latour, Le métier de chercheur : regard d'un anthropologue. Une conférencedébat à l'INRA, INRA Editions, 2001.

B. Latour and S. Woolgar, La vie de laboratoire. La production des faits scientifiques, 1979.
URL : https://hal.archives-ouvertes.fr/hal-02057284

F. Latrive, Les Barbares du Bazar : Une introduction aux faubourgs de la nouvelle économie, pp.11-19, 2000.

C. Lejeune, Manuel d'analyse qualitative. Analyser sans compter ni classer, 2014.

S. Leonelli, Integrating data to acquire new knowledge: Three modes of integration in plant science, Studies in History and Philosophy of Biological and Biomedical Sciences, vol.44, issue.4, pp.503-517, 2013.

S. Leonelli, Why the Current Insistence on Open Access to Scientific Data? Big Data, Knowledge Production, and the Political Economy of Contemporary Biology, Technology and Society, vol.33, issue.1-2, pp.6-11, 2013.

S. Leonelli, What Counts as Scientific Data? A Relational Framework, Philosophy of Science, vol.82, issue.5, pp.810-831, 2015.

V. Liquète, Présentation générale : Formes et enjeux de la médiation, Médiations. Paris : CNRS Éditions, pp.9-31, 2010.

F. Machlup, The Production and Distribution of Knowledge in the United States, 1962.

M. Malingre, M. Mignon, C. Pierre, and A. Serres, Construction(s) et contradictions des données de recherche en SHS'. Recherche d'information, document et web sémantique, pp.19-21, 2019.

L. H. Marcial and B. M. Et-hemminger, Scientific data repositories on the Web: An initial survey', Journal of the American Society for Information Science and Technology, vol.61, issue.10, pp.2029-2077, 2010.

S. Martin, M. Foulonneau, S. Turki, and M. Ihadjadene, Risk Analysis to Overcome Barriers to Open Data, Electronic Journal of e-Government, vol.11, issue.1, pp.348-359, 2013.
URL : https://hal.archives-ouvertes.fr/hal-02116316

E. Marzolf, Pour ouvrir la science, il ne faut pas contraindre, mais s'appuyer sur la force des usages existants, 2019.

L. Maurel, Le statut juridique des données de la recherche : entre droit des bases de données et données publiques'. Blog S.I.Lex, 2015.

L. Maurel, Données personnelles et recherche scientifique : quelle articulation dans le RGPD, Blog S.I.Lex, 2018.

L. Maurel, La réutilisation des données de la recherche après la loi pour une République numérique, La diffusion numérique des données en SHS. Guide de bonnes pratiques éthiques et juridiques, 2018.

M. Mauss, Essai sur le don : forme et raison de l'échange dans les sociétés archaïques, 2007.

A. Mayère, Pour une économie de l'information, 1990.

R. K. Merton, The Sociology of Science. Theoretical and Empirical Investigations, 1973.

D. Nicholas, B. Rodríguez-b--ravo, A. Watkinson, and C. Boukacem-z--eghmouri,

E. Herman, J. Xu, A. Abrizah, and M. ?wigo?, Early career researchers and their publishing and authorship practices, Learned Publishing, vol.30, issue.3, pp.205-217, 2017.
URL : https://hal.archives-ouvertes.fr/hal-01972324

T. O'reilly, Government As a Platform, 2010.

I. Pasquetto, From Open Data to Knowledge Production: Biomedical Data Sharing and Unpredictable Data Reuses, 2018.

V. Peugeot, L'ouverture des données publiques : convergence ou malentendu politique ?' In: B. STIEGLER (dir.). Confiance, croyance, crédit dans les mondes industriels. Limoges: FYP Editions, 2012.

G. E. Pinson and V. Sala-pala, Peut-on vraiment se passer de l'entretien en sociologie de l'action publique ?'. Revue francaise de science politique, vol.57, pp.555-97, 2007.
URL : https://hal.archives-ouvertes.fr/halshs-00393046

V. Rebouillat, Expanding Perspectives on Open Science: Communities, Cultures and Diversity in Concepts and Practices, pp.174-181, 2017.

V. Rebouillat, Les données scientifiques face aux enjeux de la recherche en Sciences, Technologie et Médecine : enquête exploratoire à l'Université de Strasbourg', vol.52

V. Rebouillat and G. Chartron, Services de gestion et de partage des données de recherche : ce qu'en pensent les chercheurs'. 12 ème colloque international d'ISKO-France, Montpellier, 9-11 octobre, 2019.

N. Reymonet, M. Moysan, A. Cartier, and R. Délémontez, Réaliser un plan de gestion de données « FAIR » : modèle. Version 2, 2018.

H. W. Rittel and M. M. Webber, Dilemmas in a general theory of planning, Policy Sciences, vol.4, issue.2, pp.155-69, 1973.

H. E. Roosendaal, K. Zalewska-kurek, and P. Geurts, Scientific publishing: from vanity to strategy, 2010.

D. Rosenberg, Data before the Fact'. In: L. GITELMAN (dir.). 'Raw Data' Is an Oxymoron, pp.15-40, 2013.

J. Schöpfel, Vers une nouvelle définition de la littérature grise'. Cahiers de la Documentation, vol.66, pp.14-24, 2012.

J. Schöpfel, Hors norme ? Une approche normative des données de la recherche'. Revue Communication, Organisation, 2018.

J. Schöpfel, Vers une culture de la donnée en SHS, 2018.

J. Schöpfel, E. Kergosien, and H. Prost, Pour commencer, pourriez-vous définir 'données de la recherche, Une tentative de réponse'. Colloque INFORSID, 2017.

J. Schöpfel, H. Prost, and V. Rebouillat, Research Data in Current Research Information Systems, Procedia Computer Science, vol.106, pp.305-320, 2017.

S. Cloud and . Group, Priorities for the European Open Science Cloud. White paper, 2018.

M. D. Wilkinson, M. Dumontier, I. J. Aalbersberg, G. Appleton, M. Axton et al., The FAIR Guiding Principles for scientific data management and stewardship, 2016.

H. Yu and D. G. Robinson, The New Ambiguity of "Open Government, Discourse 158, vol.59, 2012.

C. Zins, Conceptual approaches for defining data, information, and knowledge', Journal of the American Society for Information Science and Technology, vol.58, issue.4, pp.479-93, 2007.

S. Sources and A. Recherche, Plan d'action, 2018.

A. Recherche, Appel FLASH Science ouverte : pratiques de recherche et données ouvertes, 2019.

, Amsterdam Call for Action on Open Science, 2016.

, Berlin Declaration on Open Access to Knowledge in the Sciences and Humanities, 2003.

, Budapest Open Access Initiative, 2002.

. Commission-européenne, Croissance, compétitivité, emploi : les défis et les pistes pour entrer dans le XXIe siècle. Livre blanc, 1993.

. Commission-européenne, Communication de la Commission au Conseil, au Parlement européen, au Comité économique et social et au Comité des régions : Vers un espace européen de la recherche, 2000.

. Commission-européenne, Communication de la Commission au Parlement européen, au Conseil et Comité économique et social européen sur l'information scientifique à l'ère numérique : accès, diffusion et préservation, 2007.

M. Sources, . De-l'enseignement, D. Supérieur, and . De-l'innovation, , 2016.

, Stratégie nationale des infrastructures de recherche, 2016.

M. De-l'enseignement, D. Supérieur, and . De-l'innovation, Plan national pour la science ouverte, 2018.

M. De-l'enseignement, D. Supérieur, and . De-l'innovation, , 2018.

, Stratégie nationale des infrastructures de recherche, 2018.

. National and . Board, Long-Lived Digital Data Collections: Enabling Research and Education in the 21st Century, National Science Foundation, 2005.

B. Obama, Memorandum for the Heads of Executive Departments and Agencies, 2009.

. Office, . Management, and . Budget, Circulaire A-110, amendée le 30 septembre 1999, 1993.

, Open Government Data Principles, 2007.

. Organisation-de-coopération, . De, and . Économiques, La mesure des activités scientifiques en techniques : méthode-type proposée pour les enquêtes sur la recherche et le développement expérimental, 1975.

«. Aux and . Inventeurs, est-à-dire à vous, les chercheurs ? [>R2]: Alors, non. « Inventeur » c'est inventeur au sens juridique du terme

, Donc un enseignant-chercheur ou un chercheur ? [>R2]: Pas forcément. C'est quelqu'un qui a eu une activité inventive. C'est-à-dire que le résultat final n'aurait pas pu se faire

, Comment peut-on le déterminer ?

. Oui and . Compliqué, Et donc, généralement, ce sont les chefs les inventeurs. A moins que l'étudiant ou le post-doc ait eu une idée particulière, qui témoigne que, sans cette idée, on n'aurait pas pu faire cette molécule. Là, vous pouvez témoigner de votre inventivité, Est-ce que vous conserverez toutes les données à la fin du projet ? Le fait qu'il y ait des brevets vous oblige-t-il à?? [>R2]: Non. A partir du moment où vous avez un brevet qui est déposé

, Une fois que le brevet vous est accordé, pendant 20 ans vous avez l'exclusivité pour exploiter commercialement cette découverte. Alors, je ne sais pas quelle est la législation? Je sais, par exemple, qu'il y a Annexes une législation pour les hôpitaux : dès que vous avez des données de patients, la loi vous impose de conserver ces données pendant 40 ans (il me semble mais je ne suis pas sûr), Il n'y a pas besoin d'autres données ? [>R2]: Non. En fait, vous avez la paternité du brevet pendant 20 ans

A. ,

, Quelles sont les autres données ?

, Il y a les données brutes. C'est-à-dire, par exemple, ce que va vous cracher une machine. Ce sont des fichiers Excel. Ce sont des données brutes

, On les garde pendant la durée du projet et, une fois que le projet est terminé, on peut éventuellement les supprimer. Ces données brutes, il faut les analyser. Soit c'est l'homme qui le fait, soit c'est une machine, qui va analyser ces résultats et vous dire ce que vous voulez y voir. Ce qu'on obtient, ce sont des données analysées. Ensuite, il y a les données analysées dépouillées, Ces données brutes, vous ne les gardez pas

, Vous avez interprété

, On a interprété les résultats. Souvent, ce sont des publications. Mais tout n'est pas publié. On garde également les données dans les cahiers de laboratoire

. Oui, vous avez aussi des cahiers de laboratoire ? Ils sont au format papier ? [>R2]: Non. On a les deux

, Qui vous les fournit ?

, Il y a tout un tas de fournisseurs. En fait, il y a une start-up alsacienne qui s'appelle

. Novalix, qui fournit des cahiers de laboratoire électroniques. C'est un ancien du labo. Toutes nos expériences, tout ce que je vous ai montré là

. En-fait, On a la date, les signatures ; on sait qu'on a tels résultats, qu'on a fait cette Annexes access, qu'il y ait également les moyens financiers pour supporter cette politique. Ce qui n'existe pas vraiment, Politiques des éditeurs en matière de données scientifiques [>R1]: Est-ce que les éditeurs scientifiques, chez lesquels vous publiez, vous demandent parfois d'associer à la publication les données liées

. :-c'est-obligatoire-ou-c'est and . Conseillé, Ça dépend. Par exemple, ça peut être quand vous publiez la structure d'une nouvelle

, Pourquoi doit-on déposer la structure au préalable dans la base de données publique

, Comment s'appelle cette base ?

A. , il y a plein de bases de données. Il y en a une qui s'appelle la Protein Data Bank

, La Protein Data Bank est une base de données qui rassemble l'ensemble des structures de protéines libres d'exploitation dans le monde, Enfin, « libres »? Les structures sont libres

, qui est le code d'accès à cette base de données. Donc, si votre structure n'a pas été enregistrée par cette base de données en amont, votre publication ne sera pas acceptée. Ou bien, si c'est du code informatique, par exemple, les éditeurs peuvent vous demander de fournir une copie du code informatique, Quand vous voulez publier une structure, vous êtes obligés dans votre publication de donner un code

, Et ça arrive que le logiciel doive être en accès libre, Vous même développez parfois des logiciels ? [>R2]: Oui, on développe aussi des logiciels

S. Puisque, Tout ça est très calibré. Par exemple, toutes les publications du groupe Nature sont calibrées au caractère près : votre abstract doit faire 150 caractères, pas un de plus ; vous avez droit à quatre figures, pas plus. C'est vraiment très calibré. Donc, quand vous avez de grosses données, tout est mis dans les matériels supplémentaires. La personne qui s'y intéresse va aller voir dans les matériels supplémentaires. Alors, c'est sûr, l'open access, c'est intéressant en SHS, vous avez aussi le risque que des sociétés privées pillent votre travail et vous pilonnent vos logiciels

, Oui, il vous faut protéger en amont les résultats

, Parcours professionnel [>R1]: J'aurais une dernière question, peut-être plus personnelle. Dans quel établissement avez-vous effectué votre formation universitaire

. Ensuite,

, Et ensuite vous êtes devenu chercheur ici ?

. Ensuite, Et ce n'est qu'avec l'expérience qu'on l'acquiert. Ça n'est pas facile, parce que maintenant vous avez des outils, vous avez des données d'imagerie/de microscopie électronique, des trucs extraordinaires. Ça n'est pas pour autant que c'est pertinent pour le problème qui vous intéresse. Pas forcément. Donc il faut toujours se replacer dans le contexte : « est-ce que cette image m'apporte une information ? Est-ce que c'est vérifié, quantifié, reproductible dans le contexte qui m'intéresse ? ». Et ça n'est pas toujours évident

, Oui. C'était vraiment intéressant de voir comment fonctionne un projet avec de la valorisation économique derrière

, Tout ça se professionnalise, comme on le ferait si on était dans une start-up, avec les mêmes pratiques de communication (pas simplement vers l'extérieur mais aussi en interne). Ça ne se fait plus de manière empirique, comme on le faisait dans les labos il y a vingt ans. Ça se rationalise. C'est de la gestion de projet, qui se professionnalise, Disons que ça nous oblige à avoir des pratiques légèrement différentes des pratiques académiques

, Et parce qu'à partir du moment où on va vouloir valoriser ces résultats, qu'on va trouver un partenaire industriel qui s'intéresse à ces résultats, il va falloir que les vents, l'industriel va vous dire : « bon, vous êtes bien gentils mais au revoir ». C'est du « reporting ». Est-ce que les données sont bien archivées ? Est-ce qu'aucune étape n'a été manquée ? Donc vous avez un cahier des charges qui vous impose tout ça en Annexes, Pour quelle raison ? Parce qu'il y a des enjeux économiques ? [>R2]: Oui, aussi, p.R

, Elle fait partie d'un dispositif particulier ?

N. :-c'est-l'équipe-inserm and . Paris,

, Un premier questionnaire portant sur leurs habitudes (alimentaires, etc.), sur leur quartier de vie, sur leur ressenti par rapport à leur quartier, sur leur santé physique et mentale, sur ce qu'elles font tous les jours, sur leurs déplacements, Que faites-vous faire aux personnes qui acceptent de participer ? [>R2]: Elles répondent à deux questionnaires

. Ensuite, Ensuite on donne aux personnes un second questionnaire, qui est un questionnaire veritas, dans lequel les personnes vont décrire les trajets qu'elles ont faits durant cette semaine ou de manière générale. Ça nous permet de voir un peu dans quels endroits elles vont, comment elles y vont, avec qui, qui elles rencontrent là-bas, elles vont porter des capteurs, de même que les membres de leur foyer

, En quoi consiste l'accélérométrie ?

. :-l'accélérométrie-ce-sont-des-capteurs-de-niveau and . De-mouvement--un-peu-comme-une-manette-wii, Si elle est chez elle, on peut savoir comment elle est : est-ce qu'elle est assise, est-ce qu'elle est debout, allongée, combien de temps par jour ? Donc tout ça va nous permettre de connaître toute l'activité des personnes et de lier la mobilité à ce type d, On connaît un peu tout ça

, Quel était le troisième type de capteur ?

, Sur le site de l'ANR, j'ai vu qu'il y avait quatre laboratoires associés sur le projet et, sur le site d'un des partenaires, j'ai vu qu'il y avait aussi Montréal. Est-ce que Montréal fait partie du projet ANR ? [>R2]: Il est dedans, oui. Ils sont associés avec Luxembourg. Ils ne reçoivent pas d'argent, mais ils sont associés, Répartition des rôles entre les partenaires du projet

. :-c'est-effectivement-ce-qui-va-se and . Passer, Est-ce que vous avez exactement les mêmes questions et les mêmes dispositifs ? [>R2]: Ça a été assez difficile justement, parce que pour moi c'était la première fois que je travaillais sur ce type d'étude. C'était la première fois que je faisais de l'humain. Et je pensais par exemple que les questionnaires étaient très rodés, très précis, qu'ensuite on n'avait pas besoin de les retravailler, que le questionnaire qui avait été fait à Montréal était le même que celui de Luxembourg et que, Oui, si on arrive à avoir toutes les données qu'il faut et à les comparer. Parce qu'il y a ce qu'on veut faire dans l'idéal et ce qu'on arrive à faire à la fin ! [>R1]: Comment vous répartissez-vous les rôles entre laboratoires ? Vous dites que chacun a une cohorte

, On a regardé les questions qui étaient posées et on en a repris certaines, d'autres ont été modifiées, d'autres ont été rajoutées, certaines ont été supprimées. Mais c'est vrai que, moi personnellement, ça m'a étonné, Vous êtes partis des questionnaires déjà réalisés ? [>R2]: Oui. On a repris les questionnaires de Montréal et Luxembourg

. Annexes, Maintenant c'est surtout R qui est utilisé. Parce que même les logiciels qui permettaient de mesurer le type d'activité que les gens faisaient n

L. Donner and . Signaux, Il y a beaucoup de packages qui existent sous R. R est un langage de programmation. Avant c'est plus Python qui était utilisé. Moi j'utilisais NetLogo pour faire de la modélisation de systèmes multi-agents. C'est vrai que maintenant on peut tout faire avec R. S'il nous manque quelque chose, le package existe, on le remet dedans, on prend la ligne de code... C'est l'open access qui permet ça. C'est la gratuité 16:21 > 22:35 Ressources humaines [>R1]: Combien de personnes travaillent sur le projet H., ici, dans cette équipe ? [>R2]: Ici, il y a moi. Je suis seul. Il y a B. qui s'est rajoutée dessus. C'est une autre chercheuse CNRS. Après, au niveau de l'Université, il y a deux doctorants qui travaillent ici : I., qui est ici, et A., qui est Québécois et qui fait sa thèse entre Strasbourg et Montréal. Lui a vraiment développé le double aspect, Avec A. je travaille sur les données de Montréal. Avec I., je travaille sur des données de R

:. Sur-quoi-porte-la-thèse-de and I. Strasbourg, Il a à la fois des indices de santé (est-ce que les personnes sont en diabète/en surpoids, comment elles fument, comment elles boivent?), des données sociodémographiques (où les personnes vivent, quel est leur métier?) et les données de l'accélérométrie. Sa première question de recherche consiste à essayer de voir comment Annexes [>R2]: Non, il ne travaille que sur Montréal, I. que sur Paris et il y a une doctorante qui ne travaille que sur Luxembourg. Pour l'instant, on n'a personne pour comparer les données des différentes villes. C'est trop tôt, trop complexe, Toutes les données sont là, on peut les analyser sans aucun souci. On a encore des questions qu'on pourrait traiter. 4 -22:35 > 27:17 Confidentialité des données [>R1]: Vous-mêmes, avez-vous accès aux données de Montréal ? Via un espace informatique partagé

, Est-ce qu'au Canada il existe un organisme du type de la CNIL ? [>R2]: Oui. Je pense qu'il doit y avoir ça à peu près partout

, est-ce que la CNIL vous demande autre chose que l'anonymisation des participants ? [>R2]: Par exemple, vous ne pouvez pas avoir l'adresse exacte dans le fichier

. Oui, Mais on a demandé à ce que les données soient stockées pendant dix ans

, A moins que ça ne soit pour des doctorantspour qu'ils puissent travailler sur les données. Mais si la prise de données est faite, ça ne nous coûte plus tellement cher. Ce qui coûte cher, c'est la prise de données, le matériel, les gens qui prennent les données (les enquêteurs), le système informatique pour accéder aux données et les analyser, Pensez-vous effectuer une nouvelle demande de financement ensuite ? [>R2]: Il faut qu'on voit? Pas nécessairement

, Oui, tous. C'est très précis chez nous en sciences. Ailleurs, ça n'est pas forcément le cas (en sociologie, par exemple). Ici, à l'ED 414, il faut que ça soit un contrat (ou une bourse pour des personnes étrangères)

, Les doctorants ont-ils une contrainte au niveau des données ? Doivent-ils les

. :-rien-ne, Dans la charte des doctorants, il y a une signature de confidentialité, qui dit que rien ne leur appartient. De notre côté, si on publie sur quelque chose qu'ils ont récolté, on doit publier avec leur nom. Mais eux non plus ne peuvent pas publier sans demander notre accord et sans

, 43 > 31:29 Définition d'une donnée scientifique [>R1]: Je passe à la partie « Données ». J'ai une question un peu plus théorique. Utilisez-vous spontanément le terme « données » ? Si oui, comment le définiriez-vous ? Que désigneriezvous sous ce terme, Utilisez-vous des règles de nommage de fichiers ou une arborescence ? [>R2]: Normalement, il y a un seul fichier avec toutes les données, vol.29

, Par contre, la mentalité sur le partage des données n'est pas la même. 7 -31:29 > 43:52 Ouverture des données [>R1]: Comment concevez-vous le partage des données ? [>R2]: Il y a la mentalité de chacun, qui est : quand on va publier, est-ce qu'on va partager les données ? On n'est pas obligé de partager les données brutes. of the Royal Society, on va nous demander le fichier. Moi je travaille aussi sur les piétons (comment les piétons traversent, pourquoi ils traversent, quelle est leur prise de décision en fonction de leur culture, de leur genre, de leur âge?) et là c'est pareil, Ce serait la même chose pour un projet sur des primates ? [>R2]: Oui, c'est pareil

, Oui, c'est une culture en informatique

, mais c'est pareil ici pour ceux qui travaillent sur les humains), on ne va pas partager le fichier de données global, Je connais beaucoup de collègues allemands qui n'ont pas de position fixe. En Allemagne, les positions fixes sont très rares

, Même si, avec la crise, ça devient de plus en plus difficile. Alors qu'en Allemagne ils vont avoir plus de post-docs (ils ont des sous pour des post-docs, on peut candidater beaucoup de fois à un post-doc), Qu'entendez-vous par « position » ? [>R2]: Les postes permanents. Ici, en fait, on a très peu de post-docs mais, dès qu'on est un bon chercheur, on peut facilement avoir une position au CNRS ou dans une université

, Donc il y a un enjeu économique derrière, mais pour eux, pour leur propre vie. C'est-à-dire qu'il faut qu'ils publient un maximum. Du coup, ils sont un peu moins partageurs sur certaines données. On sent qu'il y a un enjeu personnel pour eux

, Il disait que, pour lui, ça n'était pas possible de partager le code, parce qu'il avait une valeur économique. Il allait par la suite vendre ce code à des entreprises. Dans votre domaine, ce problème ne se pose pas ? [>R2]: Non. Mais je pense qu'il y a les deux aspects en informatique : soit vous développez des codes, vous les vendez ensuite et vous faites votre propre argent ; soit vous développez des codes, vous les mettez en ligne et les gens voient que c'est vous. Ils peuvent se les approprier, mais ils ne sauront pas les redévelopper eux-mêmes ou en faire autre chose. Donc ils vous appellent, parce qu'ils veulent vous embaucher. En fait, je pense qu'en informatique il y a les deux aspects. J'ai un copain qui est informaticien. Il mettait toujours tout en open access (il a toujours tout fait comme ça). Et c'est parce que les gens voyaient ce qu'il faisait en open access, qu'ils décidaient de l'embaucher directement derrière, Je pensais plutôt aux domaines, où les données vont ensuite être rachetées. J'ai rencontré un chercheur qui écrivait des codes informatiques

, D'accord, ça donne de la visibilité

, Est-ce qu'on vous a déjà refusé l'accès à des données ? [>R2]: Oui. La personne disait qu'on travaillait sur le même sujet et qu'on était en compétition. Cash ! Alors que, pour moi, partager les données, parce qu'on travaillait sur le même sujet, nous permettait d'écrire plus d'articles ensemble et d'être plus productifs, Vous me disiez que ça vous était arrivé de demander des données à d'autres chercheurs

, Qui n'avait pas encore de poste ? [>R2]: Oui. Je pense que c'est très important, ça. Donc il y a des gens qui vous répondent « non, on travaille sur le même sujet

, Après, c'est intéressant. Par exemple, là ça fait un moment qu'on travaille sur les réseaux sociaux chez les macaques, on est un noyau dur de quatre ou cinq personnes et ensuite il y a les jeunes chercheurs qui gravitent autour, Avez-vous eu d'autres motifs de refus ? [>R2]: Non. Parfois on nous disait « on ne veut plus participer à cette étude », mais sans forcément de motif particulier

, Je pense que c'est parce qu'ils n'ont pas forcément de position fixe

, En même temps, il y a tout un aspect positif qu'ils ne voient pas : cet aspect collaboration, qui donne davantage de visibilité

, On n'a pas du tout la même façon de penser sur ce sujet-là, mais ça va être intéressant. Ça va être un challenge, mais ça va être intéressant ». Moi je suis très ouvert : on va construire, on va échanger. Et au pire, si ça ne marche pas, ça ne marche pas

:. , ai une toute dernière question. J'essaie de savoir si la formation universitaire a une influence sur la manière dont les chercheurs mènent leurs recherches et gèrent les données

, Dans quel établissement avez-vous fait votre formation universitaire (master, thèse?) ?

, Avec cette personne, j'ai appris à modéliser, j'ai été dans des réseaux et des colloques, où il y avait des informaticiens. C'est grâce à ça que j'ai cette approche de partage de données, que beaucoup de mes collègues n'ont pas forcément

, Ce sont des mentalités/des cultures différentes, je dirais. C'est intra culture. C'est-à-dire c'est une culture qui s'est développée dans les écoles d'informatique, qui a évolué et qu'on acquiert en étant dans cette formation, A votre avis, pour quelle raison y a-t-il cette culture du partage en informatique ? [>R2]: Pourquoi pas un autre domaine ? Je n'en sais rien

, Et s'il va voir d'autres personnes, il va acquérir différentes cultures. C'est pour ça que j'adore que les thèses que j'encadre soient en cotutelle -avec au moins deux encadrants

. :-c', est quasiment toujours ce type de fichier, quand il s'agit de données quantitatives

, Dans chaque groupe et pour chaque animal, on peut prendre des photographies représentatives de ce qui se passe dans ce groupe, après avoir traité le tissu selon différentes méthodes histologiques. Certaines sont des méthodes de base, qui vont simplement nous permettre de vérifier, par exemple, qu'il n'y a plus de neurones dans la zone de lésion ou qu'il y a un nombre résiduel de neurones extrêmement bas. D'autres photographies vont nous permettre de visualiser le fait que, Sous la responsabilité des étudiants. Ou alors, ce sont des données plus qualitatives

, dont je vous ai parlé et qu'on utilise dans le cadre de ce projet, ne permettent pas de voir des neurones s'activer, pendant que l'animal est en train de faire quelque chose. Mais ce type de techniques existe. C'est par exemple l'imagerie calcique, qu'on utilise pour d'autres projets dans le laboratoire, Comment parvenez-vous à voir l'activation de certains neurones sur un cerveau disséqué ? [>R2]: Alors, les techniques

, Ni les autres partenaires du projet ? [>R2]: Ni les autres partenaires du projet. Annexes 5 -29:26 > 31:04 Répartition des rôles [>R1]: Vous disiez que les données étaient sous la responsabilité des doctorants

, Qu'entendez-vous par là ? Voulez-vous dire que les doctorants conservent les données acquises sur leurs propres supports de sauvegarde ?

, Ils peuvent évidemment les laisser sur l'ordinateur mais pas « ad vitam aeternam », parce que, sans quoi, on arrive très rapidement à l'encombrement du disque dur. Ce sont quand même des fichiers assez volumineux. Donc, les doctorants récupèrent ces données sur leur ordinateur, les traitent et les analysent statistiquement -évidemment on en discute entre personnes responsables de l'encadrement de ces étudiants, Donc les données brutes sont sur l'ordinateur du laboratoire. Les étudiants récupèrent ces données

L. , On regarde ensemble les résultats des expériences, on discute ensemble de ce qu'il faut faire après. On discute aussi ensemble des variables qu'il convient de retenir, de celles qu'il conviendrait peut-être de générer

, Il existe aujourd'hui des systèmes de stockage, notamment pour le matériel histologique, qui consistent à photographier en série et à stocker les photos -ce qui nous permet de nous débarrasser rapidement du matériel. Par exemple, quand on utilise des marqueurs fluorescents, ces marqueurs voient leur fluorescence s'atténuer au fil du temps et, en particulier, beaucoup plus vite encore lorsqu'on les place sous un microscope à fluorescence et qu'on les excite avec une certaine longueur d'onde, qui correspond à l'émission d'une fluorescence du marqueur qu'on utilise. Donc, plus on utilise ce matériel, moins il est utilisable. Ces fameux systèmes de prises de vue ont alors un intérêt majeur, parce que sur une photographie c'est figé/stabilisé, Est-ce que vous avez un serveur commun qui centralise toutes les données, aussi bien brutes qu'analysées ? [>R2]: Il y a un serveur au sein du laboratoire, qui permet non pas seulement de rassembler toutes ces données, mais qui permet aussi de sauvegarder quotidiennement l'intégralité du travail généré à partir des différents postes informatiques du laboratoire

, Avez-vous systématiquement recours à ce procédé de photographie du matériel histologique ? [>R2]: Non, ça n'est pas systématique. Je parlais d'un autre laboratoire. C'est un dispositif qui vaut 200 000?, donc il est clair que nous n'aurions pas les moyens d

, Ce qui va de soi, Moyennant paiement ? [>R2]: Moyennant paiement

, Y a-t-il échange de données entre les différents partenaires, que ce soit pendant ou après le projet ?

, Alors, faites bien la distinction entre le matériel biologique préparé à partir de l'animal et ce que l'on va chercher sur le matériel biologique. Le matériel biologique n'est pas une donnée brute. La donné brute, c'est ce qu'on va aller chercher, Finalement, on peut quand même parler d'échange de données brutes

, Donc, la donnée brute c'est déjà le fruit d'une interprétation ?

, On échange de l'information. Par exemple, en juin l'année dernière, on a organisé données moyennées, c'est-à-dire des données déjà passées par la moulinette des analyses statistiques descriptives et analytiques. Nous avons échangé : où en vous donne un exemple d'échange. A Marseille, ils ont regardé les lésions qu'ils faisaient avec une technique d'IRM morphologique. C'est-à-dire qu'on prend l'animal (il est vivant, D'une visualisation, d'une observation. Par exemple, on aurait pu imaginer que notre partenaire toulousaine nous envoie le matériel qu'elle a généré pour visualiser les cellules nouvellement formées dans le système nerveux

À. Ici and . Strasbourg, nous avons eu besoin de nous assurer que les animaux que nous allions traités avec un produit étaient lésés correctement. Pourquoi ? Parce que : (1) nous ne disposons pas de ce produit en quantité illimitée

. Donc, traiter des animaux qui n'auraient pas de bonnes lésions

, Donc, voyez, il y a des échanges de bons procédés, des échanges de données analysées, des discussions aussi sur l, l'information sur nos propres rats avec une IRM ici, à Strasbourg

, Parce que ça n'a pas d'intérêt ?

P. Oui and . Qu,

. Oui,

, Quelle valeur accordez-vous aux données ? Par exemple aux données de ce projet (je parle ici des données et pas du matériel biologique) ? Est-ce qu'elles ont une valeur économique ? Est-ce qu'il peut y avoir des dépôts de brevets ? [>R2]: Je ne dirais pas que la valeur économique est immédiate. Je m'explique : je ne vais pas générer de l'argent avec ces données. Évidemment, je ne peux pas exclure que, dans le cadre Annexes le montrent), dans le milieu scientifique, si je ne suis pas quelqu'un de rigoureux, si je ne suis pas quelqu'un de totalement honnête

. Donc, Ce qui permettrait très probablement de réduire la fraude, c'est la mise en archive ouverte non pas des articles, non pas des données dérivées

, Pourquoi en archive ouverte et pas chez un éditeur, Parce que ça n'est pas gérable

. :-d'un-point-de-vue-Économique,

, absolu, vous avez raison. Après, il faut se poser la question de savoir quel est l'objectif de l'éditeur : faire du fric -on est d'accord. On peut imaginer qu'il le fasse en proposant des services d'archive ouverte contre paiement. C'est à ça que vous pensiez ?

, Ce sera forcément un modèle économique

P. Viable, Il est vivable mais il n'est pas forcément viable économiquement

, Je pense que les plateformes d'archives ouvertes seront, elles aussi, obligées d'instaurer un modèle économique, si elles veulent disposer d'espaces de stockage suffisants

, Il faut qu'elles s'appuient sur un système de financement, c'est inévitable. A moins que le financement soit public. Mais je n'y crois pas

, L'établissement s'appelait Université Louis Pasteur

, Ici, donc

, Avez-vous remarqué une évolution dans la gestion des données ? Par rapport à leur sauvegarde, par exemple ? [>R2]: L'évolution a suivi, grosso modo, celle des capacités de stockage et celle de la convivialité des logiciels

, Je vous donne un exemple. Moi, quand j'ai fait ce qu'on appelait à l'époque une maîtrise -l'équivalent du M1 -, j'ai tapé mon mémoire à la machine à écrire. L'arrivée des premiers ordinateurs dans le laboratoire, ça date de 1985-1986. C'était des Apple

, Puis, une fois que le logiciel était chargé, vous sortiez la disquette et vous de stockage, avant de quitter le laboratoire, vous aviez passé une journée pour rien. Moi ça m'est arrivé une fois, quand j'écrivais ma thèse. J'étais venu un dimanche, parce que c'était un moment tranquille. J'ai passé mon Annexes dimanche à bosser sur un chapitre de thèse et le soir j'ai éteint l'ordinateur. J'avais oublié de sauvegarder. Catastrophe ! Bon, ça ne m'est arrivé qu'une fois. Mais, c'est simplement pour vous dire qu'à cette époque-là on n'avait pas de système de vidéo tracking, Vous aviez une disquette avec un logiciel. Vous mettiez le logiciel dans le lecteur de disque 3,5 pouces

B. Avec and . Sûr, un nombre de variables extrêmement limité, parce que vous ne pouviez pas à la fois prendre des notes, contrôler douze chronomètres et regarder ce que faisait l'animal par rapport à chacune des variables, On stockait nos feuilles dans des classeurs. Aujourd'hui

, Vous n'avez pas de cahiers de laboratoire ?

, Ce sont des cahiers papier ?

E. Oui and . Fait, ça a permis de gagner en précision et de collecter plus de données ? [>R2]: Collecter des données, en attendant d'essayer d'en faire quelque chose. Les systèmes de vidéo tracking vous permettent de collecter 70, 80, 100 voire 150 variables en même temps. Qui peut le plus

, Avant ça n'était pas possible. Moi, je me rappelle des premiers PC à disque dur qu'on avait au laboratoire : on était super content quand on avait 30 Mo. Super content ! 30 Mo de stockage !, Aujourd'hui on peut filmer des bestioles, on peut stocker les vidéos numériques, etc

C. , Alors, regardez aujourd'hui ! Donc, la manière dont nous avons traité nos données, dont nous avons stocké nos données

C. Petit-monde, donc ce ne sont que des collaborations internationales de toute façon

, La deuxième raison, je pense, c'est que c'est facile. C'est facile de partager une image du ciel

, De même, les filtres, c'est facile à définir. Donc il est relativement facile de décrire une donnée astronomique. Relativement, car il a quand même fallu mettre en place des protocoles, etc. Ça a mis un peu de temps. Mais c'était peut-être plus facile que dans d'autres domaines de la recherche. Comment décrire un vase de façon complètement objective ? Ça n'est pas facile. Tandis qu'une image, d'abord on peut la télécharger sur ordinateur -surtout avec Internet -, ensuite il suffit de quelques descripteurs pour pouvoir exploiter scientifiquement cette donnée, la base des recherches -un vase

, Voilà, c'est peut-être un domaine de recherche où il est plus facile de partager les données. 3 -18:33 > 35:09 Traitement des données et compétences [>R1]: Dans vos recherches, vous partez d'observations qui existent déjà ? Ou bien vous arrive-t-il de demander du temps d'observation ? [>R2]: Pendant longtemps, j'ai demandé du temps d'observation. Je partais très régulièrement les derniers instruments. Maintenant, si on regarde globalement, En dehors du fait qu'il y avait de toute façon des collaborations internationales

. Oui, ce sont les datacenters, comme il y en a un ici -où il n'y a pas vraiment de supercalculateur

, Donc on peut imaginer qu'avec le développement des datacenters, les données seront archivées de façon plus pérenne, Mais ça a aussi un coût plus élevé

. Globalement, Je disais tout à l'heure qu'en astronomie il y a des descripteurs des données, qui existent depuis longtemps. L'observatoire virtuel c'est une version un peu améliorée de ces descripteurs, qui sont encore plus universels que ceux qu'on utilise actuellement. Ils sont potentiellement utilisables par toutes sortes de logiciels, par toutes les bases de données. Pour l'instant, on avait un format d'échange qui était le format FITS. C'était un format qui était un petit peu propriétaire. L'observatoire virtuel a vraiment pour but de définir des protocoles mais qui sont définis à un niveau organisé complètement international. Les protocoles qu'on a utilisés jusqu'à présent sont des protocoles un petit peu pragmatiques, utilisés par tous. Mais il n'y a pas un organisme derrière qui les certifie

C. Globalement, est de pouvoir récupérer des données d'un peu partout, de n'importe quel télescope, de les mettre ensemble, sans qu'on sache leur origine d'une certaine façon. En pratique, derrière l'observatoire virtuel, il y a ces protocoles d'échange, très normatifs. C'est un ensemble d'outils, comme ceux développés par le CDS, avec des interfaces comme Aladin. Mais ça n'est pas un observatoire physique. Ce sont Annexes vraiment des protocoles d'échange de données

, Y a-t-il également une réflexion sur les données de simulation dans l'observatoire virtuel ?

, Il y a des tentatives, mais -je le disais tout à l'heure -c'est plus compliqué, parce qu'il n'y a pas de descripteurs évidents. Donc on y va petit à petit. Il y a un premier protocole qui avait été défini, mais qui était une usine à gaz et qui a peu été utilisé, chez nous, qui développe des simulations numériques

, Etes-vous plutôt du côté de la production de modèles ou de la réutilisation de données de simulation ? [>R2]: Moi je suis observateur de formation. Donc j'utilise des données du ciel. Mais j'ai toujours travaillé, depuis très longtemps, avec des numériciens. Je suis incapable de faire tourner des codes numériques

, En astronomie, c'est gratuit depuis très longtemps, parce qu'on a partagé les moyens d'observation. Le modèle standard c'est que c'est complètement gratuit. Même quand on obtient du temps de télescope au Chili, si on est amené à se déplacer, le voyage est pris en charge par l'organisme européen. Ça ne coûte rien au laboratoire. Donc c'est un gros avantage. Si on n'est pas amené à se déplacer -de plus en plus Annexes tiens, qu'est-ce que ça veut dire ? [>R2]: Numéricien c'est celui qui fait les simulations numériques sur ordinateur. 6 -46:48 > 53:25 Financement des observatoires

, Est-ce que vous encadrez des doctorants ? [>R2]: Bien sûr. Comme on est chercheur

, Ces doctorants sont tous rattachés à l'EOST ? [>R2]: Oui, ils sont tous ici, à Strasbourg. Il y en a un en géochimie avec moi. Les autres sont dans d'autres unités

, Est-ce que vous pourriez me résumer, de manière assez simple, les objectifs scientifiques du projet H. ? [>R2]: Tout à fait. Ce projet porte sur la question de la ressource en eau dans les zones de montagne

, provient des sources ou des petits ruisseaux de montagne. Dans la plaine, vous pouvez prendre l'eau de la nappe phréatique. La nappe n'est pas un réservoir infini mais il est énorme

. Donc and . Dans-la-plaine-d'alsace-;-de-montagne,-le-«-château-d'eau-»-c'est-la-montagne-elle-même, La question qu'on se pose actuellement est liée au changement climatique, notamment au changement du régime pluviométrique des pluies. Par exemple, on sait que dans le Nord-Est de la France la couverture neigeuse va tendre à disparaître. Or la couverture neigeuse, lorsqu'elle fond après l'hiver, va s'infiltrer dans le sous-sol, aller dans les fractures de la roche et rester dans cette porosité de la roche

, Quel est le quatrième axe qui est mentionné sur le site de l'ANR ?

:. , Oui, c'est ça, c'est la conclusion. 4 -16:00 > 19:52 Partenaires du projet [>R1]: Quels sont exactement les partenaires impliqués dans le projet ? Sur le site de l'ANR, j'en ai vus trois

, il y a quatre partenaires qui ont reçu une somme directement : le BRGM, l'INRA, l'Institut de Physique du Globe et le L. Après, dans le volet 1 par exemple, l'IPGES va travailler avec des sismologues venant d'un autre centre de recherche. Ces personnes ne sont donc pas partenaires du projet, mais elles sont associées. On va faire appel à elles pour certaines missions. Elles seront payées, etc, Il y a bien 9 partenaires. En fait, dans les projets ANR, il y a les partenaires à qui on va donner une somme d'argent

, C'est la différence entre les partenaires et les laboratoires associés

, On les rémunère dans le sens où, si par exemple ils ont besoin d'une sonde, on va acheter la sonde ensemble. Quand ils vont venir faire des mesures sur le terrain, on va prendre en charge leurs frais de mission. S'il y a du fonctionnement, Est-ce que, vous, vous rémunérez ces chercheurs pour ce qu'ils font ou

, Dans le projet ANR, on a aussi un partenaire privé, qui est un cabinet d'étude de sols. Là c'est une prestation : pour 10 000? on travaille ensemble, mais ils nous rendent une carte pédologique du bassin. C'est une prestation de service, Et ensuite les résultats seront publiés en co-publication ? [>R2]: Oui

, Mais, les données, elles sont pour nous. Pour les collaborations scientifiques, en revanche, ça fonctionne comme dans toutes les collaborations scientifiques. C'est-à-dire que, Comment ça se passe au niveau des données ? Au terme de leur mission, est-ce qu'ils vous donnent les données et en sont dépossédés ? [>R2]: Ça dépend

, Oui, c'est une copropriété des données

, Comment sont répartis les rôles entre les différents partenaires

. :-en-fait,

, Chaque partenaire a son financement, qui correspond soit à des frais d'analyse, soit à des frais d'équipement ou de matériel, soit au financement d'un doctorant. Ici, chaque workpackage a un doctorant, Chaque workpackage correspond à un des objectifs que vous m'avez décrits tout à l'heure ? [>R2]: Oui, exactement, 2014.

, Au total, en France et dans le monde, il y a 22 sites naturels surveillés. L'idée c'était d'en choisir trois sur lesquels on allait mettre le maximum d'équipements. Sur les trois sites qui ont été choisis, il y a le bassin versant du Strengbach, il y a un site en région parisienne à Orgeval et il y a un site en Bretagne, Agrhys. Grâce à ce financement, on a donc pu bénéficier d'un certain nombre d'équipements. Après, les équipements ne financent pas les analyses, les doctorants, D'autres groupes essaient de caractériser la structure du sous-sol, avec des outils de sismique par exemple. L'idée de l

. Oui and . Communauté, Il y a cinq ans, on a commencé à travailler avec des géophysiciens. Les géophysiciens n'ont pas forcément l'habitude de travailler sur des sites en montagne avec de la pente, des arbres, etc. (ils travaillent souvent la terre plus profonde), donc il a fallu adapter, faire des développements méthodologiques, etc. Je pense que le projet H. a été élu par l'ANR également parce que les reviewers ont vu que c'était un projet qui ne sortait pas de nulle part, qu'il y avait déjà des gens qui travaillaient dessus

, est le fait que c'est un site bien caractérisé, sur lequel travaille déjà une communauté. Bon, et puis on n'a pas été sélectionné la première année ; on a été sélectionné la deuxième année

, Est-ce que le fait que vous soyez plusieurs partenaires a joué? [>R2]: Oui, oui, bien sûr. C'est nécessaire

E. :-c'est-Ça and L. Le, mais c'est l'équipe de modélisation qui s'en charge. En fait, depuis janvier, le L. a une nouvelle structure

, Vous, vous êtes dans cette équipe ? [>R2]: Oui, moi je travaille et je porte cet axe-là. Alors, je ne vous en ai pas parlé, pour ne pas trop compliquer, mais dans cet axe 3, on travaille à la fois sur la ressource en eau et sur la ressource en sol

:. Dans-le, Alors qu'en réalité les forêts en France sont exploitées. Ce sont des forêts qui sont plantées et coupées. Et ce depuis plusieurs siècles. Or, un sol forestier c'est comme un sol en plaine : il peut s'appauvrir dans certains contextes. Pourquoi ? Parce que les arbres ont besoin de nutriments, quand ils poussent (principalement de phosphore, d'azote, de carbone, mais aussi d'autres nutriments comme le calcium et le magnésium). Par exemple, ils Annexes trouvent le calcium et le magnésium, dont ils ont besoin, dans les sols, Voilà. Et même dans le sens « fertilité du sol ». Souvent on se dit « les forêts elles poussent et voilà »

. Si, on regarde cette image-là [elle va chercher une feuille accrochée au panneau d'affichage], on voit bien ce qu'est un sol. C'est un granite qui commence à se fracturer, à se déstructurer, jusqu'à devenir de plus en plus petit

. Voilà and . Donc, Dans les roches calcaires, par exemple, il y a beaucoup de calcium et de magnésium ; donc il y en a aussi beaucoup dans le sol, si dans la roche vous n'avez pas beaucoup de calcium et de magnésium, vous n'en aurez pas beaucoup non plus dans le sol

V. Dans-les, où on trouve soit du granite soit du grès, les sols qui se forment ne sont pas très riches en calcium et en magnésium. Si, en plus, sur ce sol, vous plantez des arbres, si vous les coupez, les exportez

, Au bout d'un moment, les vieux arbres tombent et ce qu'ils ont pompé repart dans le sol. C'est pour cette raison que les forêts primaires fonctionnent très bien. Parce qu'elles ne sont pas exploitées. Quand les vieux arbres tombent au sol, tout ce qu'ils ont pris va se dégrader ; les nouveaux arbres vont les prendre, ils vont mourir à leur tour, et puis voilà, ça va tourner. C'est ce qu'on appelle le recyclage biologique. Mais si vous plantez, coupez, exportez, replantez, etc. à une vitesse plus rapide que la formation du sol, Or un sol met entre 10 000 et 100 000 ans pour se former

, Ça veut dire qu'il y a des zones où il vaut mieux faire de la sylviculture que dans d'autres ? [>R2]: Les forêts sont naturelles, mais après il faut voir quels arbres on plante. Si vous plantez des résineux (des épicéas par exemple)

, En fait, quand on brûle des énergies fossiles, on va émettre des oxydes de soufre et d'azote. Quand ces oxydes de soufre et d'azote se retrouvent dans l'atmosphère, ils se transforment en acide sulfurique et en acide nitrique. Et l'acide sulfurique H2SO4, dès qu'il est dans l'eau, va donner SO2, plus des protons et des sulfates. Voilà, et c'est pareil avec les nitrates. Tout ça pour dire que, quand vous brûlez des énergies fossiles, vous vous retrouvez avec des protons, qui sont positifs. Donc ils vont faire eu des forêts dans les Vosges, ça n'est pas un problème. Le problème c'est qu'avec les pluies acides et la sylviculture on a appauvri les sols. Donc, nous, on travaille sur la question de la fertilité de ces sols. La question qu'il y a derrière, c'est justement la culture du bois. C'est-à-dire que, dans une commune de montagne comme le village d'Aubure, les principales ressources sont le bois et la chasse. Donc, si les forêts sont en mauvaise santé, c'est très embêtant pour la population. C'est pour ça qu'il faut adapter la sylviculture et c'est pour ça que, dans nos partenaires, il y a aussi l'ONF. On travaille avec eux. Donc voilà, on travaille sur la question de la fertilité des sols : est-ce que les sols sont encore fertiles et pendant combien de temps ? Là, Or les épines sont acides. Donc, quand elles se dégradent, elles sécrètent des acides. Et, en fait, où se trouvent les nutriments des sols ? Ils se trouvent sur la surface des minéraux, des argiles ou de la matière organique

&. :-en and . Onf, Par exemple, l'ONF va pouvoir nous fournir des données chiffrées sur les quantités de bois qui sont exportées par parcelle. Parce que qui dit sylviculture, dit dynamique. Donc il y a des arbres qui sont plantés puis coupés. Nous, ça nous permet d'avoir une idée de l'évolution de la

, Donc on va récupérer du calcaire et de la dolomite (avec du calcium et du magnésium) dans les carrières de calcaire, on va les broyer finement, puis, par hélicoptère ou par avion, on va faire un spray et déposer le calcaire sur les sols, pour que ceux-ci retrouvent des nutriments et que les forêts aillent mieux. Tout ça pour dire que l'ONF et les communes environnantes autour d'Aubure avaient ce projet d'amendement calco-magnésien. Le problème c'est que ça coûte très cher, notamment à cause de l'application par hélicoptère. Pour l'instant, ils n'ont pas encore eu les financements. Ça c'est un projet sur lequel on a travaillé aussi. Donc ils ont récupéré nos données de sol, comme ça, ils n'ont pas eu besoin de les mesurer. Ça leur a permis d'économiser ça. Donc ce sont de petites choses comme ça : ils nous donnent des données ; nous, on leur donne des données, Dans votre équipe BISE, combien de personnes travaillent sur le projet ? [>R2]: On est pas mal en tout dans le projet, mais de l'équipe on doit être trois permanents et un doctorant. Dans l'autre équipe, ils sont plus : ils sont quatre permanents et un doctorant. A l'IPGS, ils sont plus

, Est-ce que vous-mêmes utilisez spontanément le terme de « donnée » ? Si oui, qu'est-ce que vous désignez sous ce terme ? [>R2]: Oui, le mot « donnée », on l'utilise beaucoup. Et, effectivement, il y a plein de définitions à la donnée. D'autant plus que, nous, avec l'observatoire, on a les données librement accessibles. Ces données-là, c'est très simple : elles sont accessibles. On les met sur notre site internet et tout le monde peut les télécharger. Maintenant, c'est vrai qu'avec les normes Inspire, les Creative Commons, les DOI, il faut qu'on revoit notre politique. Parce qu'on se rend compte qu'il faut associer des données à des métadonnées, voire protéger les gens. Protéger la donnée et protéger le fournisseur de données. Parce que le problème des données, c'est que quelqu'un peut les utiliser et les vendre, Et quand vous dîtes « permanents », ce sont des chercheurs ? [>R2]: Oui. Donc ça n'est pas tout à fait vrai. Dans notre équipe, on va dire qu'il y a trois chercheurs, quatre ou cinq techniciens ingénieurs et un doctorant

, Mais ça, vous le mettez déjà sur votre site internet ? [>R2]: Non, pour l'instant, on ne l'a pas encore fait. Parce que ce sont des choses qui sont en train de se mettre en place. Et puis c'est assez lourd

, Donc il faut que je me forme. C'est compliqué -je suis déjà débordée

, On est de moins en moins et on doit tout faire. C'est moi qui ai fait le site internet, c'est moi qui m'occupe des données, de la validation des données, qui vais faire visiter le site aux gens quand ils veulent le visiter? Voilà. Donc ça c'est quand même un gros problème. C'est, à mon avis, le problème n°1 de la recherche. Le problème ce ne sont pas forcément les dotations. Parce que, par exemple nous en sciences, on trouve des projets. Ce qu'il faut ce sont des personnes permanentes. Et ça, c'est l'État qui doit nous les attribuer. Annexes [>R1]: Oui, c'est bien de mettre à disposition les données, Parce que ce serait vous qui prendriez tout ça en charge ? [>R2]: Ben oui. Parce que, malheureusement, dans la recherche

, Tout à fait. Donc, sous le terme de données

. Ensuite, Nous, par exemple, dans le cadre de l'ANR ou d'autres projets, -bon, ça n'est pas tout à fait en place -on partage des ordinateurs et ensuite on dépose nos fichiers. Comme ça, chacun peut les récupérer

:. Vous-le, Alors, ça n'est pas encore tout à fait au point, parce que, comme on est dans deux bâtiments différents, ça n'est pas si simple. Mais, en tout cas, >R2]: Oui, oui

:. , Oui, il est accessible à distance. Enfin, en intranet ; pas depuis chez moi. Ici, dans mon bureau, je peux récupérer des données. Après, on a des données qui sont communes. Là, par exemple, je vais vous montrer, on a quelqu'un qui fait du géo-référencement. On a ce qu'on appelle un MNT : un Modèle Numérique de Terrain. Ce sont des cartes. Et donc, ça, ce sont des choses qui sont communes à toutes les personnes qui

. Alors, . Mais, and . Fait, Et ensuite ça pourra être échangé. Si quelqu'un a fait de l'électrique (c'est un outil géophysique) à tel endroit et si, moi, ensuite, je veux faire de la sismique ou de la gravimétrie, je me dis : « ah ben, c'est quand même bête, je ne vais pas aller ailleurs, puisqu'on a déjà des données là, Donc je vais récupérer les données

, Donc c'est un logiciel commun ?

. Alors and . Qu, Ce qui est commun, c'est le un modèle numérique de terrain (MNT). Après, ça peut être des choses toutes bêtes comme Annexes mettre des photos en commun. Comme ça

. :-c', est extrêmement simple, parce que la liste des données librement consultables c'est la même. C'est par exemple le ruisseau

.. , Ça c'est fourni, c'est dans la base de données

. :-c', est une donnée acquise par un instrument ? [>R2]: Non, non, non. C'est un long processus : on va sur le terrain, on échantillonne

. Enfin, Je la mets sur le site internet. Quelqu'un peut l'utiliser. J'ai expliqué que « voilà, ça a été mesuré avec un pH-mètre, la valeur vaut 6,52, l'incertitude c'est plus ou moins 2 ». Donc, ça, c'est fourni, c'est clair, c'est protocolisé, c'est simple. Maintenant, si quelqu'un fait un profil sismique par exemple : il envoie des ondes, il enregistre des vitesses de propagation d'ondes? Bref, une fois qu'il a ça, il n'a rien. Donc il va interpréter la vitesse de diffusion dans le milieu, en disant : « Ici la vitesse s'atténue. C'est parce que l'onde rencontre autre chose. Elle est passée du sol à la roche ». Donc là j'interprète, je déduis, je fais des calculs, j'ai des logiciels, et j'en déduis par exemple qu'ici j'ai 1,50m de sol puis je suis dans la roche. Mais, ça, ce n'est pas la donnée brute. C'est la donnée interprétée. C'est très délicat de mettre à disposition des données interprétées. Parce qu'à valider ça n'est pas simple. Donc, là aussi, dans la donnée scientifique, il y a la donnée protocolisée. Celle-là, je peux la rendre accessible, puisque moi je ne l'ai pas interprétée, je ne Annexes l'ai pas transformée. C'est une mesure et je donne une incertitude. Donc je suis sûre de ma donnée. Maintenant, la donnée interprétée, si ça se trouve, dans dix ans on va avoir d'autres logiciels. A partir de la donnée de terrain, je vais donner une autre interprétation. Ça aussi c'est compliqué, parce que, éthiquement, rendre disponible une donnée interprétée, ça fait partie des données qu'on fournit. Donc c'est très simple : les données qui sont librement consultables, on en a la liste. Donc celles-ci, ça ne change pas. Après, les données un peu complexes, ça ne peut pas être des données librement consultables. Déjà parce qu'elles sont très complexes

, Ça donne une garantie

, là aussi, il faut faire attention à ce qu'on rend public. Il faut que ce soit des données qui soient éthiques. C'est très important

, C'est intéressant. C'est un point de vue que je n

, Quand il y a une dérive, je la vois. Donc c'est une donnée qui est sûre. Maintenant, si j'écris : « on a regardé les scénarios climatiques, sur lesquels il y a une incertitude, et puis je peux vous dire qu'en 2100... ». Ça, je ne peux pas le rendre comme ça. Donc je vais le publier, l'expliquer, en disant « attention, j'ai utilisé un scénario, c'est une possibilité? ». Et là, il faut lire tout l'article. Alors on comprend. C'est comme quand des gens citent une citation hors contexte. Admettons qu'on ait fait un article, dans lequel il y a une figure qui dit « voilà, avec ce scénario-là, en 2100 il n'y aura plus d'épicéas sur le site mais des hêtres, Par exemple, on mesure la température extérieure. Bon, voilà : hier il a fait 12°C -plus ou moins, parce que, sur ma mesure, j'ai 1°C ou 0,1°C d'incertitude

, Donc c'est pour ça qu'on ne peut pas mettre sur notre site internet les données disant « voilà, en 2100, il n'y aura plus d'épicéas ». On ne peut pas faire ça. En plus, nous, dans notre communauté, on va différencier la donnée brute de la donnée traitée

, Ou alors il a été échantillonné sur le terrain, mais, je ne sais pas, peut-être que la personne qui l'a échantillonné a confondu deux choses. Je Annexes veux dire, ça arrive. Donc, nous, avant de prendre la donnée et de la mettre en ligne, on va faire un certain nombre de procédures de validation, pour être sûr que c'est le bon échantillon, que l'appareil qui l'a mesuré n'avait pas de problème, etc, Qu'est-ce que vous appelez « donnée validée

. Oui, les données de mars 2018 et je n'ai obtenu aucun résultat. C'est parce qu'elles n'ont pas encore été mises en ligne ? [>R2]: C'est même plus compliqué que ça. Techniquement, comme je l'ai dit, on a des problèmes de personnel. Et la personne qui s

, Donc, de toute façon, elle est arrêtée. Bon, là, on est en train de mettre en place des solutions, donc ça va revenir. Voilà, il y a aussi ce problème. Mais ce sont des problèmes humains, c'est autre chose. 9 -50:46 > 59:31 Mode d'acquisition des données [>R1]: Quelles données acquérez-vous ? Comment les traitez-vous ? Est-ce que vous documentez les procédures ?, Donc on n'a plus personne qui s'occupe de la base de données

, Le troisième axe est un peu différent

, On prend des sols, on fait des petits tests, etc. Donc ça, évidemment, ça ne peut pas être de la donnée libre. Parce que ce ne sont pas des données de terrain. En plus, c'est dans le cadre d'une thèse. On retombe vraiment dans les schémas classiques, c'est-à-dire on fait de l'expérimentation, Ce sont des expérimentations en laboratoire ? [>R2]: Voilà, on fait des expériences en laboratoire

. Annexes, Est-ce que vous acquérez aussi des données de terrain ? [>R2]: Oui. Les données de terrain c'est typiquement la carte des sols

, Est-ce qu'il y a aussi des relevés ? [>R2]: Ça on le fait avec l'INRA. Il y a des relevés de biomasse

, Ou bien on va prendre une certaine surface et compter le nombre d'arbres, la circonférence des troncs, la hauteur, etc. sur cette surface. Là aussi ce sont des quantifications de biomasse. Ça c'est pareil : une fois que les données seront validées, etc., on pourra les mettre à disposition, Ces relevés nous aident à comprendre quel est l'impact de la végétation sur les transferts de nutriments. Par exemple, on va quantifier les chutes de litière

, Et le BRGM, quel est son rôle ?

B. Le, Un sol est constitué de matières organiques, d'humus, mais aussi d'argile et de morceaux de minéraux. Donc, avec le BRGM, on caractérise toutes ces phases qui sont dans le sol : quels minéraux il y a (du quartz, des feldspaths, etc.), quelle taille ont les grains de quartz par exemple, quelle est leur granulométrie, de combien est leur surface réactive

. Ces, INRA, avec certaines méthodologies, et avec le BRGM, avec d'autres méthodologies. Le BRGM va plus travailler sur la caractérisation des phases minérales. L'INRA, lui, va plus travailler sur la pédologie pure et la biomasse (tout ce qui est écologie forestière

, Et, dans le cadre de la thèse du doctorant, on va aussi utiliser des traceurs qui sont les isotopes. Nous, notre spécificité dans notre équipe c'est d'utiliser certains traceurs comme Annexes les rapports isotopiques, pour essayer de mieux comprendre les processus. Vous voulez que je vous explique rapidement ce que c'est qu'un isotope ? On va prendre un exemple (ça n'est pas forcément celui qu'on regarde, Et vous, ici, vous travaillez plus sur les expérimentations ? [>R2]: Oui

, Au bout d'un certain temps, le x final va donc être enrichi en oxygène 18 : x final va être inférieur à x initial. Dans la vapeur, en revanche, vous allez avoir un rapport inverse. L'eau restant dans la casserole va avoir tendance à s'alourdir, tandis que l'eau en phase vapeur va avoir tendance à s'alléger. Les eaux peuvent donc avoir des rapports différents. Parce qu'on pourrait dire : « dans la nature, c'est partout pareil ». En fait, dans la nature, ça n'est pas partout pareil. Dans la nature, ?16O/18O varie. Donc, suivant les masses d'eau, en fonction d'où elles viennent (au-dessus des océans, etc.), vous allez avoir des ?16O/18O différents. Et puis, lorsque ces masses d'eau arrivent sur le site, il va y avoir des processus d'évaporation, d'évapotranspiration, etc. Donc ça va aussi changer, Vous avez de l'oxygène 16 et de l'oxygène 18. Ça correspond au nombre de protons et d'électrons. Donc il y a deux isotopes. L'un est plus lourd que l'autre. Dans la plupart des molécules d'H2O, c'est de l'oxygène 16. Mais certaines ont de l'oxygène 18. On va prendre l'exemple le plus simple : vous avez une casserole avec de l'eau. Dans votre eau, vous avez beaucoup d'oxygène 16 et un peu d'oxygène 18. Vous avez donc un rapport entre les deux, qu'on appelle ?16O/18O et qui est égal à x. Vous mettez l'eau à chauffer

. Il-y-en-a-une-dans-le-laboratoire, Dans certaines unités de recherche, les doctorants déclarent par écrit que les données resteront la propriété du laboratoire

. Oui and . Mais, en même temps, il faut l'anticiper. Parce que, d'accord, le doctorant vous remet une clé USB. Mais il faut que, vous, vous y compreniez quelque chose dans ses fichiers

. :-c',

, Et comment vous imaginez cette politique ? [>R2]: Pour le moment, ce qu'on a imaginé, -ça n'est pas très inventif mais

, Une arborescence ? [>R2]: Une arborescence, voilà. C'est vraiment comme ça qu'on le voit pour le moment

, Moi, en général, je demande aux doctorants de mettre la date en fin de fichier. Parce que là c'est pareil : le doctorant va faire des modifications, donc il va mettre « version 1 », « version 2 », « version 2 bis »? Et ça, ça ne va pas. Donc il faut Annexes essayer d'avoir effectivement une politique de nomination des fichiers. Alors, nous, on a déjà fait ce travail sur les échantillons. C'est-à-dire que, nous, puisqu'on prélève des eaux, des roches, des litières, on a mis en place un système d'archivage. Alors, ça n'est pas pour les données mais c'est, Est-ce qu'il y aura des règles de nommage de fichiers ou des métadonnées à rentrer ? [>R2]: Ça, il faut qu'on y vienne aussi

.. Dans-le-bureau-d'untel, Ça n'était pas possible. 11 -1:02:35 > 1:06:55 Valeur économique des données [>R1]: Quelle valeur -scientifique, économique? -accordez-vous aux données ? [>R2]: Alors là? Économique, je n'ai pas envie de me poser la question. Je ne sais pas quelle est la valeur économique ou financière de la donnée

, Je ne sais pas, je n'y ai jamais vraiment pensé, donc j'improvise. Le projet, il a un coût. Les gens qui vont sur le terrain pour récupérer des échantillons, ça coûte. L'échantillon, quand on le ramène au laboratoire et qu'on le traite, ça coûte. Le doctorant qui va travailler dessus, ça coûte, Et en considérant combien elle a coûté, est-ce que vous pourriez dire si elle a une grande valeur ? [>R2]: Ben, ça va dépendre des données? Ça n'est pas simple, cette question

. Donc, Est-ce que les choses qu'on a mises en place ont pris de la valeur, parce que justement elles ont permis d'acquérir beaucoup de données ? Ou bien est

, Est-ce que ça justifierait que les données soient payantes ou qu'il y ait une forme de gratification (pas forcément financière, mais ne serait-ce que par la citation) ? Annexes [>R2]: Ça n'est pas pareil : la citation, quelque part

, Donc je ne vois pas trop ni l'intérêt que L'État va y avoir, ni celui que nous allons y avoir. Après, on va dire « ah ben, maintenant que vous êtes agréés ISO 9002, vous pouvez faire laboratoire ouvert ». Et ensuite n'importe qui va dire : « Attendez, j'aimerais bien avoir une mesure. Je vais la faire chez vous, et puis je vais vous demander de l'argent ». Dans ce cas, on n'est plus un organisme de recherche, mais un organisme de prestation de services. Or, une prestation de service, c'est pareil, il faut des gens dédiés, Maintenant, je pense que les universités ou les centres de recherche n'ont pas vocation à fournir de la donnée payante. Nous, on est payé par l'argent public

, Je sais que maintenant il existe des outils pour savoir qui a consulté les données, qu'est-ce qu'ils en ont fait, etc. Malheureusement, nous, on ne l'a pas. Donc je ne peux pas vraiment vous dire. De temps en temps, je suis sollicitée par des gens, soit parce qu'ils n'ont pas vraiment compris qu'ils pouvaient récupérer directement les données, C'est une bonne question. Malheureusement, comme on est un peu en panne d'ingénieur pour notre base de données

, Ce sont des chercheurs ? [>R2]: Non, pas forcément. Les chercheurs savent comment faire. Ils savent récupérer les

, Est-ce que vous pourriez me résumer un peu le projet T

, par exemple des sites d'étude, qui sont dans des contextes montagnards, où on va plutôt s'intéresser aux données acquises à haute fréquence sur un glissement de terrain, afin de suivre l'évolution de celui-ci

, L'occupation du sol c'est le fait d'avoir une cartographie précise des modes d'occupation du sol. C'est dire par exemple : « ici ce sont des prairies », « là c'est du maïs », « là c'est de l'urbain », dans l'urbain ça peut être du tissu individuel (un lotissement individuel), des zones d'activités, etc. C'est ça l'occupation et l'utilisation du sol : c'est la manière dont l

, Les trois types de capteurs sont-ils complémentaires ? [>R2]: Oui. Ils nous permettent d'avoir à la fois la vision du haut et la vision terrestre

, Les thématiques se rapportent-elles toutes au domaine de la géographie ?

, Aujourd'hui, avec les nouveaux capteurs (i.e. depuis 2015-2016), on peut avoir des images optiques et radars (deux signaux le moment, on sait traiter une image. Mais avoir un flux d'images plus fréquent, ça apporte une autre information, qu'on n'avait pas jusqu'à maintenant. C'est ça l'objectif du projet T. C'est assez méthodologique, on essaie d'extraire des informations des images à très haute fréquence temporelle. Qu'est-ce qu'on entend par « très haute fréquence temporelle » ? Il y a quelques années, si on arrivait à avoir deux ou trois images satellitaires par an, on était content

. :-en-fait, ». Le-partenaire-de-strasbourg, and L. Le, Parce que les applications ne sont pas forcément des applications dont nous, le laboratoire L., sommes spécialistes. L'application glissements de terrain, par exemple

, Donc le laboratoire australien est partenaire du projet, mais non financé. Il a ses propres financements. C'est quelqu'un qui est spécialisé dans la fouille de données, le deep learning, etc. C'est pour ça qu

, C'est un chercheur en particulier ?

. :-c', est une petite équipe, dont un chercheur en particulier. Enfin, non, ça n'est pas une petite équipe

, Comment faites-vous pour travailler ensemble ? Comment sont réparties les tâches entre les partenaires ? [>R2]: On fait des réunions très régulièrement, au terme desquelles on se fixe des objectifs

, Le travail en commun passe beaucoup par l'encadrement d'étudiants entre deux laboratoires

. Actuellement, on est dans la phase où des sujets de thèse en cotutelle vont commencer à être lancés. Annexes [>R1]: Il y aura plusieurs doctorants ?

, encadrés en multi-laboratoire. C'est de cette manière qu'on arrive à échanger. 3 -10:59 > 13:30 Mode d'acquisition des données [>R1]: Est-ce que vous travaillez avec un ensemble d'images test, Une fois qu'on a défini les enjeux et les applications, oui, on travaille avec des données test. L'avantage c'est que les images à haute fréquence temporelle qu'on va utiliser sont aujourd'hui devenues complètement accessibles de manière gratuite

, Au niveau national par exemple, on va chercher des images via le pôle Theia. C'est un pôle de distribution, qui structure l'animation dans le domaine de la télédétection en France et qui centralise l'accès aux données. L'accès à l'imagerie satellitaire se fait beaucoup par cet organisme. Ils ont mis en place une plateforme de distribution, sur laquelle les chercheurs peuvent faire des demandes et acquérir des données. Ça représente une partie des données qu'on utilise. Après, il y a d'autres catégories de données, qu'on ne va plus chercher sur des plateformes à l'extérieur, mais qu'on va acquérir nous-mêmes. Quand ce sont des données terrestres, par exemple, on utilise un instrument qui s'appelle un Lidar. Les données générées appartiennent au laboratoire qui dispose du matériel, Ça n'est pas vous qui acquérez ces images ? [>R2]: Non -en tout cas, pas celles-là. On va les chercher sur des plateformes de distribution au niveau européen ou national

, Mode de diffusion des données [>R2]: La réflexion sur les données, nous, en géographie, on est dedans -que ce soit par des enquêtes, par la collecte avec différents instruments

, On peut visualiser la donnée, en superposition sur un fond. Vous avez par exemple le portail GéoGrandEst. C'est la plateforme régionale de mutualisation de la donnée géographique. Ça a d'abord été une plateforme de la région Alsace, sous le nom de Cigal, avant de s'ouvrir à la région Grand Est. Chaque partenaire, dont notre laboratoire, Les cartes seraient en libre accès ? [>R2]: Oui

, Ça c'est plus une réflexion labo. Le laboratoire est dans cette démarche d'essayer de récupérer les métadonnées auprès des chercheurs. Moi j'en ai déjà fourni plusieurs (une cartographie de la végétation, par exemple). Mais c'est compliqué. Je pourrai vous donner le contact de notre ingénieur d'étude, qui s'occupe des données. C'est lui qui pourra vous parler plus précisément de ces problématiques. Parce que c'est vrai que c'est compliqué d'obtenir ça des gens, Y a-t-il une politique consistant à déposer systématiquement les métadonnées de tous les jeux de données en ligne ? [>R2]: Oui

, Ça évite de refaire des relevés multiples, voire ça permet de travailler ensemble sur certaines choses. Annexes [>R1]: Y a-t-il d'autres enjeux qui rentrent en ligne de compte, lorsque vous souhaitez mettre une carte à disposition, Oui, c'est ça

. Oui, Généralement, le chercheur va plutôt avoir tendance à publier d'abord (c'est ce qu'on a tous tendance à faire). De toute façon, de plus en plus d'éditeurs demandent de fournir les lots de données avec la publication

, Dans votre domaine aussi ? [>R2]: Oui. Ça se fait de plus en plus

, Est-ce que vous auriez des exemples d'éditeurs qui le demandent ? [>R2]: Oui. Ce sont plutôt des revues en informatique. Ça se fait un peu plus dans ce domaine et un peu moins, on va dire

, Comme moi je travaille beaucoup avec des laboratoires d'informatique, il m'est arrivé de fournir les données avec la publication. Vous avez par exemple la revue Remote Sensing, qui est en accès gratuit (donc qui oblige les chercheurs à payer la publication). Je crois que, dans cette revue, on peut aussi déposer les données. On « peut

, Oui, c'est seulement une recommandation

O. Voilà, Mais il y a certaines revues, où ils le demandent vraiment. Je n'ai pas de nom en tête, il faudrait que je regarde

, Définition d'une donnée scientifique [>R1]: Est-ce que vous utilisez spontanément le terme « donnée » ? [>R2]: Oui. Parce que c'est mon coeur de métier. En géographie, la donnée c

, Parce que c'est le coeur du système d'information géographique. C'est à partir de là qu'on va pouvoir suivre des phénomènes, faire des analyses et apporter des connaissances nouvelles sur ces phénomènes. Donc la donnée c'est le coeur du métier du géographe -la donnée géographique

, En géographie, la donnée serait donc une information géo-localisée ?

, Quelque chose qui est issu d'une collecte, c'est brut. C'est une donnée. Dès qu'on la transforme, ça devient une information

, A partir du moment où il y a une analyse

C. Ça, A partir du moment où il y a une valeur ajoutée, ça devient une information

P. Donc and . Moi, Une image satellite, par exemple, c'est brut. Je vais la chercher sur la plateforme

, La donnée c'est l'image issue d'un capteur ? [>R2]: Oui, c'est ça. 6 -20:52 > 24:30 Stockage des données [>R1]: Que faites-vous des données que vous acquérez ? Est-ce que vous les conservez ? Estce que vous les mettez en ligne ?

. Le-laboratoire-dispose-d'un-espace-de-stockage-partagé, Au sein de l'Université de Strasbourg, on travaille en collaboration avec d'autres laboratoires : C. et I. Une plateforme de traitement massif de données est en train d'être mise en place. Elle se base sur l'infrastructure de calcul du pôle HPC de l'université. Dans le cadre de ce projet-là, qui s'appelle A2S et auquel le projet T. contribue particulièrement, en lien également avec un projet de CPER obtenu entre, Oui. C'est un espace qui est géré par notre ingénieur d'étude. Il essaie de récupérer et de mettre à notre disposition des données (les données de l'IGN, par exemple), 2015.

, Quelle distinction faites-vous entre stockage à froid et stockage à chaud ?

. :-a-chaud, A froid, c'est la sauvegarde des données. 7 -24:30 > 31:48 Sources de données [>R1]: Concernant les banques d'images satellitaires, quels sont les droits d'utilisation de ces données ? Est-ce que leur utilisation est libre, c'est quand on récupère les données pour faire des calculs

, Ces données ne sont jamais gratuites, parce qu'il y a toujours quelqu'un qui paie derrière. Mais elles sont en accès libre : l'utilisateur ne paie pas l'accès aux données. Voilà, il faut simplement bien distinguer la gratuité : quand on a accès gratuitement à des images, Les données sont-elles gratuites

&. Esa, Il y a un satellite qui a été lancé, c'est l'Europe qui paie. ll y a des stations de réception, c'est l'Europe qui paie

, Ça m'intéresse justement, parce que j'essaie de comprendre quelle valeur ont les données

, Moi j'ai un tout petit peu travaillé là-dessus. Sur le spatial en particulier : j'ai essayé, dans le cadre de mon HDR, de quantifier le coût de l'image

, Aux États-Unis, l'imagerie Landsat a été mise à disposition en accès libre depuis bien plus longtemps qu'en Europe. Donc il existe des études montrant que les utilisations sont de plus Annexes en plus importantes. Ce sont des études sur le chiffrage

, ESA, il y a des publications sur la valeur de la donnée. C'est le nerf de la guerre

, Qu'est-ce que l'ESA ?

. :-l'esa-c'est-l'agence-spatiale-européenne.-l'esa-c'est-au-niveau-de-l'europe and F. De-la, Tous les programmes de données liés à l'imagerie satellitaire sont en ligne via l'ESA. Copernicus, par exemple -c'est le programme de l'ESA pour diffuser de l'imagerie satellitaire et des produits dérivés à l'échelle de l'Europe. Donc ça regroupe tous les programmes d'occupation du sol, ainsi que tout ce qui est lié aux catastrophes naturelles (puisque, quand il y a des évènements particuliers, une charte est activée pour qu'il y ait des accès gratuits à de l'imagerie, afin de produire de l'information pour les services de protection civile par exemple)

, Est-ce que les géographes apprennent à utiliser ces ressources pendant leur formation, Oui. Les géographes sont formés dès les premières années. Je donne moi-même un

, Il y a des formations en géographie, où l'on peut se spécialiser dans le domaine de la géomatique et dans le traitement de l'information géographique numérique. Nous, on a un cours spécifique sur l'information géographique, dans lequel on parle des métadonnées, des serveurs de cartographie en ligne, etc. Oui, on les sensibilise à ça, Est-ce que les étudiants ou doctorants sont sensibilisés à la question des métadonnées, de l'ouverture des données... ? [>R2]: Oui, de plus en plus on les forme à ça

, Qu'est-ce que c'est ISO 19115 ?

, Ce sont des normes de formalisation d'échange de données géographiques, Il y a des normes qui disent : « voilà, il faut tel et tel descripteur dans les fiches de métadonnées

, Donc ça Annexes n'apporte rien à un laboratoire d'être labellisé ISO. Pour un laboratoire de recherche, ça n'a pas d'intérêt ; mais pour certains organismes, qui sont à l'interface entre privé et public, respecter certaines normes dans la production d'informations géographiques peut avoir son importance, Inspire utilise des normes ISO. Ce sont des normes conseillées, sans être obligatoires

, Vous utilisez ces normes dans GéoGrandEst ?

, Oui, les métadonnées de GéoGrandEst sont fondées sur Inspire. 8 -31:48 > 35:37 Échanges de données entre collaborateurs [>R1]: J'avais une question sur l

, pour que les données mises à disposition par l'un ou l'autre restent utilisées dans le cadre du projet, avec la mention liée au projet. C'est plutôt comme ça qu'on formalise. Parce qu'entre laboratoires de recherche on n'est pas obligé de faire un accord de consortium stipulant toutes ces affaireslà, comme quand on travaille avec un partenaire privé. On a quand même, dans nos laboratoires, Généralement, on met en place une sorte de convention entre les laboratoires

, Est-ce le laboratoire qui est propriétaire des données terrestres que vous acquérez ? [>R2]: Oui, c'est plutôt le laboratoire qui est propriétaire. Après, il peut y avoir des labels différents, puisqu'on est des laboratoires CNRS. On va avoir des données qui sont rattachées au labo

, Est-ce que ça passe par là ? [>R2]: Non, parce qu'il faudrait créer un espace de stockage trop important. Souvent, le plus simple c'est un site FTP, qu'on met en place pour permettre un accès aux données en lecture et/ou en écriture. Après, ce sont des échanges classiques sur disque dur, Concrètement, comment échangez-vous ces données entre partenaires ? J'ai vu que vous aviez un site internet pour le projet T

, Est-ce qu'un site FTP induit forcément la notion de cryptage ? Annexes [>R2]: Oui, il y a une notion de sécurité derrière. C'est un accès sécurisé à un serveur de données à distance, dans le sens où il faut un login et un mot de passe pour s'y connecter. Il n'y a pas de cryptage, mais c'est quand même sécurisé. On ne crypte pas les données, quand on se les échange

, Et il a également une fonction de communication entre nous, puisqu'on a aussi un intranet, où l'on met les comptes rendus de réunion, des articles qu'on voudrait s'échanger, etc. 9 -35:37 > 42:26 Résultats de recherche [>R1]: Est-ce que le projet aboutira à créer des applications ?, Il a d'abord une fonction de communication auprès du public et de l'ANR

, Ça ne peut pas être un outil abouti, parce que ça n'est pas notre travail. En recherche, on ne crée pas un outil ou une plateforme ; on développe des codes, qui peuvent être réutilisés et appliqués pour d'autres choses. Donc la production est plutôt au niveau développements, méthodes voire rendus sous forme de cartographie (mais ce sera souvent validé sur de petits sites d'étude, Donc vous produisez plutôt une méthode qu'un outil abouti

, Avez-vous établi les thématiques en réponse à une demande des collectivités ? [>R2]: Oui

, On va leur montrer ce qu'on peut arriver à faire avec des données multi-sources et à haute fréquence temporelle. Ils pourront télécharger le code source, si c'est un code en libre accès. Après, si ça intéresse une collectivité, elle a plusieurs choix : soit elle a quelqu'un qui peut prendre en main un code et traiter de la donnée, Allez-vous leur fournir quelque chose au terme du projet ? Annexes [>R2]: Non

, La plateforme A2S peut faire de la prestation de service ? [>R2]: Oui, puisque ce sera une plateforme. Ça veut dire qu'elle peut faire un certain type de prestation de service liée à du traitement massif

, Ça veut dire que l'échange avec les collectivités territoriales est indirect ? [>R2]: Oui, tout à fait

. Qu, est-ce qui figure dans les publications ? Qu'est-ce que vous y exposez ?

, les données utilisées, les données en sortie et la manière dont celles-ci sont traitées, qui seront abordées

, Pour vous, les codes sources sont-ils des données ?

. Ça,

. Non, Je ne sais pas, quand on fait de la propriété intellectuelle, c'est une sorte de savoir-faire

C. Brevetable, Ça n'est pas brevetable mais -comment dire -c'est protégeable. Annexes [>R1]: On pourrait le mettre sous droit d'auteur ? [>R2]: Oui, c'est ça. C'est ce qui se fait maintenant avec les Creative Commons et autres licences du libre

U. Oui and . Production, C'est pour ça que, pour moi, la donnée reste quelque chose de brut, quelque chose qui est en entrée. Le code, ce n'est pas une entrée, c'est une sortie, Est-ce qu'on peut revenir rapidement sur toutes ces recommandations : la directive Inspire

, C'est l'open data, quoi ! [>R1]: Quelle utilité y voyez-vous ?

. L'utilité-c'est-d, éviter de refaire x fois ce qui a déjà été fait, de capitaliser et d'améliorer les connaissances, puisqu'on aura une profondeur historique sur un certain nombre de choses, grâce à des données acquises par d'autres. Ça va permettre aussi de valider nos propres méthodologies, si on sait qu'il y a un jeu de données disponible avec une vérité terrain ou des références

, Ça reste dans le cadre scientifique, voire ça peut percoler dans le milieu privé, si l'organisme privé s'approprie un des codes et propose autre chose/une valeur ajoutée. Il ne va pas vendre le code, il va vendre un produit, qui a une valeur ajoutée, directement utilisable par la collectivité. La collectivité, elle s'en fiche d'avoir le code. Elle n'aura dans le service ni les moyens, ni les compétences pour traiter tout ça. Annexes Donc ce qui va l'intéresser, c'est la carte ou la donnée transformée -i.e. avec une valeur ajoutée, Ces données peuvent-elles être utilisées dans un but commercial ? [>R2]: Non, justement. C'est vraiment la limitation

, Comment vous y êtes-vous prise ? [>R2]: J'ai regardé un peu ce qui existait, mais je n'ai pas essayé de quantifier quoi que ce soit

, Je sais qu'il y a une doctorante à l'université, qui travaille sur la valeur de l'information géographique

:. Intéressant, Je n'ai pas l'impression que cette question se pose encore dans les autres domaines

, Alors que dans le domaine géographique, effectivement, il y a beaucoup de réflexions là-dessus

, Comment vous l'expliquez ?

, La réflexion est plus ancienne, parce qu'en géographie la donnée est le coeur de métier

, Je me pose la question : si les données coûtent si cher, pourquoi les rend-on librement accessibles ? Ça signifie qu'un industriel va pouvoir les utiliser

. :-c'est-une-vaste-question, Ça reste une politique de vision à long terme. Les États-Unis ont tablé là-dessus depuis plus trente ans. Les images Landsat, par exemple, sont mises à Annexes disposition gratuitement par l'USGS depuis le début (l'USGS c'est l

, s) établissement(s) avez-vous effectué votre formation universitaire ? [>R2]: Je suis d'origine belge. J'ai fait mes études de géographie à Namur les deux premières années, puis à Louvain-la-Neuve les deux années suivantes. Ensuite j'ai fait une cinquième année à l'Université de Strasbourg en géographie, Vous savez s'ils ont d'ores et déjà pu mesurer le retour sur investissement

, On va collecter des données sur des individus, afin d'étudier par exemple l'obésité, les allergies ou tout ce qui a trait à l'environnement. Dans le laboratoire, il y a différents axes : certains travaillent plutôt sur la mobilité/accidentologie, d'autres sur la mobilité/déplacement, Est-ce que vous avez constaté des différences dans la gestion des données ? [>R2]: Oui, de grandes différences entre les laboratoires

C. Qu, Il y a des géographes, mais pas seulement. Il y a par exemple une physicienne de l'atmosphère, des hydro-écologues... C'est très diversifié. Ça répond à de multiples problématiques environnementales

, Dans un premier temps, pourriez-vous me résumer les objectifs scientifiques du projet ?

:. , dont la question du conflit d'intérêt a conflit d'intérêt. Je veux dire, nous ne sommes pas là pour dire : « regardez, celui-ci a un conflit d'intérêt grave » ou « non, là ce n'est pas un cas de conflit d'intérêt ». Ce n'est pas notre problème. Notre problème c'est de regarder comment ont 'ANR

, Il y a une partie, qui est centrée sur les revues médicales, donc sur les publications scientifiques. Là, les rédacteurs en chef et les comités de lecture se sont saisi de ces questions et ont essayé de proposer des modalités pour identifier un conflit d'intérêt. Par exemple, tous les auteurs doivent dire, en marge de l'article qui présente les résultats d'essais cliniques, par qui leur recherche a été financée

. Voilà, il y a différents journaux internationaux. Évidemment, les journaux les plus centraux et à la pointele, New England Journal, le Journal of American Medical Association

, Certains sont à mi-temps. Ça dépend, c'est un peu en fonction de nos compétences -parce qu'il y a des juristes, des historiens des sciences, des sociologues, des politistes. Et c'est un peu en fonction de nos questionnements par ailleurs. Il y a H., qui a pas mal travaillé sur la question de l'évaluation de la réglementation du médicament. Il y a B., qui a lui aussi travaillé sur la réglementation de produits, C'est un peu l'histoire et la sociologie de ces outils que sont les revues, avec aussi des allers et retours, des controverses

, Chacun mène ses recherches de son côté, On se voit tous les mois ou tous les deux mois. On dit chacun où on en est

, Quels types d'informations collectez-vous ? Comment vous y prenez-vous ? [>R2]: Moi je collecte deux types d'informations. La première, ce sont des informations type déclarations d'intérêt, qui sont publiées, donc il s'agit de les collecter, Mode d'acquisition des données

, Ce sont des entretiens semi-directifs ? [>R2]: Oui, c'est ça

, Pour ce qui est de la base de données, avec quel outil travaillez-vous ?

, Ce n'est pas moi qui vais faire le traitement quanti, ce sont les ingénieurs d'études

, On met en évidence des variables qui vont ensemble. C'est une vision d'un espace social, avec un groupe typique de gens, qui ont des propriétés allant ensemble

, Pas vraiment

, C'est un logiciel open source ?

, Ça n'est pas open source, c'est un logiciel qui s'achète. Mais on a des licences collectives. On forme nos étudiants, etc. Moi je ne sais pas le faire fonctionner en tant que tel

, Je le comprends et je sais l'interpréter. Mais la manip en tant que telle

, En sortie, on peut caractériser des populations. C'est plutôt descriptif dans un premier temps : on peut caractériser ces populations, on peut montrer des oppositions internes ou des choses qui vont ensemble

. Après, A votre avis, est-ce que cette base de données pourrait avoir une valeur pour des personnes externes au projet ou pour vous, mais dans le cadre d'un autre projet ? [>R2]: C'est toute la question, dont on a essayé de débattre lundi et mardi à ce fameux colloque. C'est tout l'enjeu. C'est-à-dire que, les uns ou les autres, nous produisons des données pour les besoins de notre recherche, avec une question bien particulière. Mais qu'en fait-on ensuite ? Est-ce qu'on les pérennise pour des enquêtes futures ? C'est ce que font M. et d'autres avec la base de données sur les députés européens. Pour chaque législature, il s'agit de mettre à jour la base, en complétant les nouveaux entrants, ceux qui s'en vont et ceux qui restent au Parlement européen, peut mettre en évidence des éléments typiques, qui vont être la contribution principale sur une population. 4 -18:10 > 31:21 Ouverture des données

E. Qu, on peut partager avec d'autres ? A quelles conditions ?

, Vous, vous en pensez quoi ?

:. , Sous forme de cartes perforées ? En même temps, je peut-on mettre la base, qu'on est en train de constituer, à disposition d'autres ? Je ne sais pas. Dans l'idéal, oui. Ce serait super. On pourrait faire ça, oui, une fois qu'on aura terminé notre enquête et qu'on aura pu en tirer ce qu'on voulait pour ces questions-là. Annexes [>R1]: D'autant plus que ça ne demanderait pas forcément un énorme travail. Cette base pourrait être facilement compréhensible par un chercheur du domaine ? [>R2]: Bien sûr, ça n'est pas une question de non compréhension. Simplement, la base peut paraître incomplète sur des tas d'aspects. Non pas parce que nous n'avons pas les données, parce que moi j'adorerais travailler sur des données qui ont été collectées dans les années 1960 ou 1970 par exemple -si tant est que ça soit possible

F. Ben, Je trouve ça plutôt bien, parce qu'on a travaillé sur cette base : on a pris du temps, de l'argent, pour le faire et c'est bien que ça serve à d'autres. Mais c'est vrai que, à part ce cas et quelques autres, chacun est un peu jaloux de ses propres données. Ça n'est pas complètement entré dans les moeurs, je crois. Et encore, je pense que c'est peut-être plus facile pour des données de type base biographique que pour des entretiens par exemple. Avec vous, là, j'ai signé un consentement éclairé. Je suis d'accord, mais est-ce que j'ai envie que tout le monde soit au courant ? C'est vrai que je ne vous dis pas des secrets

C. Qu, il y a cette question de la personne interrogée. Est-ce que la personne est d'accord pour que ce qu'elle dit soit réutilisé ? [>R2]: Voilà. Réutilisé dans quel cadre ? Elle n'en sait rien. C'est là où ça poserait problème

, Dans le projet d'archives orales des institutions européennes -j'en parlais ce matin avec les étudiants -, vous avez des tas d'anciens hauts fonctionnaires qui ont

, Mais ça n'est peutêtre pas la même chose dans un entretien sociologique ou dans les entretiens que vous faites là. C'est un vrai enjeu, qu'ils ne sont pas honnêtes avec eux-mêmes. Leur intention est plus large : ils livrent un témoignage pour la postérité. Évidemment, quand on est historien ou sociologue et qu'on travaille avec ces sources-là, on le sait et on les prend pour ce qu'elles sont

, Dans la base de données des déclarations d'intérêt, est-ce qu'il y a les noms des experts ? [>R2]: On n'est pas censé mettre les noms. Mais si on ne les met pas

, on va en sortir, il n'y aura rien de nominatif. C'est le principe d'une base quanti. En revanche, il faudra sans doute qu'on donne des exemples, afin d'illustrer les tendances d'une population à partir de cas particuliers. Donc ces cas particuliers seront nominatifs. En général, ce ne sont pas des informations secrètes, Donc on met les noms, mais évidemment, dans le traitement qu'on va en faire et dans ce qu

, Finalement la base n'a pas à être anonymisée, si les sources sont des informations rendues publiques ? [>R2]: Oui, mais on n'a pas le droit de faire des fichiers nominatifs

, Quelle règle vous l'impose ?

:. , Je crois qu'il y a des choses qui ont changé avec la loi du printemps

, Mais disons qu'on doit faire une déclaration à la CNIL, en décrivant ce que l'on fait et en précisant qu'on le fait à des fins de recherche

C. La, Là où on est susceptible de nous surveiller, c'est qu'il ne faut pas qu'on ait de fichiers nominatifs. Par exemple, si on a des entretiens, il ne faudrait pas que dans nos ordinateurs on ait le nom des gens qui ont dit ceci. Il faudrait qu'on anonymise tout de suite. Mais, quand on publie, on anonymise de toute façon toujours. Quelqu'un qui connaît bien le sujet pourrait recouper les informations et retrouver la personne dont il s'agit. Mais voilà, on se débrouille. Jusqu'à présent, mais qu'il faut que les personnes sur lesquelles on enquête soient prévenues. Par exemple, pour la base de données sur les députés européens, les discussions ont été assez compliquées

. Oui, En tout cas

, Voilà. 5 -31:21 > 39:10 Conservation des données [>R1]: Comment procédez-vous pour les entretiens ? Vous faites comme moi : vous enregistrez et vous retranscrivez

O. Oui and . Enregistre, En fait, il y a deux types d'entretiens. Il y a les entretiens hyper informatifs, comme ceux qu'on a faits avec des hauts fonctionnaires ou des du conflit d'intérêt, en rapportant toujours tel ou tel propos à la personne qui l'a dit, en fonction de son histoire, retranscrit, et ensuite on fait une petite fiche analytique (qui est la personne, les différents points abordés

, Quelle utilisation faites-vous de l'entretien informatif ? [>R2]: Disons qu'on en cite moins d'extraits, car ce sont souvent des informations factuelles

, On n'a pas besoin de rendre compte de la manière dont on nous a dit telle ou telle information

, mais comme on ne dispose pas de document qui explique ça, on va directement demander aux personnes qui, par exemple, Ce sont des informations qu'on aurait pu trouver dans des documents

, Conservez-vous les entretiens tout au long du projet de recherche ?

, Les conservez-vous également au terme du projet ? [>R2]: Oui. Moi j'ai tous les entretiens que j'ai menés depuis ma thèse. Je n'ai peut-être pas tous les fichiers audio

, Avez-vous tendance à être plutôt prudente à ce niveau-là ? Par exemple, faites-vous souvent des sauvegardes sur double disque

, Si on se balade avec notre ordinateur et qu'on se le fait voler par une personne malveillante, qui trouverait ces entretiens pouvant être retenus contre les personnes, Est-ce une politique du laboratoire ou bien une initiative personnelle ? Vos données sont-elles sauvegardées sur un disque dur personnel ? [>R2]: Oui. Je sais qu'on ne devrait pas

, Y êtes-vous sensibilisée ?

O. Oui, On nous dit : « il faut chiffrer votre ordinateur » ou « il faut être prudent, surtout avec les portables qu'on promène partout ». Je pense que les gens qui travaillent sur des sujets un peu plus sensibles (comme le phénomène de radicalisation ou les victimes de violences), eux, font super attention. Mais bon, moi j'ai travaillé sur des hauts fonctionnaires, On a des réunions d'information là-dessus

V. Fffff,

. C'est-vrai-que-Ça-n, Chaque fois qu'on sort de ces réunions, on se dit Annexes « oh la la, je fais n'importe quoi, ça ne va pas, Et puis on relativise. Quand l'enquête est finie, en général on la conserve sur un autre support (on imprime les documents et on les range dans des boîtes d'archive)

, Les réunions s'adressent aux directeurs d'unité, qui ensuite doivent rapporter les informations aux membres du labo. Les ingénieurs d'études, ici, sont très sensibilisés. Ce sont eux qui sont au contact de la CNIL, qui gèrent les bases de données, etc. Ils sont très au fait de ces questions et ils nous disent ce qu'il faut faire (déclarer à la CIL, Qui organise les réunions d'information

, Pour ce qui est de la base de données, qui va être créée dans le cadre du projet, qui la conservera : les ingénieurs d'études sur les serveurs du laboratoire ou bien vous-mêmes ? [>R2]: Ce sera un peu tout le monde

, On travaille avec l'espace partagé MyCore du CNRS, dont on nous a dit qu'il était sûr. Donc la base est sur MyCore. C'est un fichier Excel

, Vous n'êtes pas la seule à travailler sur cette base ? Tous les partenaires y contribuent, Oui, il y a tous ceux du projet M

:. , Je pense qu'on travaille dans une institution et un laboratoire et qu'à ce titre-là ce qu'on fait doit être propriété de l'institution et du laboratoire. Donc je suis sur une ligne très collectiviste de ce point de vue-là, en disant : « Voilà, on n'est pas des entrepreneurs indépendants. Ce qu'on fait

, Un nouveau chercheur a tout intérêt à avoir son domaine à lui, plutôt que de se mettre dans les pattes de quelqu'un et dire « ah ben oui, tu fais juste » ou faire de la réactualisation. Alors, c'est intéressant 50 ans après, parce qu'on se dit : « Ah tiens, machin avait montré que? etc. Qu'en est-il 50 ans après ? ». Là, ça pourrait être intéressant. Voilà, il y a cette dimension-là. Que vous dire d'autre sur ces données ? Oui, ça pose aussi un problème, quand on est plusieurs sur un même projet. Qui a la propriété des données ? Qui a le droit d'utiliser quoi ? Là, c'est sûr qu'il faut bien s'entendre au départ, afin qu'il n'y ait pas de querelles telles que « il m'a piqué mes données » ou « moi j'ai fait tout le boulot et c'est lui qui publie l'article ». Voilà, il faut être bien sûr que les articles sont coécrits par tous ceux qui ont contribué. Ça n'est pas évident. Mais, en ce qui me concerne, j'ai toujours bien réussi à organiser ça. Dans les enquêtes collectives que j'ai encadrées, on a publié collectivement -alors, chacun son chapitre, mais dans un ouvrage collectif qui faisait sens, surtout pour les jeunes chercheurs, Mais je ne suis pas pour imposer à tout le monde de déposer ses archives

, Ça m'est arrivé de donner des retranscriptions d'entretiens à un collègue, parce que je savais qu'il Annexes travaillait sur tel sujet et que ça m'était arrivé de rencontrer telle personne mais sur un sujet autre que le sien. En gros, sur 15 pages de retranscription, il y avait une page qui pouvait l'intéresser, A part ce projet sur les élites européennes, qui est plus collectif

. :-c'était-de-votre-propre and . Fait, Mais c'est assez rare. Après, je pense qu'on n'utilise pas assez les données qui sont produites. C'est une réflexion qu'on a eue au niveau de la MSH. C'est aussi la raison pour

, Vous faites référence aux données de la statistique publique ? [>R2]: Oui, mais je crois que c'est amené à être élargi à d'autres données. Par exemple, il y a l'entreprise BeQuali. On n'est pas forcé d'avoir son petit stock à soi

, Elles font partie des données. Quand on récupère les données d'autres, on n'a pas forcément les conditions de production qui vont avec. Et ça c'est un vrai problème. Alors, pour la statistique publique

. Données.-l'insee, Mais est-ce que c'est le job d'un chercheur ? [>R2]: Un chercheur c'est son job de documenter ses données, c'est ce qu

M. Dans-le-projet, Et quand on écrit un article ou un livre, on est tout le temps en train d'expliquer comment on a produit ces données ou comment on les a récupérées et ce qu'on en a fait. Ça c'est notre boulot. Mais est-ce que c'est notre boulot de le faire comme le ferait un archiviste ? Je ne sais pas. C'est ça l'enjeu principal. Parce qu'après on va crouler sous les données. Ce n'est pas le problème de la masse des données -il y en a déjà trop, ce Annexes qu'on pense qu'elle veut dire et comment il faudrait continuer ou réorganiser

, Savez-vous pourquoi les données disponibles sont peu utilisées ? Je pense à celles de l'INSEE ou du CASD

, Quelle utilisation celles-ci pourraient en faire ? [>R2]: Pour les entreprises, je ne sais pas. Pour la société, sans doute, mais peut-être pas directement comme ça, Parce qu'on n'est pas encore nous-mêmes au bout du processus. Mais, par exemple, O. et M. ont un partenariat avec faciles, de rétablir des vérités objectives et, à la fois, de réfléchir sur la place et le rôle du député dans la vie politique, dans la vie sociale

, Vous dites que O. et M. ont mis en ligne leurs résultats sous forme d'infographies

, Pour l'instant, ils n'ont pas mis à disposition les données brutes. Mais vous avez des ONG qui font ce travail, c'est-à-dire qui mettent à disposition des données pouvant être retravaillées ensuite. C'est ce qu'on a fait avec la base Transparence Santé : on en a extrait les données brutes, Ont-ils également mis à disposition les données brutes sous-jacentes

, Mais il suffit qu'on ait seulement l'initiale du prénom (et pas le prénom en entier), ça fait deux individus différents, alors qu'en réalité c'est la même personne. Parfois il y a une petite coquille, donc l'ordinateur met deux lignes différentes

, Mais comme n'importe quelles données

, Qui rentre ces données dans la base ? [>R2]: Ici c'est chaque industriel qui rentre ses données

, La manipulation de données personnelles est soumise à des règles dictées par la CNIL. Ces règles sont souvent peu pratiques pour les chercheurs. Exemple : anonymiser les entretiens dès la retranscription rend l'analyse plus compliquée

, Mais comme ce sont des gens qui sont plus ou moins des personnages publics et que les informations qu'on obtient proviennent soit de leur site internet, soit des déclarations qu'ils ont faites (déclarations qui sont elles-mêmes publiques), les données ne sont pas top secrètes. » « Là où on est susceptible de nous surveiller, c'est qu'il ne faut pas qu'on ait de fichiers nominatifs. Par exemple, si on a des entretiens, il ne faudrait pas que dans nos ordinateurs on ait le nom des gens qui ont dit ceci, « On doit faire une déclaration à la CNIL, en décrivant ce que l'on fait et en précisant qu'on le fait à des fins de recherche, et non dans un but commercial par exemple. En toute rigueur, il faudrait que chacune des personnes, sur lesquelles on travaille, soit informée qu'on travaille sur elle

. .. Remerciements,

. .. Résumé,

. .. Abstract,

. .. Sommaire,

. .. Liste-des-tableaux,

, Première partie -Qu'est-ce qu'une donnée de la recherche ?

, 1. Quand a-t-on commencé à définir les données de recherche ?

, 3.2. Typologie selon le niveau de traitement des données

.. .. Vers-une-non-définition, Les données de recherche se définissent relativement à un contexte épistémologique

. .. Conclusion,

, Sommaire détaillé Deuxième partie -Les politiques publiques de gestion et d'ouverture des données de la recherche

. .. , Mouvements à l'origine des politiques de gestion et d'ouverture des données de la recherche, 2003.

, 2.2.2. Rôle de la science dans l'économie de la connaissance

. .. L'open-data-devenu-objet-politique, 2.2. L'Open Data dans la politique : une démarche consensuelle mais des objectifs originels affaiblis

. Politiques and . .. De-l'union-européenne, 66 3.1.2.1. Première prise de position en faveur du libre accès aux résultats scientifiques (2007), 2012.

. .. Prescriptifs, 2.2. L'initiative première du Conseil européen de la recherche

, Sommaire détaillé

, 2.3.2. La rédaction de plans de gestion de données

, Vers une politique renforcée dans le prochain programme Horizon Europe, p.77

, 3.1. Les infrastructures de recherche financées par la Commission européenne, vol.80

. .. Eosc), 81 3.3.2.1. Cadre d'émergence de l'EOSC: le passage de l'économie mondiale au numérique

. Politiques and . .. État-français, Législation relative à la diffusion des données scientifiques

. .. , 91 4.2.1. La Bibliothèque Scientifique Numérique (2009-2017) et son successeur, le Comité pour la Science Ouverte, Initiatives du Ministère de la Recherche en matière de données de recherche, 2018.

. .. Conclusion,

, Troisième partie -Les services d'appui à la gestion et au partage des données de recherche

. .. Terrain, Un recensement des services de données par la Bibliothèque Scientifique Numérique

. .. De-services, 2.3. Conception d'une grille d'analyse pour chaque type de service

, 2.2. Divers par le périmètre de leur public cible

. .. , 4.1. A l'origine de l'offre de services des professionnels de l'IST : la défense du libre accès aux résultats de la recherche et le repositionnement de la profession

, Evolution des services de gestion et d'ouverture entre, 2016.

. .. Conclusion,

. .. , Quatrième partie -Les données dans les pratiques de recherche, p.153

. .. Terrain, 156 1.1. Une enquête sous forme d'entretiens semi-directifs

, 156 1.2.1. L'Université de Strasbourg pour terrain d'enquête

, Méthode

. .. , 164 2.3. Valeur des données dans un écosystème centré sur la publication scientifique

. .. , 175 2.3.2.1. Différentes perceptions de leur valeur, La valeur indirecte des données : une valeur d'usage

, 5.1. Premier facteur de variation : les ressources consacrées à la gestion des données dans le laboratoire ou le projet de recherche, des méthodes et outils variés et évolutifs

, Deuxième facteur de variation : le degré de sensibilité des données

. .. Ouverture-des-données,

, Nature du partage dans la culture scientifique : un échange censé contribuer à la renommée du chercheur

. .. Conclusion,

, 213 1. Enquête sur l'utilisation de services de données par les chercheurs, Cinquième partie -Adéquation entre les services de données et les pratiques des chercheurs

, Un recours peu fréquent aux services de données

, Deux ordres de services

. .. , Utilisation des services disciplinaires par les chercheurs

, 1.2.1. Banques de données d'enquêtes quantitatives en sciences sociales

, 2.4. Vers une partition entre producteurs et utilisateurs de données ?

, Quels services complémentaires pour les données de la recherche ?

. .. Conclusion,

. .. Bibliographie,

. .. Sources,

. .. Sitographie-&-acronymes,

. .. Annexes,

, Annexe 1 -Offre de poste pour la réalisation d'une cartographie nationale des services de données scientifiques

. .. , Annexe 2 -Équipe projet de Cat OPIDoR (octobre 2016 -septembre 2017), p.312

, Annexe 3 -Exemples de grilles d'analyse de deux types de services de données, p.313

, Exemple 1 : Grille d'analyse des services de type accompagnement

, Exemple 2 : Grille d'analyse des services de type entrepôt de données

, Annexe 5 -Cat OPIDoR : Page de résultats du domaine Sciences & Technologies (affichage sous forme de tableau)

, Annexe 6 -Cat OPIDoR : Page de résultats du sous-domaine Sciences du système Terre (affichage sous forme d'index)

, Annexe 7 -Cat OPIDoR : Champs descriptifs d'un service

, Annexe 8 -Tableau analytique des 44 services de gestion et d'ouverture des données étudiés dans la 3ème partie

, Annexe 10 -Guide d'entretien (1 er panel, 2018.

, Annexe 11 -Guide d'entretien (2 nd panel, mars -mai 2019)

, Annexe 12 -Exemples d'entretiens retranscrits

, Entretien avec le chercheur 2 (chimie)

). .. , , p.16

, Entretien avec le chercheur 18 (neurosciences)

, Sommaire détaillé Entretien avec le chercheur 26 (astronomie)

). .. , , p.37

, Entretien avec le chercheur 51 (sciences politiques)

, Annexe 13 -Exemples de tableaux thématiques comparés

, Exemple 1 : Tableau thématique sur la valeur des données

, Exemple 2 : Tableau thématique sur l'influence du cadre institutionnel

. .. Sommaire-détaillé,