Open Research Data (ORD) / Données de la Recherche

« Il est indispensable de maîtriser les données dans la durée » car « les données de la recherche sont le pilier des connaissances futures» (Frédérique Vidal, discours du 4 juillet 2018)

Publié le 29 janvier 2019 Mis à jour le 9 février 2023
Lorsque l’on parle de données, il faut comprendre qu’il s’agit essentiellement de résultats de recherches originales. Ces données peuvent être de natures très diverses :
  • Données d’observation (capturées en temps réel) : relevés météo, images, enquêtes sociales, fouilles archéologiques, témoignages oraux…
  • Données expérimentales (obtenues à partir d’équipement et de manipulation en laboratoire) : séquence peptide, poids biomasse…
  • Données de simulations numériques (générées par des modèles informatiques) : modèle climatique, modèle économique…
  • Données dérivées ou compilées (issues de traitement de données brutes) : bases de données compilées, fouille de textes…
La déperdition de ces données construites par les chercheurs est inquiétante car la  construction de corpus (collecte de données, contexte des expériences, méthodologies ou process détaillés et des analyses) reste une part importante du travail de chercheur. Ces données sont analysées en vue de produire ou de valider des résultats de recherche originaux.

Les principales causes des pertes de données sont les erreurs humaines, les erreurs matérielles, ou encore la corruption de données. Ces disparitions ont engendré des coûts :
  • financiers (argent public)
  • humains (investissement des chercheurs)
  • sociétaux
  • scientifiques (disparition irréversibles des preuves et de méthodes)
Ce phénomène a été suivi d'une prise de conscience : partager, diffuser, documenter les données devient la condition indispensable pour « améliorer » la science ou du moins la rendre plus efficiente.

Grâce à son programme Horizon Europe, l’Union Européenne soutient et investit dans l’ouverture des données de la recherche (Open Research Data). Ainsi le portail de l'European Open Science Cloud (EOSC) offre aux chercheurs un environnement sûr où stocker, analyser et réutiliser des données à des fins de recherche, d’innovation et d’éducation. Ce point d'entrée universel donne la possibilité à 1,7 million de chercheurs et 70 millions de professionnels des domaines des sciences, des technologies, des sciences humaines et des sciences sociales d'accéder à un volume croissant de données ouvertes.

Le Collège des données de la recherche du Comité pour la science ouverte a édité en avril 2022 un court guide à l’attention des chercheurs, pour leur présenter les enjeux du partage de leurs données, les accompagner dans leurs démarches et favoriser la réutilisation des données de la recherche. Il permet de comprendre de manière très concrète comment procéder pour lier données et publication. 
Ce très utile guide Partager les données liées aux publications scientifiques est téléchargeable sur le site du Ministère de l’Enseignement Supérieur, de la Recherche et de l’Innovation.
 

Pour aller plus loin

> Cycle de vie des données
> Plan de gestion de données
> Se former : Opidor
> Vocabulaire de la donnée de la recherche ouverte
> Repères juridiques en France
> FAIR - Licences de réutilisation dans le cadre de l'OPEN Data