Are you F.A.I.R ?

Are you F.A.I.R ?

Après le DMP ( data management plan) traduit en français par le PGD ( plan de gestion des données), voici les critères F.A.I.R. Ils sont étroitement liés au DMP.


Au niveau international, les interlocuteurs traitant de la recherche scientifique, que ce soit les chercheurs, les bailleurs de fonds, les éditeurs, tous ont désiré que les données de la Recherche soient lisibles et facilement réutilisables. Le Fair Data en est le principe et permet de valoriser ces données dans des règles partagées par toute la communauté scientifique.

Force 11, groupe international composé de chercheurs, d’éditeurs, de sociétés savantes, d’universités, de bibliothécaires, d’archivistes, tous intéressés par l’avenir de la communication de la recherche scientifique sont chargés de porter le projet FAIR.

Mais que signifie FAIR ? En anglais, on l’utilise dans des expressions telles Fair play pour désigner un comportement honnête dans le jeu et par extension dans les relations humaines.

Le FAIR data implique que les données déposées par les chercheurs obéissent à des règles. La donnée scientifique déposée doit être « Facile à trouver, Accessible, Interopérable et Réutilisable »

 (en anglais : FindableAccessibleInteroperableReusable, d’où l’acronyme « FAIR »).

En Europe, le programme Horizon 2020 du Ministère de l’Enseignement Supérieur et de la Recherche incite au FAIR data dans tous les projets scientifiques financés au moins par moitié par les fonds publics ( subventions européennes, etc…) Les DMP rédigés par les unités de recherche lors de candidatures à des appels à projets scientifiques doivent être FAIR pour faciliter les échanges, le traitement, le stockage, la publication des données scientifiques en accès ouvert

  • F comme Findable (facile à trouver)

Pour être fair data les données d’une recherche scientifique publiées en open access doivent être facilement retrouvables par tous les moteurs de recherche. A vos mots-clés messieurs les chercheurs. Vous devez porter une attention particulière au choix de vos descripteurs ou mots clés qui seront moissonnés par les moteurs de recherche.

En plus d’un choix cohérent et pertinent de mots clés, votre travail doit être facilement identifié pour être retrouvé. Vous avez besoin d’un identifiant unique et pérenne pour vous et votre travail. Ce sont les ID que ce soit les Research Identifier tel ORCID par exemple et les Object identifier tel le DOI par exemple. Ces ID vous permettent de vous identifier et d’accéder à votre compte utilisateur sur une plateforme informatique. Cet identifiant UNIQUE et PERENNE permet de faciliter l’archivage de vos données sur le long terme.

  • A comme accessible

Pour fair data, vos données doivent être facilement récupérables et en accès ouvert. Vos métadonnées descriptives, administratives techniques de vos documents doivent rester disponibles selon des conditions juridiques définies et claires grâce à l’usage des licences créatives commons par exemple. Les métadonnées du document doivent rester accessibles même si l’ensemble des données ne l’est plus.

Si les données doivent subir une restriction de publication il est recommandé de dire pourquoi et pour combien de temps en se référant aux embargos possibles.

Si les données ne sont accessibles que par l’utilisation d’un logiciel open source particulier, vous devez mettre le code source de ce logiciel à disposition sur une plateforme d’échange telle GitHub ou Zenodo. Préférez des plateformes de dépôts certifiés.

  • I comme intéropérable

L’interopérabilité est la capacité que possède un produit ou un système, […] à fonctionner avec d’autres produits ou systèmes existants ou futurs et ce sans restriction d’accès ou de mise en œuvre. Celà implique que les contenus et les formats utilisés pour les données doivent respecter les grands standarts internationaux en usage

  • R comme réutilisable

La réutilisation des données doit pouvoir être permis et l’origine doit toujours être signalée

Les métadonnées doivent être richement décrites

  • descriptives ( nom, prénom, affiliation, mots -clés décrivant le document )
  • administratives ( adresse mail etc..),
  • techniques ( formats utilisés, poids etc..)

Ce principe du FAIR DATA doit pouvoir faciliter le DATA MINING c’est à dire la recherche par fouille de données à l’intérieur d’un document ou sur un ensemble de documents.

Le Big data évolue très rapidement et devant la montée exponentielle des données, il est nécessaire d’organiser des dépôts cohérents, obéissant à des règles claires qui faciliteront ensuite le travail des ordinateurs lors de l’analyse de ces données bien structurées.

Ceux-ci analyseront les données, les mettront en relation, les lieront et produiront eux-même du nouveau. C’est l’avènement de l’intelligence artificielle et l’accélération des processus d’innovation en science


Les enjeux sont donc majeurs pour notre société et son évolution. La recherche scientifique avec l’accès ouvert aux données nous fait rentrer dans l’ère de la donnée, du web sémantique et de l’intelligence artificielle.

C’est le web 3.0


DES QUESTIONS ?

Comment rendre vos données FAIR ?

Vous avez besoin de conseils pour rendre vos données FAIR ? Lisez ceci
https://www.openaire.eu/how-to-make-your-data-fair


Comment choisir une licence ?

RDV sur le site de l’INRAE

https://www6.inra.fr/datapartage/Partager-Publier/Choisir-une-licence


Les données de la Recherche, c’est quoi ?1 Texte du portail open access Rennes 1 https://openaccess.univ-rennes1.fr/les-donnees-de-la-recherche

 Les données de la recherche sont définies comme des enregistrements factuels (chiffres, textes, images et sons), qui sont utilisés comme sources principales pour la recherche scientifique et sont généralement reconnus par la communauté scientifique comme nécessaires pour valider les résultats de la recherche. » (OCDE, Principes et lignes directrices pour l’accès aux données de la recherche financée sur fonds publics, 2007)

Cette définition apparaît cependant trop restrictive en ce qu’elle exclut d’autres types de données : carnets de recherche, projets, rapports, etc.


Où déposer les données de la recherche ?2 Texte du portail open access Rennes 1 https://openaccess.univ-rennes1.fr/les-donnees-de-la-recherche#section-2

Choisir un portail de données thématique

  • Le répertoire re3data.org recense les archives de données par discipline.
  • Le portail Zenodo

Si vous n’avez pas trouvé d’archive thématique appropriée, le projet OpenAIRE fournit une archive Zenodo qui peut être utilisée pour le dépôt des données de la recherche.

Mise à jour le 30/01/2020

Ce(tte) œuvre est mise à disposition selon les termes de la Licence Creative Commons Attribution – Pas d’Utilisation Commerciale – Partage dans les Mêmes Conditions 4.0 International.

References   [ + ]

1. Texte du portail open access Rennes 1 https://openaccess.univ-rennes1.fr/les-donnees-de-la-recherche
2. Texte du portail open access Rennes 1 https://openaccess.univ-rennes1.fr/les-donnees-de-la-recherche#section-2

Laisser un commentaire

Ce site utilise Akismet pour réduire les indésirables. En savoir plus sur comment les données de vos commentaires sont utilisées.

I footnotes