La diversité disciplinaire
Au fur et à mesure que l’open access s’impose dans les pratiques des spécificités disciplinaires apparaissent.
EN SCIENCES HUMAINES ET SOCIALES
AUTRES DISCIPLINES
- Paléoclimatologie
- Les données géographiques : LA DIRECTIVE INSPIRE
- Les données biomédicales
- Parcours de formation sur les données en bio-informatique
- Entrepôts de données biomédicales : mode d’emploi
- formation sur les données biomédicales : Les bases de données de référence (génomiques et protéiques) telles GenBank, UniProt, PDB (Protein Data Bank), KEGG (Kyoto Encyclopedia of Genes and Genomes), etc comme GEO (Gene Expression Omnibus), ArrayExpress. Les bases de données des variations génétiques telles dbSMP (Single Nucleotide Polymorphism Database), GWAS Catalog (Genome Wide Association Studies). Les bases de référence des ontologies et des taxonomies comme GO, NCBI (National Center for Biotechnology Information).
- entrepôts certification HDS données de santé
- Galaxie : analyse des données en génomique
- Agriculture, environnement, alimentation : thésaurus INRAE
- en agriculture/agronomie : le vocabulaire contrôlé multilingue AGROVOC
- en archéologie : le thésaurus PACTOLS
- en environnement/écologie : le référentiel taxonomique TAXREF et le thésaurus GEMET
- En médecine/santé : le thésaurus MeSH
- climatologie, en météorologie ou encore en océanographie : « netCDF est un format de fichier comme csv qui permet la gestion de données scientifiques stockées sous la forme de tableaux. C’est un modèle de représentation des données qui s’applique bien pour structurer des données qui évoluent en fonction de certaines dimensions (temps, altitude, profondeur, latitude, longitude etc…). Il est recommandé pour les scientifiques et gestionnaires de données dans le cadre de la science ouverte par l’infrastructure de recherche Data Terra car il procure un cadre de standardisation international qui permet l’interopérabilité, la pérénnité et la réutilisation des données ». Doranum
- Mathématiques théoriques
- Le partage des essais cliniques
Le Comité international des rédacteurs de revues médicales (ICMJE) exige qu’une déclaration de partage des données (DSS – pour Data sharing statement en anglais) soit incluse dans chaque publication à partir du 1er juillet 2018 et qu’elle soit spécifié au préalable lors de l’enregistrement de l’essai clinique à partir du 1er janvier 2019.
10 règles à appliquer pour le partage des données issues d’essais cliniques
journal.pcbi_.1010879-2LES DONNÉES GÉOGRAPHIQUES
Cette directive concerne plus spécifiquement les données géographiques, environnementales. Qu’elles soient de nature administratives ou issues de la recherche, elles obéissent à des principes particuliers que la directive INSPIRE décrit.
La directive INSPIRE vise à créer une infrastructure de données spatiales de l’Union européenne aux fins des politiques environnementales de l’UE et des politiques ou activités susceptibles d’avoir un impact sur l’environnement. Cette infrastructure européenne de données spatiales permettra le partage d’informations spatiales environnementales entre les organisations du secteur public, facilitera l’accès du public aux informations spatiales dans toute l’Europe et contribuera à l’élaboration des politiques au-delà des frontières.
https://inspire.ec.europa.eu/about-inspire/563
- En écologie : utilisation d’un standard de métadonnées en EML plus facile à utiliser que la directive INSPIRE
LE STANDART EML OU LA DIRECTIVE INSPIRE ?
webinaire-gtso-couperin-INSPIRE_EML_PNDB_YvanLeBras_23032023CAT INDORE ET DATA INDORE
Cat Indore
Annuaire pour les données en environnement et biodiversité avec une fiche par base ou jeu
de données.
- Catalogue utilisant des standards internationaux pour une bonne interopérabilité entre les systèmes
- Possibilité de lier des ressources : protocole d’acquisition, lien vers les données, vers des articles (HAL) : centralisation des informations.
Data.InDoRES
- Entrepôt Dataverse : consensus dans communauté recherche (INRAE, IRD, Recherche Data Gouv)
- Données stockées de manière sécurisée et pérenne au Centre de Calcul de l’IN2P3 (infrastructure nationale de recherche).
- Structuration par unité ou par projet (exemple ANR) pour une visibilité accrue.
- Possibilité embargo jusqu’à publication article
- Interface français/anglais
- DOI et format de citation pour réutilisation
- Licence CC-BY 4.
SCIENCES DE LA VIE
L’outil Bio.Tools est un « catalogue ouvert de logiciels et bases de données en sciences de la vie permettant aux scientifiques de trouver, comprendre, utiliser et citer les ressources dont ils ont besoin dans leur travail quotidien »
Blog Institut Pasteur
LES DONNÉES DE SANTÉ
Les données par principe doivent être aussi ouvertes que possible, aussi fermées que nécessaire. Les fermetures sont fixées par la loi. Il existe un certain nombre d’exceptions à l’ouverture :
les_donnees_de_santeDIX RÈGLES POUR LE PARTAGE DES DONNÉES ESSAIS CLINIQUES
doi : 10.1371/journal.pcbi.1010879
- Traduction
- Original
- Épidémiologie et ouverture des données à caractère personnel
LES ONTOLOGIES BIOMÉDICALES
- Le service de recherche d’ontologies (OLS) est un référentiel d’ontologies biomédicales qui vise à fournir un point d’accès unique aux dernières versions d’ontologies. Vous pouvez parcourir les ontologies via le site Web.
AGRICULTURE
- Agriculture, environnement, alimentation : thésaurus INRAE
Mise à jour du 16/06/2023