CONFUSION ENTRE PUBLICATIONS ET DONNÉES
Il ne faut pas confondre publications de la recherche type articles, communications dans un congrès, chapitre d’ouvrage avec données de la recherche. Ceux-ci ont servi à réaliser les études scientifiques publiées. Les premières sont assez faciles à circonscrire, les secondes sont très nombreuses et en fonction des spécialités scientifiques.
DÉFINITION DES DONNÉES
La définition sur laquelle on s’accorde est celle qui a été produite par l’OCDE en 2007 et qui définit les données comme « des enregistrements factuels, des textes, des images, des sons qui sont utilisés comme des sources pour la recherche et qui sont nécessaires à la validation des résultats. «
Cécile Arènes Mooc FUN Science Ouverte

LES TYPES DE DONNÉES
- Données d’observation comme des remontées de terrain, des données de capteurs.
- Données expérimentales en médecine, en psychologie.
- Données textuelles, d issues de corpus de textes et de corpus d’archives.
- Données audiovisuelles, donc des enregistrements audio, des séquences filmiques.
- Images fixes d’objets, de paysages, d’architectures.
- Enfin, on peut trouver d’autres types de données : des données chiffrées, des données d’enquêtes, de sondages et puis des données web ou des données 3D et de simulation
« Ce que l’on exclut : des analyses préliminaires, des programmes de travaux futurs, des examen par les pairs, des communications personnelles avec des collègues, des mails. On va exclure également des objets matériels, des supports de formation et des données administratives. «
Cécile Arènes Mooc FUN Science ouverte
PROPRIÉTÉ INTELLECTUELLE DES DONNÉES DE LA RECHERCHE
DIFFUSION DES DONNÉES DE LA RECHERCHE
La loi impose un principe d’ouverture des données par défaut aux administrations, ainsi qu’un principe de gratuité. Il existe cependant un certain nombre d’exceptions à cette ouverture.
On dit généralement que « les données de la recherche doivent être ouvertes aussi souvent que possible et fermées aussi souvent que nécessaire ».
LES EXCEPTIONS À LA DIFFUSION DES DONNÉES DE LA RECHERCHE
Vidéo DORANUM | DOI :10.13143/F8RN-GZ92
- La protection de la vie privée et des données à caractère personnel
Sauf dispositions législatives contraires ou si les personnes intéressées ont donné leur accord, lorsque les documents […] comportent des données à caractère personnel, ils ne peuvent être rendus publics qu’après avoir fait l’objet d’un traitement permettant de rendre impossible l’identification de ces personnes.
- Les droits de propriété intellectuelle
Ne sont pas considérées comme des informations publiques, pour l’application du présent titre, les informations contenues dans des documents […] sur lesquels des tiers détiennent des droits de propriété intellectuelle.
- La protection de la confidentialité et des secrets
Pour protéger les secrets, la loi prévoit une série d’hypothèses où la communication d’un document peut être refusée : secret défense, sûreté de l’État et sécurité publique, secret des délibérations du gouvernement, secret médical, etc.
- le secret en matière commerciale et industrielle.
Les entreprises privées, partenaires de projets, pourront aussi imposer la non-divulgation de certaines données susceptibles de fragiliser leur position sur un marché. Les accords de consortium signés pour le montage de ce type de partenariats public-privé de recherche comportent généralement des clauses de confidentialité et de partage de propriété sur les résultats de recherche. Ceux-ci peuvent interférer avec l’ouverture par défaut.
Les exceptions. Site Paris Nanterre
LA RÉUTILISATION DES DONNÉES DE LA RECHERCHE
LES LICENCES DISPONIBLES
Vidéo DORANUM | DOI :10.13143/SSH2-ZD93
- licence Etalab, Creative Commons
- Licence GNU, Apache, Cecill, BSD (licences logiciels)
- Licence ODBL (bases de données)
LES BASES DE DONNÉES
Une base de données est un recueil d’œuvres, de données ou d’autres éléments indépendants. On les dispose de manière systématique ou méthodique. On peut y accéder individuellement par des moyens électroniques ou par tout autre moyen.
DROIT D’AUTEUR DE LA BASE DE DONNÉES
CRITÈRE D’ORIGINALITÉ/ DROIT SUI GÉNÉRIS
« Si des choix originaux et justifiables ont été fait sur l’architecture, la structure d’une base de données pour classer, indexer les données, le/la ou les créateurs et créatrices de la base détiennent sur celle-ci des droits d’auteur. Ce sont donc les chercheuses, chercheurs, ingénieures et ingénieurs qui ont construit la base de données qui doivent voir leur nom attaché à toute citation ou diffusion de cette base et qui ont le choix de garder l’exclusivité de la diffusion de son architecture ou de la partager.
Si la base de données ne présente aucun choix original dans sa construction (comme pour la réalisation d’un annuaire par exemple), le droit d’auteur ne peut pas s’appliquer. C’est une autre branche de la propriété intellectuelle qui prend le relai : le droit sui generis des bases de données. Le producteur ou la productrice de la base est titulaire de ce droit .Cette personne a fourni des investissements financiers, matériels et humains pour l’obtention de la base, sa constitution, sa vérification.
Le droit sui generis s’applique au contenu de la base, c’est-à-dire les données. Le titulaire du droit est donc celui qui peut autoriser ou empêcher l’extraction de tout ou d’une partie substantielle de la base. Dans le cas de la recherche publique, il s’agit de l’établissement de recherche.
Cependant, depuis La loi pour une République numérique (2016), les informations produites par les établissements publics peuvent être librement réutilisées, ce qui limite les restrictions liées au droit des bases de données dans le cadre d’une recherche financée sur fonds publics. »