Open Data : Les données ouvertes et leurs licences, quel cadre juridique?

Open Data: l’avenir ?

Rappel du contexte

Dans la continuité de notre projet de Veille Technologique centré sur le thème “Open Data: L’avenir?” et initié par un  premier article d’introduction paru le 4 octobre, nous nous intéresserons ce mois-ci au sujet suivant : “Les données ouvertes et leurs licences, quel cadre juridique ?”

Nous avions établi que différents acteurs mettaient en application ce concept de données ouvertes: les institutions publiques, privées et la société civile.

Le terme d’ “ouverture” utilisé ici est imprégné d’une forte connotation positive, il renvoie pourtant à de nombreuses subtilités qui, selon les choix effectués par l’institution ou le groupe libérateur de données, donnent lieu à une grande variété de publication de données, ouvertes ou non, selon l’appréciation de chacun.
Ces différentes subtilités se traduisent dans les faits par différents cadres juridiques, mis en place pour accompagner l’ouverture des données.
Au premier abord, le terme de “cadre juridique” semble induire une une protection des données libérées vis-à-vis d’un certain nombre de détournements aisément imaginables. En réalité ce cadre juridique permet également de s’assurer que les institutions ou groupes libérateurs de données agissent dans une véritable volonté d’ouverture et ne se contentent pas de surfer sur un mouvement à la mode souvent synonyme dans les esprits de transparence et de création d’opportunités.

Licence: Creative Commons CC0

Les principes de base de l’Open Data

L’Open Knowledge Foundation est une association à but non lucratif de droit britannique promouvant la culture libre, en particulier les contenus libres et l’open data (données ouvertes). Elle a été crée le 24 mais 2004 à Cambridge au Royaume-Uni (source – Ref 3)

Licence: Creative Commons Attribution 3.0 Unported (CC BY 3.0) , Open Knowledge Foundation policy

C’est face aux constatations du chapitre précédent que l’Open Knowledge Foundation à proposé l’”Open Definition” afin de “préserver la compatibilité, prévenir une éventuelle perte de sens du concept, et fournir une direction commune à cette multitudes d’initiatives dans des domaines très variés” (traduit de l’anglais depuis le site Open Definition, source – Ref 1).
Selon ces individus, un travail “ouvert” (comprendre contenu, donnée ou information) doit satisfaire à 11 conditions, dont voici un résumé (source – Ref 1):

“A piece of data or content is open if anyone is free to use, reuse, and redistribute it — subject only, at most, to the requirement to attribute and/or share-alike.”

Donc un contenu ou de la donnée est “ouvert(e)” si tout le monde est libre de l’utiliser, de le réutiliser et de le redistribuer. Les contraintes se limitant à l’éventuelle demande de l’auteur de respecter une clause d’attribution ou de viralité de la licence (un produit dérivé doit être publié sous la licence d’origine).

On retrouve cette approche au sein du diffuseur de licences libres Veni, Vidi, Libri , qui énonce 4 règles de bases. Selon ce site, les licences libres défendent 4 libertés : libertés d’utilisation, de modification, de redistribution,et de publication.

Licence: GNU FDL

Les licences en concret

Il faut dans un premier temps prendre garde à ne pas confondre les licences libres attribuées à des produits logiciels (on parle alors de licences open source) et les licences libres attribuées à des données ou contenus.
Si les licences libres attribuées aux logiciels sont désormais clairement définies dans le monde (allez visiter le site de l’Open Source Initiative), ce n’est pas encore le cas pour les licences libres qui concernent les données ou contenus. Dans ce dernier contexte, une politique d’harmonisation est en cours mais rencontre encore de grandes difficultés.

Il existe un grand nombre de licences dites “libres”, en effet toute personne peut créer sa propre licence tant qu’elle respecte les principes de base, et ces licences peuvent varier en substance selon la juridiction des pays concernés.

De plus il faut différentier le cas des bases de données, qualifié de sui generis, c’est à dire un cas particulier nécessitant d’écrire des textes juridiques spécifiques. Ce qui amène à ce propos l’Open Knowlegde Foundation à différentier l’“open content” de l’ “open data” (concerne surtout les bases de données) bien que ces deux termes fassent appel au concept de donnée ouverte.

Nous ne prétendons donc pas ici réaliser un inventaire exhaustif des licences ouvertes mais bien citer celles qui nous paraissent les plus couramment utilisées.

Licences Creative Commons

Les licences Creative Commons sont bien connues du grand public, mais sont-elles réellement ouvertes au sens de l’OpenDefinition citée plus haut?

“Une licence Creative Commons s’appuie sur un texte de base agrémenté au choix de 4 conditions. Le texte de base garantit le droit de distribuer le travail sous la licence concernée dans le monde entier si il est inchangé et que la distribution se fait gratuitement.” (source – Ref3) Les 4 conditions annexes sont consultables dans le tableau suivant (traduit depuis la source – Ref3):

IconE DROITs Description
Attribution Attribution (BY) Les utilisateurs peuvent reproduire, diffuser, afficher et réutiliser les données seulement s’ils attribuent à l’auteur la paternité des données – dans les termes spécifiés par la licence (sans pour autant suggérer que l’auteur approuve leur utilisation).
Share-alike Share-alike (SA) Les utilisateurs peuvent reproduire, diffuser, et modifier l’oeuvre seulement sous une licence identique à la licence qui régit l’oeuvre initiale.
Non-commercial Non-commercial (NC) Les utilisateurs peuvent reproduire, diffuser et (à moins que l’auteur ait spécifié ‘Pas de Modification’) modifier l’œuvre, pour toute utilisation autre que commerciale, à moins qu’ils obtiennent l’autorisation de l’auteur au préalable.
Non-derivative No Derivative Works (ND) L’auteur autorise la reproduction et la diffusion uniquement de l’original de son oeuvre. Si quelqu’un veut la modifier, il doit obtenir son autorisation préalable.

En pratique, les combinaisons les plus régulièrements utilisées sont BY,BY-ND,BY-SA, BY-NC, BY-NC-ND, BY-NC-SA.
Si nous confrontons cette approche avec l’OpenDefinition citée plus haut, nous comprenons bien qu’une licence Creative Commons n’est pas systématiquement synonyme de travail ouvert. Les clauses NC (Non-Commercial) et ND (Non-Derivative) sont en effet incompatibles avec une liberté d’utiliser, de réutiliser et de redistribuer en se contentant, si l’auteur le demande, de respecter une clause d’attribution ou de viralité de la licence.
A priori, les licences de type Creative Commons qui garantissent un travail ouvert et qui sont couramment utilisées sont celles qui font appel aux combinaisons de conditions BY, BY-SA. Il faut également citer la licence Creative Commons de base, dédiée aux travaux appartenant au domaine public: Creative Commons CCZero (CC0), évidemment compatible avec le concept de donnée ouverte.
Attention, parmi ces licences seule la licence CC0 (Creative Commons CCZero) s’adapte au cas sui generis des bases de données.

Licences de l’Open Knowledge Foundation

L’Open Knowledge Foundation référence et donne donc crédit à différentes licences ouvertes, nous nous concentrerons ici sur celles qui traitent le cas sui generis des bases de données et qui se voient donc attribuer la caractéristiques de licence “Open Data” et pas uniquement d’ “Open Content”.

Dans ce cas particulier, on trouve trois licences compatibles avec la notion de donnée ouverte, les caractéristiques de chaque licence sont issues de la page Wikipedia sur les données ouvertes:

- Open Data Commons Public Domain Dedication and License (PDDL)
La licence Public Domain and License (PDDL) donne la possibilité d’utiliser, de copier, de modifier, de redistribuer une base de données sans aucune restriction. C’est une licence libre de tout droit, de type domaine public. Les données peuvent donc être exploitées de façon totalement libre et l’auteur abandonne son droit moral.
- Open Data Commons Attribution License (ODC-BY)
Cette licence que l’on retrouve sous le sigle ODC-by autorise l’utilisation, la copie, la redistribution, la modification, la réalisation de travaux dérivés de la base de données, sous réserve d’indiquer le nom de l’auteur de la base de données originale.
- Open Data Commons Open Database License (ODbL)
La licence ODC-ODbL est fondée sur le droit d’auteur et le droit sui generis des bases de données. Elle donne la possibilité aux utilisateurs de copier, distribuer, utiliser, modifier et produire une œuvre dérivée à partir d’une base de données sous réserve de la redistribuer sous les mêmes conditions imposées par la licence originale. Elle implique aussi d’indiquer le nom de l’auteur de la base de données d’origine.
C’est la licence notamment utilisée pour le projet OpenStreetMap.

L’Open Knowledge Foundation donne également crédit à la licence Creative Commons CCZero (CC0) présentée précédemment.

Données ouvertes: des difficultés pour s’adapter aux juridications des différents pays – le cas particulier de la France

A ce stade de l’article, nous avons donc compris l’importance du cadre juridique et les subtilités qui l’accompagnaient. Or le cadre juridique est forcément influencé par la législation du pays concerné, ne serait-ce que par le caractère linguistique d’une licence: en droit chaque mot compte et donc la langue de base d’une licence prédestine celle-ci a des pays et contextes particuliers.
Ainsi la plupart du temps, l’ouverture des données publiques se fait selon une licence spécifique à l’institution génératrice de données.

La France incarne ici un cas particulier, en effet la législation établit le cas des “données sensibles”.

“D’un point de vue strictement juridique, et au sens de la loi informatique et libertés, les données sensibles sont les données qui font apparaître directement, ou indirectement : les origines raciales ou ethniques, les opinions politiques, philosophiques ou religieuses, les appartenances syndicales des personnes, ou qui sont relatives à la santé ou l’orientation sexuelle de celles-ci.”

(source – Ref 4).

Ainsi l’administration française utilise principalement deux licences:
- la licence OdBL présentée précédemment et qui a été traduite en français, elle est beaucoup utilisée par les collectivités locales.
- la licence ouverte créée par la mission Etalab fin 2012 pour encadrer l’ouverture des données de l’Etat français qui cherche à s’inscrire “dans un contexte international en étant compatible avec les standards des licences Open Data développées à l’étranger et notamment celles du gouvernement britannique (Open Government Licence) ainsi que les autres standards internationaux (ODC-BY, CC-BY 2.0).” (source – Ref 5)

Logo de "Licence ouverte /Open License" conçu par Etalab

Les institutions publiques sont régulièrement critiquées sur leur approche Open Data, accusée d’utiliser le cadre juridique spécifique à la France, et notamment le concept de “données sensibles”, comme un frein dissimulé à l’ouverture des données.
On peut citer notamment un article publié le 7 octobre 2013 par le journal Le Monde et intitulé “L’Open data, la ministre de la Santé n’en veut pas” (source – Ref 6). Dans cet article rédigé par le collectif Initiative Transparence Santé et qui s’étonne avec ironie de l’absence d’une réelle politique d’ouverture des données publiques sur la santé, on peut lire: “Celles (les données – ndr) dont l’utilisation permettrait d’envisager de réelles avancées dans la gestion de notre système de santé, les données individuelles anonymisées notamment, la ministre de la Santé n’a aucune intention de laisser les acteurs extérieurs à la sphère publique en disposer.” Parmi les raisons invoquées par les opposants à un accès plus large aux données, on peut citer le rapport de l’Igas:” En croisant certaines informations on peut identifier des personnes connues par ailleurs “. Un risque qualifié par l’auteur de l’article ” d’opportuniste, de ponctuel et ne concernant à chaque fois qu’un petit nombre de personnes “. Et pourtant ces données sont à disposition des laboratoires privés, le collectif Initiative Transparence Santé termine donc son article par un dernier paragraphe intitulé “Les vrais causes de la rétention” et qui explique notamment que “Si les pouvoirs publics freinent des quatre fers pour ouvrir l’accès aux données, c’est bien qu’ils craignent qu’on lève le voile sur l’incompétence dont ils font preuve depuis des années dans la gestion du système de soins.”

C’est face à ces considérations que le réseau Regards Citoyens a rédigé un ensemble de recommandations simples destinées aux acteurs publics en vue de définir un cadre juridique réellement libre à l’ouverture des données publiques.

L’avenir ?

Une des questions que l’on peut se poser sur l’avenir des licences des données ouvertes est de savoir si la tendance sera à la multiplication de ces types de licences, afin de permettre une adaptabilité à chaque contenu, ou au contraire à une harmonisation afin de gagner en visibilité auprès du grand public. Cette question sera clé pour la réussite des application open-source sur le marché.

Pour le cas particulier de la France, il conviendra aussi de suivre l’évolution (ou non) de la juridiction en la matière.

Auteurs:

Augustin Doury et Raphaël Traineau

Sources:

Ref1: Open Definition
Ref2: Page Wikipedia sur l’Open Knowledge Foundation
Ref3: Page Wikipedia sur la licence Creative Commons
Ref4: Site sur les données personnelles de Thiébaut Devergranne, docteur en droit et consultant.
Ref5: Descriptif de la licence ouverte sur le site gouvernemental d’Etalab (service chargé de l’ouverture des données publiques en France)
Ref6: Article paru sur LeMonde.fr le 07/10/2013 : « L’Open data, la ministre de la Santé n’en veut pas »

Projet de veille technologique 2013-Le contenu des articles traitant du sujet “Open Data: l’avenir?” sera publié sous la licence WTFPL .

Leave a Reply

Your email address will not be published. Required fields are marked *

*

You may use these HTML tags and attributes: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>