Les données ouvertes, la protection des données personnelles et la CNIL

Open Data: l’avenir ?

  • Rappel du contexte

Dans la continuité de notre projet de Veille Technologique centré sur le thème           “Open Data : L’avenir?”, nous nous intéresserons ce mois-ci au sujet suivant : “Les données ouvertes, la protection des données personnelles et la CNIL”.
Cette réflexion fait suite à notre deuxième article « Les données ouvertes et leurs licences, quel cadre juridique ? »

Pourquoi ce thème ? Tout simplement parce que cette problématique est d’actualité sur la toile et qu’elle semble se poser d’elle-même lorsque l’on considère la libération ou la création d’importants jeux de données sous licence libre par le secteur public, privé ou par la société civile.
Mais quels sont les liens entre données ouvertes et protection des données à caractère personnel ? Qui a la responsabilité de traiter cette question ? Faut-il encadrer juridiquement ce processus de libération de données ? Et si oui, a qui en incombe la légitimité ?

Commençons par une définition, qu’est-ce qu’une « donnée à caractère personnel » ?

Extrait de l’article 2 de la loi n°78-17 du 6 janvier 1978 dite Loi Informatique & Libertés :
« Constitue une donnée à caractère personnel toute information relative à une personne physique identifiée ou qui peut être identifiée, directement ou indirectement, par référence à un numéro d’identification ou à un ou plusieurs éléments qui lui sont propres. Pour déterminer si une personne est identifiable, il convient de considérer l’ensemble des moyens en vue de permettre son identification dont dispose ou auxquels peut avoir accès le responsable du traitement ou toute autre personne. »

Dans l’hexagone, lorsqu’on évoque la protection des données personnelles, on pense en général à la CNIL (Commission Nationale de l’Informatique et des Libertés) [1]. Mais la CNIL s’est-elle penchée sur cette mouvance Open Data ? Est-ce de son ressort ?
Arrêtons maintenant de multiplier les questions et cherchons des réponses !

Dans le cadre de cet article, nous avons pris contact avec Benjamin Vialle pour lui poser quelques questions. Ancien élève de l’école Centrale de Nantes, Benjamin travaille désormais à la CNIL en tant qu’auditeur des Systèmes d’Informations au Service des Contrôles.
Son expérience au sein de la Commission Nationale de l’Informatique et des Libertés et son intérêt pour le sujet de l’Open Data nous ont été très utiles.

Commençons par les présentations…Lorsque nous t’avons proposé de te poser quelques questions sur le rôle de la CNIL en France vis-à-vis de la protection des données privées dans le cadre de la mouvance Open Data, tu as semblé enthousiaste et nous t’en remercions. Pourquoi te sens-tu concerné?

Benjamin Vialle: « La protection des données à caractère personnel est au cœur de mon métier, à la CNIL. C’est un sujet d’actualité et l’évolution des nouvelles technologies de l’information et de la communication nous offre chaque jour des problématiques différentes.
L’Open Data est un sujet qui m’intéresse tout particulièrement : j’ai découvert la communauté du Logiciel Libre lorsque je me suis intéressé au système d’exploitation GNU/Linux. Puis, j’ai eu l’occasion, pendant mes études, de participer à plusieurs projets libres, me permettant d’« intégrer » cette communauté. J’ai découvert les discours de Richard M. Stallman et Benjamin Bayart sur ces notions de liberté et de partage permises notamment grâce au réseau Internet.
L’arrivée de Wikipédia au milieu des années 2000 a permis de vulgariser cette mouvance du partage. […] L’Open Data me semble être une suite logique à cette libération de contenu, à plusieurs titres. L’Open Data rejoint, en quelque sorte, cette philosophie d’accès à l’information et pose un cadre à la publication de données qui seront par la suite librement accessibles et exploitables par chacun. Je trouve essentiel que les citoyens se ré-approprient les données de l’État et de ses administrations. Je m’inscris totalement dans cette tendance qui considère l’information publique comme un bien commun. »

Lorsque nous avons commencé à préparer notre discussion avec Benjamin, nous avons effectué une simple recherche du terme « open data » dans les articles publiés sur le site de la CNIL. Résultat : quatre articles récents évoquant d’avantage des pistes de réflexion que des actions concrètes pour accompagner la mouvance d’ouverture des données. Il semble donc que la commission ne s’intéresse que de loin au sujet de l’Open Data…Mais est-ce vraiment de son ressort ?

  • L’Open Data ne poserait aucun problème vis-à-vis de la protection des données personnelles…

Nous nous sommes à nouveau tournés vers Benjamin : Selon toi, y a-t-il une convergence naturelle entre les activités de la CNIL et la mouvance Open Data? Pourquoi?

Benjamin Vialle : «

(Wikipédia) « En droit français, les données publiques sont considérées comme susceptibles de contenir des informations sensibles, soit, car elles permettent d’identifier une personne, soit car elles sont soumises au droit d’auteur, secret d’État ou pour des considérations de défense nationale. Dans ce contexte, les données ne peuvent pas être librement diffusées sans autorisation préalable ou doivent faire l’objet d’une anonymisation. »

Dans le cas général, les données Open Data sont anonymes. Donc ces données ne sont pas des données à caractère personnel. Donc la Loi I&L ne s’applique pas. Fin de l’histoire ! Ou pas… »

Ainsi la CNIL s’intéresse bien aux personnes ou structures libérant des données à caractères sensibles pour lesquelles l’anonymisation est indispensable, mais ne généralise pas son rôle de régulation au mouvement d’ouverture des données. En effet, lorsqu’on libère des données, on se doit de les anonymiser au préalable.
Au sens juridique français, l’Open Data ne pose donc pas de problèmes en ce qui concerne la protection des données personnelles. En effet :

  1.   La CNIL joue un rôle de contrôle pour tout ce qui a attrait aux données à caractère personnel
  2.  La libération des données est en France est soumise à une obligation d’anonymisation

→ Les données libérées ne sont pas ou plus à caractère personnel donc la CNIL n’est pas directement concernée.

  • …pourtant on remarque certaines dérives, potentielles ou avérées

Bien que les données libérées soient préalablement anonymisées, la multiplication et la diversité des jeux de données disponibles rendent possible des recoupements complexes avec une étonnante facilité.

Benjamin Vialle : « Il existe de nombreux exemples sur la toile où, par recoupement de données « anonymes », on arrive à lever l’anonymat d’un individu de manière sûre. C’est pour cela qu’il faut une certaine mesure et prudence quant à la « libération » de ces données « anonymes ». »

Le site AgoraVox [2] relaie à ce propos un article du Canard Enchaîné sur une « bourde » de l’Institut national de la statistique et des études économique l’INSEE.
En effet, il est possible, en croisant les données fiscales publiées par l’INSEE et les informations géographiques de Google Maps, de savoir où habite (et donc qui est) « le célibataire déclarant le plus haut revenu », ou encore de la personne ayant « le plus haut revenu fiscal ».
Selon AgoraVox, les bénéficiaires d’une telle « fuite » de données à caractère personnel seraient « en premier lieu les sociétés de Data Mining » (comprendre « prospection de données »).

Ainsi Gaëtan Gorce [3], sénateur de la Nièvre et membre de la CNIL, « demande au Gouvernement de stopper les développements de l’Open Data tant qu’un cadre juridique respectueux de la vie privée n’aura pas été arrêté ». Expliquant que « Certes, aucune information “personnelle” détenue par les administrations ne sera en principe directement accessible : sauf que par recoupement des données brutes fournies par les tribunaux, les services d’état-civil ou ceux du cadastre, voire avec celles (le Big-Data) dont des entreprises sont déjà en possession (comme Google ou Facebook), on pourra très facilement reconstituer le profil de chacun d’entre nous. ».

  • Une incompatibilité de fond entre la loi I&L et la mouvance « Open Data »

Mais au-delà des simples questions juridiques, il existe pour François Bancilhon, créateur de Data Publica, une start-up spécialisée dans le domaine de l’Open Data [4], une « opposition frontale » entre les messages de la CNIL et de l’Open Data.
Il explique à propos de la CNIL qu’ « [...]elle doit comprendre que son message : « limitons le nombre de données stockées en les forçant de se justifier par leur usage », s’oppose de façon frontale à celui de l’Open Data « augmentons le nombre de données disponibles pour créer des usages nouveaux».».

Nous avons demandé à Benjamin ce qu’il pensait de cette citation.

Benjamin Vialle : « La loi I&L prévoit qu’un traitement de données à caractère personnel doit avoir une ou plusieurs finalités :

Extrait de l’article 6 de la loi n°78-17 du 6 janvier 1978 dite Loi Informatique & Libertés :
« [les données] sont collectées pour des finalités déterminées, explicites et légitimes et ne sont pas traitées ultérieurement de manière incompatible avec ces finalités. »

La loi I&L associe forcément une ou des finalités (un but) à un traitement de données à caractère personnel. Bien que l’Open Data ne concerne pas des données à caractère personnel, la CNIL doit effectivement prendre en compte cette inversion de paradigme. En effet, les données sont offertes pour ce qu’elles sont et non utilisées dans un but particulier. Les usages des données libérées ne sont pas connus d’avance. C’est cet aspect de l’Open Data que je trouve passionnant : nous ne connaissons pas à l’avance la finalité ! »

Ainsi les usages des données qui sont « libérées » ne sont pas courus d’avance –c’est d’ailleurs ce qui fait la force et le potentiel d’innovation de l’Open Data. Vulgarisé, le discours serait donc « Libérons un maximum de données et trouvons leur des applications innovantes ».

  • Open Data : l’avenir ?

Nous avons finalement apporté différents éléments de réponse aux questions posées en introduction mais, vous l’aurez compris, le sujet reste ouvert et l’avenir incertain.

Après avoir longuement évoqué la CNIL, il serait intéressant de se pencher sur la CADA (Commission d’Accès au Documents Administratifs) [5] qui est selon Benjamin: « sans doute l’Autorité Administrative Indépendante la plus concernée par l’Open Data.», et qui dispose depuis 2005 de nouvelles compétences en matière de réutilisation des données publiques.

L’évolution galopante des technologies de la communication et de l’information semble rendre difficile l’encadrement de la mouvance Open Data par les structures les plus concernées. Difficultés d’adaptation ? Manque de nouvelles structures dédiées ? Quoi qu’il en soit, en l’absence d’une législation spécifique, il sera difficile d’accompagner ce mouvement en toute sécurité.

  • Remerciements

Un grand merci à Benjamin Vialle pour sa disponibilité et son apport personnel à cet article !

  • Auteurs

Augustin Doury et Raphaël Traineau

Sources :

[1] “Site internet de la CNIL”
[2] “Site AgoraVox”
[3] “Blog du Sénateur Gaëtan Gorce”
[4] “Site Data Publica”
[5] “Site de la CADA”

Projet de veille technologique 2013-Le contenu des articles traitant du sujet “Open Data: l’avenir?” sera publié sous la licence WTFPL .

Open Data : Les données ouvertes et leurs licences, quel cadre juridique?

Open Data: l’avenir ?

Rappel du contexte

Dans la continuité de notre projet de Veille Technologique centré sur le thème “Open Data: L’avenir?” et initié par un  premier article d’introduction paru le 4 octobre, nous nous intéresserons ce mois-ci au sujet suivant : “Les données ouvertes et leurs licences, quel cadre juridique ?”

Nous avions établi que différents acteurs mettaient en application ce concept de données ouvertes: les institutions publiques, privées et la société civile.

Le terme d’ “ouverture” utilisé ici est imprégné d’une forte connotation positive, il renvoie pourtant à de nombreuses subtilités qui, selon les choix effectués par l’institution ou le groupe libérateur de données, donnent lieu à une grande variété de publication de données, ouvertes ou non, selon l’appréciation de chacun.
Ces différentes subtilités se traduisent dans les faits par différents cadres juridiques, mis en place pour accompagner l’ouverture des données.
Au premier abord, le terme de “cadre juridique” semble induire une une protection des données libérées vis-à-vis d’un certain nombre de détournements aisément imaginables. En réalité ce cadre juridique permet également de s’assurer que les institutions ou groupes libérateurs de données agissent dans une véritable volonté d’ouverture et ne se contentent pas de surfer sur un mouvement à la mode souvent synonyme dans les esprits de transparence et de création d’opportunités.

Licence: Creative Commons CC0

Les principes de base de l’Open Data

L’Open Knowledge Foundation est une association à but non lucratif de droit britannique promouvant la culture libre, en particulier les contenus libres et l’open data (données ouvertes). Elle a été crée le 24 mais 2004 à Cambridge au Royaume-Uni (source – Ref 3)

Licence: Creative Commons Attribution 3.0 Unported (CC BY 3.0) , Open Knowledge Foundation policy

C’est face aux constatations du chapitre précédent que l’Open Knowledge Foundation à proposé l’”Open Definition” afin de “préserver la compatibilité, prévenir une éventuelle perte de sens du concept, et fournir une direction commune à cette multitudes d’initiatives dans des domaines très variés” (traduit de l’anglais depuis le site Open Definition, source – Ref 1).
Selon ces individus, un travail “ouvert” (comprendre contenu, donnée ou information) doit satisfaire à 11 conditions, dont voici un résumé (source – Ref 1):

“A piece of data or content is open if anyone is free to use, reuse, and redistribute it — subject only, at most, to the requirement to attribute and/or share-alike.”

Donc un contenu ou de la donnée est “ouvert(e)” si tout le monde est libre de l’utiliser, de le réutiliser et de le redistribuer. Les contraintes se limitant à l’éventuelle demande de l’auteur de respecter une clause d’attribution ou de viralité de la licence (un produit dérivé doit être publié sous la licence d’origine).

On retrouve cette approche au sein du diffuseur de licences libres Veni, Vidi, Libri , qui énonce 4 règles de bases. Selon ce site, les licences libres défendent 4 libertés : libertés d’utilisation, de modification, de redistribution,et de publication.

Licence: GNU FDL

Les licences en concret

Il faut dans un premier temps prendre garde à ne pas confondre les licences libres attribuées à des produits logiciels (on parle alors de licences open source) et les licences libres attribuées à des données ou contenus.
Si les licences libres attribuées aux logiciels sont désormais clairement définies dans le monde (allez visiter le site de l’Open Source Initiative), ce n’est pas encore le cas pour les licences libres qui concernent les données ou contenus. Dans ce dernier contexte, une politique d’harmonisation est en cours mais rencontre encore de grandes difficultés.

Il existe un grand nombre de licences dites “libres”, en effet toute personne peut créer sa propre licence tant qu’elle respecte les principes de base, et ces licences peuvent varier en substance selon la juridiction des pays concernés.

De plus il faut différentier le cas des bases de données, qualifié de sui generis, c’est à dire un cas particulier nécessitant d’écrire des textes juridiques spécifiques. Ce qui amène à ce propos l’Open Knowlegde Foundation à différentier l’“open content” de l’ “open data” (concerne surtout les bases de données) bien que ces deux termes fassent appel au concept de donnée ouverte.

Nous ne prétendons donc pas ici réaliser un inventaire exhaustif des licences ouvertes mais bien citer celles qui nous paraissent les plus couramment utilisées.

Licences Creative Commons

Les licences Creative Commons sont bien connues du grand public, mais sont-elles réellement ouvertes au sens de l’OpenDefinition citée plus haut?

“Une licence Creative Commons s’appuie sur un texte de base agrémenté au choix de 4 conditions. Le texte de base garantit le droit de distribuer le travail sous la licence concernée dans le monde entier si il est inchangé et que la distribution se fait gratuitement.” (source – Ref3) Les 4 conditions annexes sont consultables dans le tableau suivant (traduit depuis la source – Ref3):

IconE DROITs Description
Attribution Attribution (BY) Les utilisateurs peuvent reproduire, diffuser, afficher et réutiliser les données seulement s’ils attribuent à l’auteur la paternité des données – dans les termes spécifiés par la licence (sans pour autant suggérer que l’auteur approuve leur utilisation).
Share-alike Share-alike (SA) Les utilisateurs peuvent reproduire, diffuser, et modifier l’oeuvre seulement sous une licence identique à la licence qui régit l’oeuvre initiale.
Non-commercial Non-commercial (NC) Les utilisateurs peuvent reproduire, diffuser et (à moins que l’auteur ait spécifié ‘Pas de Modification’) modifier l’œuvre, pour toute utilisation autre que commerciale, à moins qu’ils obtiennent l’autorisation de l’auteur au préalable.
Non-derivative No Derivative Works (ND) L’auteur autorise la reproduction et la diffusion uniquement de l’original de son oeuvre. Si quelqu’un veut la modifier, il doit obtenir son autorisation préalable.

En pratique, les combinaisons les plus régulièrements utilisées sont BY,BY-ND,BY-SA, BY-NC, BY-NC-ND, BY-NC-SA.
Si nous confrontons cette approche avec l’OpenDefinition citée plus haut, nous comprenons bien qu’une licence Creative Commons n’est pas systématiquement synonyme de travail ouvert. Les clauses NC (Non-Commercial) et ND (Non-Derivative) sont en effet incompatibles avec une liberté d’utiliser, de réutiliser et de redistribuer en se contentant, si l’auteur le demande, de respecter une clause d’attribution ou de viralité de la licence.
A priori, les licences de type Creative Commons qui garantissent un travail ouvert et qui sont couramment utilisées sont celles qui font appel aux combinaisons de conditions BY, BY-SA. Il faut également citer la licence Creative Commons de base, dédiée aux travaux appartenant au domaine public: Creative Commons CCZero (CC0), évidemment compatible avec le concept de donnée ouverte.
Attention, parmi ces licences seule la licence CC0 (Creative Commons CCZero) s’adapte au cas sui generis des bases de données.

Licences de l’Open Knowledge Foundation

L’Open Knowledge Foundation référence et donne donc crédit à différentes licences ouvertes, nous nous concentrerons ici sur celles qui traitent le cas sui generis des bases de données et qui se voient donc attribuer la caractéristiques de licence “Open Data” et pas uniquement d’ “Open Content”.

Dans ce cas particulier, on trouve trois licences compatibles avec la notion de donnée ouverte, les caractéristiques de chaque licence sont issues de la page Wikipedia sur les données ouvertes:

- Open Data Commons Public Domain Dedication and License (PDDL)
La licence Public Domain and License (PDDL) donne la possibilité d’utiliser, de copier, de modifier, de redistribuer une base de données sans aucune restriction. C’est une licence libre de tout droit, de type domaine public. Les données peuvent donc être exploitées de façon totalement libre et l’auteur abandonne son droit moral.
- Open Data Commons Attribution License (ODC-BY)
Cette licence que l’on retrouve sous le sigle ODC-by autorise l’utilisation, la copie, la redistribution, la modification, la réalisation de travaux dérivés de la base de données, sous réserve d’indiquer le nom de l’auteur de la base de données originale.
- Open Data Commons Open Database License (ODbL)
La licence ODC-ODbL est fondée sur le droit d’auteur et le droit sui generis des bases de données. Elle donne la possibilité aux utilisateurs de copier, distribuer, utiliser, modifier et produire une œuvre dérivée à partir d’une base de données sous réserve de la redistribuer sous les mêmes conditions imposées par la licence originale. Elle implique aussi d’indiquer le nom de l’auteur de la base de données d’origine.
C’est la licence notamment utilisée pour le projet OpenStreetMap.

L’Open Knowledge Foundation donne également crédit à la licence Creative Commons CCZero (CC0) présentée précédemment.

Données ouvertes: des difficultés pour s’adapter aux juridications des différents pays – le cas particulier de la France

A ce stade de l’article, nous avons donc compris l’importance du cadre juridique et les subtilités qui l’accompagnaient. Or le cadre juridique est forcément influencé par la législation du pays concerné, ne serait-ce que par le caractère linguistique d’une licence: en droit chaque mot compte et donc la langue de base d’une licence prédestine celle-ci a des pays et contextes particuliers.
Ainsi la plupart du temps, l’ouverture des données publiques se fait selon une licence spécifique à l’institution génératrice de données.

La France incarne ici un cas particulier, en effet la législation établit le cas des “données sensibles”.

“D’un point de vue strictement juridique, et au sens de la loi informatique et libertés, les données sensibles sont les données qui font apparaître directement, ou indirectement : les origines raciales ou ethniques, les opinions politiques, philosophiques ou religieuses, les appartenances syndicales des personnes, ou qui sont relatives à la santé ou l’orientation sexuelle de celles-ci.”

(source – Ref 4).

Ainsi l’administration française utilise principalement deux licences:
- la licence OdBL présentée précédemment et qui a été traduite en français, elle est beaucoup utilisée par les collectivités locales.
- la licence ouverte créée par la mission Etalab fin 2012 pour encadrer l’ouverture des données de l’Etat français qui cherche à s’inscrire “dans un contexte international en étant compatible avec les standards des licences Open Data développées à l’étranger et notamment celles du gouvernement britannique (Open Government Licence) ainsi que les autres standards internationaux (ODC-BY, CC-BY 2.0).” (source – Ref 5)

Logo de "Licence ouverte /Open License" conçu par Etalab

Les institutions publiques sont régulièrement critiquées sur leur approche Open Data, accusée d’utiliser le cadre juridique spécifique à la France, et notamment le concept de “données sensibles”, comme un frein dissimulé à l’ouverture des données.
On peut citer notamment un article publié le 7 octobre 2013 par le journal Le Monde et intitulé “L’Open data, la ministre de la Santé n’en veut pas” (source – Ref 6). Dans cet article rédigé par le collectif Initiative Transparence Santé et qui s’étonne avec ironie de l’absence d’une réelle politique d’ouverture des données publiques sur la santé, on peut lire: “Celles (les données – ndr) dont l’utilisation permettrait d’envisager de réelles avancées dans la gestion de notre système de santé, les données individuelles anonymisées notamment, la ministre de la Santé n’a aucune intention de laisser les acteurs extérieurs à la sphère publique en disposer.” Parmi les raisons invoquées par les opposants à un accès plus large aux données, on peut citer le rapport de l’Igas:” En croisant certaines informations on peut identifier des personnes connues par ailleurs “. Un risque qualifié par l’auteur de l’article ” d’opportuniste, de ponctuel et ne concernant à chaque fois qu’un petit nombre de personnes “. Et pourtant ces données sont à disposition des laboratoires privés, le collectif Initiative Transparence Santé termine donc son article par un dernier paragraphe intitulé “Les vrais causes de la rétention” et qui explique notamment que “Si les pouvoirs publics freinent des quatre fers pour ouvrir l’accès aux données, c’est bien qu’ils craignent qu’on lève le voile sur l’incompétence dont ils font preuve depuis des années dans la gestion du système de soins.”

C’est face à ces considérations que le réseau Regards Citoyens a rédigé un ensemble de recommandations simples destinées aux acteurs publics en vue de définir un cadre juridique réellement libre à l’ouverture des données publiques.

L’avenir ?

Une des questions que l’on peut se poser sur l’avenir des licences des données ouvertes est de savoir si la tendance sera à la multiplication de ces types de licences, afin de permettre une adaptabilité à chaque contenu, ou au contraire à une harmonisation afin de gagner en visibilité auprès du grand public. Cette question sera clé pour la réussite des application open-source sur le marché.

Pour le cas particulier de la France, il conviendra aussi de suivre l’évolution (ou non) de la juridiction en la matière.

Auteurs:

Augustin Doury et Raphaël Traineau

Sources:

Ref1: Open Definition
Ref2: Page Wikipedia sur l’Open Knowledge Foundation
Ref3: Page Wikipedia sur la licence Creative Commons
Ref4: Site sur les données personnelles de Thiébaut Devergranne, docteur en droit et consultant.
Ref5: Descriptif de la licence ouverte sur le site gouvernemental d’Etalab (service chargé de l’ouverture des données publiques en France)
Ref6: Article paru sur LeMonde.fr le 07/10/2013 : « L’Open data, la ministre de la Santé n’en veut pas »

Projet de veille technologique 2013-Le contenu des articles traitant du sujet “Open Data: l’avenir?” sera publié sous la licence WTFPL .

Open Data : l’avenir ? (Introduction)

Présentation de la problématique:

 “La Société a le droit de demander compte à tout Agent public de son administration.”

Face à cet article 15 de la Déclaration des Droits de l’Homme et du Citoyen, on peut voir la philosophie de la donnée libre comme un outil de veille et de contrôle de l’état (un exemple avec le site web data.gouv.fr, plateforme française d’ouverture des données publiques).

 Ainsi on peut voir l’approche “Open Data” des institutions étatiques comme une réponse à une demande de transparence émise par la société civile, bien que celles-ci tendent à imposer des contrôles sur les contenus libérés ou sur les modes d’utilisation des données.

Illustration par Regards Citoyens

Illustration sous CC-by-sa par Regards Citoyens inspirée du logo FOI du DCA de Grande-Bretagne. Ref1

On ne peut cependant se limiter à ce cadre, prenons l’exemple de certaines entreprises qui fondent leur modèle économique sur l’accès gratuit à des bases de données ouvertes (on peut citer notamment l’éditeur de jeux vidéo Ubisoft qui vient de lancer le site WeareData, qui recoupe toutes les données publiques des villes de Paris, Berlin et Londres – source Ref2), ou encore d’entreprises qui s’inscrivent dans une logique d’ouverture des données privées (c’est le cas de JCDecaux qui compte publier sous licence ouverte les informations concernants la disponibilité des Vélib’ dans la ville de Paris)…
En parallèle, certaines initiatives au sein de la société civile font état de création collaborative de base de données ouvertes crées “par le citoyen et pour le citoyen” (c’est la cas du projet de cartographie ouvert, libre et collaboratif qu’est OpenStreetMap, bien que d’importantes contributions découlent de la libération et de l’importation de jeux de données initialement privés), s’émancipant ainsi d’une administration publique ou d’acteurs privés dominants dont l’un des socles du pouvoir repose sur un accès facilité à  l’information, grâce à un environnement juridique adéquat et à d’importants financements.

Rendu Mapnik des données OpenStreetMap disponibles près de l'école Centrale de Nantes. © OpenStreetMap contributors. Ref3

Le mouvement d’ouverture des données a connu une forte expansion avec le développement des Technologies de l’Information et de la Communication (TIC), on comprend donc que l’ “Open Data” n’en est qu’à ses débuts et que nous devons ancrer notre réfléxion dans une perspective d’avenir.

La mondialisation galopante et les problématiques qui l’accompagnent, notamment les impacts du modèle économique actuel, questionnent sur l’importance de l’ouverture des données à une échelle mondiale, posant des problématiques juridiques, morales, d’interopérabilité…qui doivent être traitées de manière internationale.

Mais qu’est-ce permet l’ “Open Data”? Donne-t-il le droit de consulter les données? De les copier? De créer des produits dérivés? Autorise-t-il un usage commercial des données? L’exploitation multi-acteurs de ce concept de données ouvertes ne représente-t-elle pas un danger pour la protection de la vie privée?

Plan général d’attaque du sujet:

 Face à ces considérations, nous traiterons le sujet “Open Data: l’avenir” suivant ces angles d’attaque:

Nous privilégierons une investigation basée sur des interviews et des rencontres avec des acteurs du monde de la donnée libre.

Auteurs:

Augustin Doury et Raphaël Traineau

Sources:

Ref1 : http://www.regardscitoyens.org/wp-content/uploads/2010/11/FOIfr3a.jpg

Ref2 : http://www.clubic.com/internet/actualite-568798-wearedata-ubisoft-watchdogs.html#ixzz2ggZMuUSt

Ref3 : http://www.openstreetmap.org/#map=15/47.2476/-1.5589

Licence:

Projet de veille technologique 2013-Le contenu des articles traitant du sujet “Open Data: l’avenir?” sera publié sous la licence WTFPL .