L’Open Data en pratique, la synthèse

Toute bonne chose a une fin et nous ne dérogerons pas à cette règle en vous proposant une synthèse de notre recherche documentaire sur le thème de l’Open Data en pratique.
Pour ce faire, nous reviendrons sur les différents billets publiés jusqu’alors, en proposant des liens vers chacun de nos précédents articles. Il pourra être intéressant d’en extraire quelques idées majeures et de faire un petit bilan de nos observations sur le monde l’Open Data.
Pour clore le billet, nous en profiterons pour annoncer le plan de notre rapport complet sur l’Open Data en pratique. Une fois terminé, nous vous ferons bien entendu part de ce rapport, en mettant à jour ce billet. (MàJ : Lire notre rapport )

Il est bon de rappeler que l’Open Data est un principe selon lequel les données publiques (celles recueillies, maintenues et utilisées par les organismes publics) ou privées doivent être disponibles pour accès et réutilisation par les citoyens et entreprises. De nombreuses villes se sont lancées dans le mouvement dont Nantes, Paris ou encore Strasbourg. N’hésitez-pas à consulter notre premier billet “L’Open Data en pratique” : le commencement d’une longue série d’articles. pour en savoir plus.

Au premier abord, l’Open Data fait peur, notamment avec sa farandole de formats mais aussi ses licences. Le tout a été éclairci dans notre second billet De la nature des données de l’Open Data. Néanmoins, une fois passées ces barrières, on ne peut que saluer cette initiative qui veut donner plus de visibilité aux données pour les citoyens. Notons que la majeure partie des données est mise en ligne par les collectivités via leur plate-forme de données, dans le but de transformer les données, par des intermédiaires (développeurs, journalistes, etc.), pour en faire un service aux citoyens.

Cependant, il ne faut pas se leurrer, derrière ce partage des données se cache un aspect économique important, que cela soit pour l’Etat, les entreprises ou les entités réutilisant ces données. Cela a été développé dans notre troisième billet, L’Open Data : une historie d’argent. Preuve de bonne santé d’une entreprise, l’ouverture de ses données permet de créer un écosystème autour : des applications notamment qui auront été développées par des ingénieurs/développeurs. Une sorte de relance économique par l’IT.

Si la plupart des applications tournent autour des places de parking et des transports (Les applications Open Data et leurs limites), il existe tout de même des utilisations originales comme le data-journalisme ou encore des synthèses d’informations diverses en un même lieu (citons le site We Are Data ou encore le City Dashboard, tous deux présentés dans ce billet Vers une autre utilisation des données Open Data).

Enfin, nous avons terminé nos billets avec un constat des limites de l’Open Data (La limite des données Open Data). C’est surtout le côté jungle dans les données (non triées, peu utiles) qui rebutent et qui nous a poussé à vérifier si ce surplus d’informations ne cachaient pas un manque de données cruciales. Et cela s’est, malheureusement, révélé être le cas : les données en temps réel sont souvent absentes (le temps avant l’arrivée d’un tram à Nantes par exemple). A cela s’ajoute l’absence de normes et une ouverture pas si franche des entreprises et de l’Etat.
Cependant, tout n’est pas si noir et des efforts ont été faits pour améliorer les plates-formes de données, en les rendant plus agréable à la navigation (pour mieux cacher le manque de données ?).

Nous en arrivons à la présentation du plan de notre rapport. Ce dernier reprendra tous les éléments vus lors des 6 mois passés, en réorganisant le tout de cette manière :

Introduction : Présentation de l’open Data
I. Contexte de l’Open Data
1) La nature des données
2) L’aspect économique
II. Les utilisations de l’Open Data
1) Les applications web et mobiles
2) De nouvelles utilisations
III. Les limites de l’Open Data
Conclusion sur l’Open Data en pratique

Malgré notre volonté d’être le plus exhaustif possible, il ne nous était pas possible d’aborder tous les éléments du large champ de l’Open Data. En particulier, nous nous sommes intéressé ici à l’Open Data en pratique, et non à l’avenir de l’Open Data. Deux de nos camarades se sont penchés sur le sujet au travers de leurs articles : il s’agit de Augustin Doury et Raphaël Traineau, eux-aussi élèves à l’Ecole Centrale de Nantes.
Voici un lien vers leur introduction : Open Data : l’avenir (introduction). Si vous voulez voir tous les articles, sachez qu’ils ont été écrits sous le pseudonyme “opendata13”.

Par ailleurs, sachez que vous pouvez trouver davantage d’informations sur différents blogs. Voici, entre autres, quelques blogs utilisés pour écrire nos articles :

  • le blog de l’association nantaise LiberTIC : http://libertic.wordpress.com/ (traitant principalement de l’ouverture des données publiques dans la région de Nantes, mais aussi en général)
  •  blog contenant de nombreuses informations sur les données (Open Data, mais aussi Big Data et autre) en France et en Europe : http://123opendata.com/blog
  • un blog d’un collectif tourangeau abordant s’intéressant au vaste sujet de l’Open Data : http://opendata-touraine.fr/

Pour terminer, nous aimerions remercier Guillaume MOREAU, enseignant-chercheur à l’Ecole Centrale de Nantes, qui nous a encadré lors de notre projet. Enfin, nous souhaitons surtout vous remercier vous, lecteur, qui nous avez suivi (fréquemment ou non) tout au long de nos billets portant sur l’Open Data en pratique. Merci à vous, vous qui donnez du sens à l’existence de notre blog !

Mise à jour : Retrouvez notre rapport ici.

Licence :
Licence Creative Commons

Auteurs :
Sébastien COHENDET & Maxime TERRADE

La limite des données Open Data

L’Open Data prend de plus en plus d’ampleur depuis quelques années, les données se multipliant, la communication y ayant trait se développant, … Les sociétés ou entités gouvernementales publient chaque jour davantage de données pour montrer au monde qu’elles s’inscrivent dans une démarche Open Data. Cependant, il convient de s’interroger sur ces données et de se demander jusqu’où va la démarche Open Data. Autrement dit, quelles sont les limites des données ouvertes ? Nous verrons que là encore, du progrès est à faire …

 

La première critique que l’on peut formuler sur l’Open Data est le coté fouillis qui l’entoure. En effet, les plates-formes de données sont souvent peu structurées, à l’exception récente de data.gouv.fr qui a beaucoup progressé depuis 1 an. Ce site dispose, à l’inverse des initiatives locales/régionales, d’un aspect communautaire, ce qui permet de noter l’utilité des jeux de données. De quoi défricher un peu la jungle que sont les plates-formes de données…

Le principal reproche que l’on peut faire à l’Open Data est l’amoncellement de données non cohérentes entre elles. Certes, c’est pour la bonne cause, pour la transparence et pour la diversité mais cela requiert un tri possible et efficace pour l’internaute. Ce n’était pas le cas pour la plate-forme Nantaise. Désormais un tri est possible mais pas très conviviale. Et oui, l’interface des portails Open Data est très souvent austère : un néophyte ne voudra jamais se plonger là-dedans. Ce n’est peut-être pas anodin… Les éditeurs de données mettraient alors en avant des données pour empêcher les visiteurs de tomber sur des données plus critiques, mises en ligne par obligation (principalement dans le secteur public).

L’abondance des données semble cacher encore d’autres lacunes. Celle qui revient le plus souvent est l’absence de normes et l’utilisation de formats de fichiers peu adaptés.

Pour mieux illustrer ce propos, prenons un exemple. Sur le site data.gouv.fr, on peut trouver la liste complète des gouvernements de la Vème république. Deux choses clochent :

  • le nom du fichier est tout sauf descriptif du contenu “Ressource sans nom”

  • le format du fichier : en .rtf. Un tel format ne permet pas de faire tourner un algorithme : il n’est pas structuré ni formalisé.

L’imposition d’une norme pour le partage des informations de type Open Data permettrait de faire évoluer les choses dans le bon sens…

Une autre critique concerne les données qui sont ouvertes (par obligation), mais qu’on cherche à cacher le plus possible. C’est le cas des données sur l’insécurité rendues publiques par le gouvernement, qui manifestement ne tient pas à ce qu’on consulte ou analyse ces données. En effet, les data-journalistes qui ont publié le baromètre, ville par ville, de la délinquance en France, ont effectué un véritable partout du combattant ! Premièrement, le ministère de l’Intérieur ne publie lui-même aucun chiffre. Quant à l’ONDRP (observatoire national de la délinquance et des réponses pénales), il ne publie que des statistiques départementales, et non ville par ville … Les data-journalistes ont alors du se plonger dans un rapport annuel publié par DCPJ (direction centrale de la police judiciaire). Parcourant ces 420 pages uniquement accessible sous format PDF, les data-journalistes ont recopié une à une les données dans un document Excel… Tache laborieuse qui leur a pris plusieurs jours ! La DCPJ pourrait évidemment transmettre ces données aux médias sous la forme d’un document Excel mais elle refuse catégoriquement de le faire. On se demande pourquoi…

Encore une déception : l’ouverture des données du gouvernement n’est que partielle. Certains types de données sont encore cadenassés, malgré la démarche d’ouverture du gouvernement. C’est le cas des données culturelles, qui font partie des exceptions au cadre de l’Open Data fixées par la loi Cada de 1978. Par données culturelles, entendez les données produites par “des établissements et institutions d’enseignement ou de recherche” ou par des “établissements, organismes ou services culturels”. Le régime particulier d’ “exception culturelle” permet à ces établissements de fixer les conditions de la réutilisation de leurs données, tandis que les autres administrations relèvent du régime général de cette loi, qui instaure un droit à la réutilisation des informations publiques au profit des citoyens.

Très peu d’administrations tendent donc à publier leurs informations culturelles. Contre-exemple tout de même : on peut féliciter la ville de Toulouse qui a rendu public ses archives municipales, en publiant un nouveau règlement relatif à la réutilisation de leurs données.

Il convient maintenant de se demander pourquoi les entreprises n’ouvrent pas toutes leurs données. Une réponse possible est la perte de clients en cas d’ouverture des données. Petit exemple : supposons que la SNCF rende public ses données concernant les horaires des trains. Plusieurs applications se basant sur ces données seraient très certainement créées. Google Maps pourraient par exemple proposer un outil de recherche des trains à prendre pour effectuer tel ou tel itinéraire. Ces nouvelles applications vont alors capter le public, et faire perdre des opportunités à la SNCF…

Dans le domaine des données manquantes, passons au cas des données temps réel, toujours très peu présentes, malgré l’omniprésence de l’Open Data dans les transports. Intéressons nous à la ville de Nantes, où l’estimation du temps restant avant le prochain tram est désespérément absente du site d’Open Data nantais. Pourtant cette donnée existe car elle est affichée sur les panneaux le long des arrêts des tramways. Le plus étonnant est que cette information est aussi absente de l’application Tan pour smarts phones, qui se base sur les données libres mises à disposition par l’entreprise. Est-ce de la paresse ou une indisposition technique qui empêche une telle donnée cruciale d’être disponible ? Nul ne sait.

Dans la même optique, la Muni Watch, dont nous évoquions son existence dans notre précédent billet, s’est également frottée à l’épineux problème des données temps réelles. Depuis son blog, l’inventeur de cette montre a expliqué son combat avec la société de transport en commun de Los Angeles, MTA, pour obtenir le droit d’accès aux données temps réel du réseau.Il a réussi à obtenir pour lui mais aussi pour les autres développeurs l’accès à cette donnée en 2009. Si cette avancée a été possible, pourquoi pas dans d’autres villes ? Même a Paris, cette donnée n’existe pas (l’application Watch Dogs, également présentée durant notre dernier billet, interpole simplement les données à partir des horaires de passage théorique, mais ce n’est pas du temps réel).

Pour finir, un dernier aspect sur la limite des données Open Data : la publication de certaines données mais non réutilisables ! Pire, des applications s’appuyant sur certains données publiques se sont vues fermées… Deux exemples pour illustrer cela :

Le premier concerne la fermeture, un an et demi après son ouverture en mai 2011, du comparateur de tarifs médicaux “fourmisanté” qui vous donne la carte des médecins à proximité, leurs prix et ce qui reste à charge. Ce site utilise les données publiques présentes sur les sites d’organismes officiels : ordre des médecins, CNAM, mutuelles santé et ministère de la santé. Primée pour l’innovation de cette ouverture de données publiques, cela n’a pas empêché la CNAM de demander le retrait des ces données selon elle « manipulées ». La ministre de la santé, Marisol Touraine, s’est exprimée sur ce sujet en expliquant « qu’il revient aux pouvoirs publics de rassembler ces informations sur les hôpitaux, pour les rendre plus accessibles et plus transparentes ». En d’autres termes, l’open data, c’est très bien, mais sous contrôle de l’administration…

Deuxième exemple, la fermeture totale et définitive du site Dentistedegarde.net. Le service, s’appuyant sur un partenariat avec l’ordre des chirurgiens-dentistes de Loire-Atlantique, permettait de trouver le dentiste de garde le plus proche. Le CHU de Nantes redirigeait vers ce service depuis son site internet et dentistedegarde.net a reçu plus de 18 000 visites en moins d’un an. Fin 2012, l’ordre a mis fin à son partenariat,  indiquant aux développeurs qu’il devait cesser de fournir la liste des gardes.Le remaniement dans la diffusion des gardes a été demandé par le ministère de la Santé afin d’organiser une redirection générale vers le Samu. C’est le 15 qui  orientera les patients auprès des praticiens ou hôpitaux selon les besoins.
D’après Jérôme Mousseau, Président de l’ordre, cette volonté de remaniement répond à un manque d’informations sur le service de garde : « Beaucoup de gens ne savent pas qu’il y a un service de garde tous les dimanches matins et tous les matins des jours fériés ». Ce qui est tout à faire paradoxale : on peut en effet se demander en quoi supprimer l’information en ligne et la restreindre au 15 permettra au public de mieux connaître l’existence de ces services… Se pose aussi la question de l’ouverture de données d’utilité publique (ayant par exemple trait à la santé, la sécurité, la culture ou les finances), qui restent jusqu’alors en marge de l’Open Data. C’est ce genre de données qui devraient être ouvertes, et non celles dont tout le monde se fichent…

En conclusion, si le mouvement Open Data s’accélère et a pris relativement vite, de nombreux problèmes, qui auraient dû être résolus dès le début, (re)font surface : de l’absence des données cruciales, que ce soit par blocage des organismes (la liste des médecins de garde) ou autres (les données temps réelles à Nantes par exemple) à l’absence de normes permettant la réutilisation simple des données, on peut dire que la route vers le succès de l’Open Data est semée d’embuches. Néanmoins, cela va de mieux en mieux, les autorités comprenant désormais l’intérêt du partage des données.

Sources (visitées le 14 février 2014) :

Open Data culturel : ouverture des archives toulousaines
Insécurité, des données publiques bien cachées
Couvrez ces données que l'on ne saurait voir
Discours de la ministre de la santé, Marisol Touraine

Licence :
Licence Creative Commons

Auteurs :
Sébastien COHENDET & Maxime TERRADE

Vers une autre utilisation des données Open Data

Avec des phénomènes tels que le big data ou l’Open Data, un des enjeux de demain sera l’utilisation des données qui nous entourent. Si l’exploitation des données Open Data passe la plupart du temps par des applications mobiles, elle peut aussi passer par une visualisation graphique de ces données. Un nouveau mouvement journaliste est même  né : le data-journalisme. Devant l’abondance de données, un certain esprit de synthèse semble primordiale. Nous verrons dans ce billet différentes initiatives de visualisation de données ainsi qu’un approfondissement sur le data-journalisme.

Commençons par certainement la plus originale mais pas forcément la plus utile, le site internet We Are Data, une campagne de publicité virale pour le jeu vidéo Watch Dogs, d’Ubisoft. Le jeu se basant sur la manipulation des données nous entourant (caméra de surveillance, téléphones portables et autres appareils connectés), l’équipe Marketing du jeu a décidé d’agréger les contenus Open Data de 3 capitales (Paris, Londres et Berlin) afin de démontrer que le monde décrit dans le jeu n’est pas si irréel que cela. On découvre alors une autre facette des données, celle de l’information graphique.  Cela passe alors par une vue de nombreuses informations dans une carte interactive des villes (sous forme d’un player flash) : l’affichage des stations de vélos et du nombre de vélos disponibles (via les données libres de JCDecaux), des stations de métro avec même un positionnement de la rame en temps réel (en réalité la RATP ne donnant que les horaires de passage théorique des rames, l’application ne fait qu’une interpolation suivant l’heure actuelle), les positions des antennes téléphoniques, etc.

Le plus intéressant dans cette expérience, c’est la synthèse de multiples informations, qu’elles soient ponctuelles (stations de vélo par exemple) ou étendues (les informations économiques sur les arrondissements de Paris). On peut retrouver la liste des données utilisées par l’application web dans les mentions légales du site.

Il s’agit donc d’une belle représentation graphique des données Open Data et une démonstration de leur diversité.

Revenons maintenant sur l’ ”Open Data Transport”, dont on avait beaucoup parlé lors du précédent article. Pour mémoire, de très nombreuses applications mobiles s’appuient sur des données libres orientées transport (routier, en commun, …). Mais il existe d’autres outils permettant de consulter ces données, et ce de manière plus originales ! Certains vous paraîtront d’ailleurs futuristes, mais tout ceci est bien réel.  

Le premier, le City Dashboard, est tout simplement une page web, sous forme d’un tableau de bord. Il s’agit d’un unique écran présentant différentes données pour la ville de Londres. Ce tableau de bord a été développé par des universitaires londoniens, en s’appuyant sur de nombreuses données ouvertes, toutes en temps réel.
Parmi les données affichées, on peut citer le nombre de trains et bus en service, les perturbations dans le métro, le nombre de vélos disponibles, … mais aussi des données non inhérentes au transport, telles que la pollution de l’air, le temps et la température, le niveau de l’eau, les nouvelles journalistiques, …
La fréquence de mise à jour dépend du type de données, variant ainsi de quelques secondes (pour les photos du trafic routier ou la météo) à 30 minutes (pour les prévisions météo ou la pollution de l’air).
Sachez que tous les éléments de ce tableau de bord sont déplaçables à souhait (tout au moins sur un ordinateur, l’opération n’étant pas possible sur navigateur mobile). Les Londoniens ont ainsi toutes leurs données préférées sous la main, et ce très rapidement. Sans oublier qu’elles sont toutes temps réel. Il est par ailleurs possible d’afficher les données voulues dans n’importe quel lieu public, via un simple écran de PC.

Un deuxième moyen d’avoir accès à des données de tranport : une montre qui vous informe sur les horaires de bus ! “Muni Watch” (tirant son nom du réseau de transport de San Francisco) indique en effet les trois prochains horaires de passage pour l’arrêt de bus le plus proche.
Pour cela, elle communique en Bluetooth avec un smartphone Android, lequel fait tourner le code permettant de récupérer l’arrêt le plus proche et les horaires associés.
Petit bémol cependant, cette montre est un exemplaire unique : émanant d’un hobby personnel, Joe Hughes l’a développée pour lui et lui seul. Ce projet datant de 2009, il est d’ailleurs étonnant qu’aucune montre intelligente n’ait été mis en vente pour le grand public… Est-ce une question économique ? Ou bien un intérêt relativement limité qui n’attire pas le grand public ?

Dans un autre genre, Baptiste Gaultier travaille sur le projet “La boîte” depuis 1 an et demi, à ses heures perdues. Il s’agit en fait d’une petite boîte qui donne l’heure, la météo de demain, le nombre de minutes avant le prochain bus, le nombre d’emails non lus, les tweets, … et ce n’est que la version 0.2 !

Du point de vue fonctionnement technique, la boîte est connectée à un serveur contenant une application web, celle-ci permettant de mettre à jour les boîtes et d’y installer de nombreuses applications. Ainsi, il est possible d’interagir avec le serveur grâce à son ordinateur ou smartphone, afin de modifier les informations affichées par chaque boite connectée au serveur.
Ce projet Open-Source est en ligne sur laboite.cc. Si vous voulez faire un test ou bien aider Baptiste Gaultier, ingénieur R&D rennais, dans son projet, allez y jeter un oeil !

Face à l’émergence des données, les journalistes se sont adaptés et certains se proclament comme étant des data-journalistes. Ce mouvement, particulièrement présent en Angleterre, se trouve une caisse de résonance par le magazine The Guardian qui dispose d’une rubrique dédiée à la mouvance du data-journalism.
Un de ses journalistes, Simon Rogers, est intervenu lors d’un TEDx au Panthéon-Sorbonne en déclarant “Les data-journalistes sont les nouveaux punks”. Il argumente son discours en expliquant qu’être punk, tout monde pouvait le faire, tout comme faire le boulot de data-journaliste. En effet, il a présenté les outils que lui et ses collègues utilisaient pour leur travaux : de simples tableurs à des outils google (ex : Google Fusion Table), les outils sont à portée de main du grand public.
Traiter un tel ensemble de données requiert de prendre du recul mais permet aussi de mieux comprendre le monde qui nous entoure. Simon a ainsi produit une carte des dépenses de toutes les différentes entités du gouvernement anglais. Une information utile mais pourtant bien cachée derrière une myriade de données.

Le data-journalisme, c’est donner du sens aux données.

Dans le même domaine, David McCandless, un journaliste designer, est un des pionniers dans la représentation des données façon graphique. Il a notamment écrit deux livres sur le sujet, regorgeant de pas mal de ses créations (Information is Beautiful est son dernier).
En faisant un tour sur son site, on peut s’amuser avec quelques créations graphiques interactives : on trouve, par exemple, une carte sur les plus grosses fuites de données utilisateurs.

D’un point de vue plus globale encore, on trouve déjà des sociétés de design spécialisées dans la synthèse de données massives. C’est le cas de l’agence, DatavEyes. Que cela soit par la mise en place d’un design interactif (ou non), voire de motion design (graphismes animées en vidéos), la société surfe sur le phénomène et a ainsi pu créer une carte du métro parisien “permettant d’interroger les temps de transports en métro à Paris, et de montrer l’affluence dans les stations de métro parisien.” Vraiment bien faite et qui donne envie de s’y plonger ! Allez donc y faire un tour ! D’ailleurs, en parlant de motion design, l’agence s’est faite une vidéo promotionnelle très sympa qui explique bien l’enjeu de l’exploitation des données.

Enfin, si le sujet du data-journalisme vous intéresse, nous ne pouvons que vous recommander chaudement ce blog de veille : http://jeanabbiateci.fr/blog/ où de nombreux autres exemples sont présentés (comme un sur le match des étoiles sur allocine).

Pour conclure, l’ouverture de données a fait naître de nouvelles vocations ou de nouveaux hobby. On voit ainsi apparaitre de plus en plus d’outils basés sur ces données ouvertes, développés par des particuliers qui y prennent goût. En parallèle, un nouveau métier a vu le jour : le data-journaliste, un journaliste basant ces recherches sur l’Open Data. Et face aux immenses bases de données ouvertes, ces journalistes d’un nouveau genre ont forts à faire !
Il convient d’ailleurs de se demander quelle est la qualité de toutes ces données, dont le quantité croit exponentiellement. On abordera cette question lors du prochain article, en montrant la limite des données mis à jour par les entreprises, collectivités, …

Sources (visitées le 23 janvier 2014) :

http://wearedata.watchdogs.com
City Dashboard
Muni Watch
laboite.cc
Intervention Simon Rogers (TEDx)
Site David McCandless
Agence DatavEyes
http://jeanabbiateci.fr/blog/

Licence :
Licence Creative Commons

Auteurs :
Sébastien COHENDET & Maxime TERRADE

Les applications Open Data et leurs limites

Depuis le début de nos publications, nous vous avons présenté les tenants et aboutissants de l’Open Data mais nous n’avons pas vu, en pratique, les applications actuelles marquantes utilisant ces données. Cela sera chose faite dans cet article qui traitera de quelques applications originales (ou pas…) et de quelques interrogations sur la diversité de ces applications (qu’elles soient web ou applicatives).

Les données qu’on retrouvent le plus souvent en ligne et qui sont aussi les plus utilisées par les développeurs sont les données liées aux parkings d’une ville. Rien que sur la plate-forme d’applications Open Data tenue par Nantes Metropole, on trouve pas moins de 4 applications sur les parkings sur les 13 applications disponibles. Près d’un tiers donc des applications. Il faut dire que l’information est simple à mettre en ligne car déjà présentes dans les systèmes informatiques (pour les panneaux annonçant le nombre de places disponibles devant un parking). La tâche est également aisée pour le développeur qui n’a qu’un seul type d’informations à afficher. Il est malheureux que les applications actuelles ne fassent qu’afficher de la donnée brute, sans réel traitement derrière. On peut citer Parking Direct, disponible sur android, qui ne fait qu’inventorier les parkings et le nombre de places disponibles, avec lancement de Google Maps pour guider l’utilisateur au parking. Utile mais peu original. On pourrait imaginer une application qui d’un point A à un point B recoupe les informations de traffic, de transports en commun et de parking pour pousser l’utilisateur à lâcher sa voiture (concept imaginé lors d’un PEI avec Transway de l’un des deux auteurs de ce billet, il y a 2 ans, toujours au stade de concept).

A savoir qu’Orange a déployé sur Nice une flotte de capteurs pour détecter si des emplacements de stationnement sont libres ou pas, et ce afin de guider les conducteurs vers la place libre la plus proche (ou communiquer l’information aux agents de polices municipaux…). Encore en phase de test, nous ne pouvons savoir si les données seront à vocation libres…

Toutefois, si vous ne voulez pas vous servir de toutes ces applications de parking, vous avez encore la possibilité de vous garer comme bon vous semble, sur un trottoir ou un emplacement non autorisé. Vous vous exposez alors à la fourrière !
Une application smartphone étonnante a été créée à cet effet : il s’agit de Pref Police qui, comme on peut le deviner, a été développée par la préfecture de Police de Paris. Grâce à Pref Police, vous pouvez savoir instantanément dans quelle fourrière votre voiture se trouve, en renseignant simplement sa plaque d’immatriculation. Vous pouvez par ailleurs découvrir (ou re-découvrir peut-être) quels sont les documents nécessaires pour récupérer votre voiture.
Malgré l’effort de la préfecture de Police, peut-on réellement parler d’Open Data dans ce cas ? En effet, la préfecture de Police parisienne ne publie pas la liste des véhicules enlevés, contrairement à ce qui est fait à Chicago par exemple. Ces données pourraient intéresser bon nombre de citoyens : on peut imaginer une application qui informerait les utilisateurs du nombre de véhicules enlevés à un endroit précis. Si dix véhicules ont été mis en fourrière dernièrement dans la même rue, un automobiliste ne s’y risquera sûrement pas ! (Mais, quid de la manne financière pour les fourrières ?)

Parlons maintenant de l’application Tan, mise en ligne le 12 mars 2012. L’application permet en particulier d’obtenir les horaires des prochains tramways/bus à proximité, de rechercher des itinéraires et connaître l’état du trafic en temps réel (informations concernant les mouvements sociaux, les manifestations culturelles ou sportives sur les lignes, les désagréments dus aux intempéries, …). L’application se base sur trois API, ouvertes à tous les développeurs.
Au début de l’année 2012, la Tan voyait les choses en grand. Elle annonçait trois nouvelles API  disponible fin mars 2012 : la liste des arrêts, le temps d’attente aux arrêts et les horaires aux arrêts. Cette dernière API devait, soi-disant, être en temps réel pour le tramway et le busway dès le lancement (fin mars 2012), et d’ici à début 2013 pour l’ensemble des bus du réseau. La réalité est tout autre, comme on peut le lire dans le témoignage suivant. En effet, fin septembre 2012, un développeur agacé s’exprimait :

“Les données sont aujourd’hui statiques et théoriques, ce qui ne nous permet pas de garantir un service de qualité en temps réel. […] Cela ne constitue pas une ouverture de leurs données en temps réel comme cela devrait être le cas lorsque l’on parle d’Open Data”.

Aujourd’hui, la Tan affiche sur son site : « Les horaires sont disponibles en temps réel pour le Tramway et le Busway », soit 4 lignes parmi les 47 existantes. Même si les données  temps réel commencent à apparaître, un gros progrès reste donc à faire. D’autant plus que ces données existent, puisque qu’elles sont disponibles sur des panneaux d’affichage à de nombreux arrêts. On peut d’ailleurs se demander si la Tan nous cache ces informations délibérément, pour masquer les retards éventuels sur leurs lignes.

Prenons pour continuer l’exemple de l’application « ToutNantesBouge », une n-ième application pour les transports publics nantais, développée par la SSII « Gfi Informatique ». Celle-ci, comme de plus en plus d’applications, est 100% web mobile. Comprenez par-là que l’application s’ouvre sur n’importe quel navigateur mobile. Le principal avantage de cette solution réside en un développement rapide et multiplateforme, contrairement aux applications natives.
Pour en revenir à l’Open Data, cette application se base sur les API de la Tan, ainsi que sur les données ouvertes de l’ensemble du réseau de transport de la ville. On peut citer la possibilité de connaitre la disponibilité des places de parking en temps réel ou les perturbations (bouchons, travaux, …) sur un itinéraire.
Sachez que « ToutNantesBouge » est né dans le cadre d’un concours Open Data, proposé par la ville de Nantes.

En effet, pour essayer de lancer des projets innovants et surtout différents, de nombreuses métropoles ont lancé, au travers de leur portail Open Data, des concours pour les développeurs les incitant à créer de nouveaux concepts. Ce fut le cas à Nantes, en début d’année dernière où un appel à projet à été effectué. Le 1er prix a été décerné à … une application d’affichages des places libres de parkings aux alentours. Décidément !
Strasbourg a également lancé un tel concours mais avec, cette fois, une rubrique “Jamais vu” visant à créer, enfin, quelque chose de novateur. On peut retrouver les candidats sur cette page.
Même si ces concours sont une bonne chose, on croise trop souvent les mêmes concepts, désormais usés. A quand une révolution en matière de traitement des données Open Data ?

Comme nous avons pu le voir, la promesse d’une diversité d’applications nouvelles n’est pas totalement tenue. Pire encore, les applications se butent à la limite de l’actualisation des données mises en place. Ainsi, la Tan ne donnant pas de données temps réel sur l’ensemble de son réseau, les applications se trouvent bloquer, rendant leur intérêt amoindri (par intérêt ? par manque de données ?).
Mais la représentation de ces données ouvertes peut prendre d’autres formes, bien plus originales que de simples applications mobiles. C’est ce que nous traiteront dans le prochain article.

Sources (visitées le 20 décembre 2013) :

http://www.01net.com/editorial/599467/orange-investit-le-stationnement-urbain-intelligent-sur-la-voirie/

http://123opendata.com/blog/open-data-service-retrouver-voiture-fourriere/

http://www.entreprenantes.com/magazine/481-open-data-les-developpeurs-toujours-brides-par-la-tan.html/

http://www.gfi.fr/gfilabs/apps_nantes.php

Licence :
Licence Creative Commons

Auteurs :
Sébastien COHENDET & Maxime TERRADE

L’Open Data : une histoire d’argent ?

La notion d’Open Data est souvent associé à une dimension citoyenne/démocratique, qui connote par là une absence de profit. La réalité est pourtant tout autre.
En effet, l’Open Data s’inscrit la plupart du temps dans un contexte économique, que ce soit à court ou à long terme. Mais quels sont les bénéfices directs apportés par les données libres ? Et quels sont les profits indirects qui sont actuellement tirés de celles-ci ?

 

35 millions d’euros, c’est le montant qu’a rapporté la réutilisation des Open Data  aux administrations françaises en 2012. Le magistrat à la Cour des comptes Mohammed Adnène Trojette évoque ce chiffre au travers son rapport « Ouverture des données publiques : les exceptions au principe de gratuité sont-elles toutes légitimes ? ». Ce rapport permet d’apporter des éléments de réponses sur la non-gratuité de certaines données libres. On apprend par exemple qu’ « une vingtaine de services publics administratifs ont institué ou maintenu des redevances de réutilisation » de certaines données.
Ce réel frein à l’Open Data a des causes connus : il s’agit principalement de la peur que « les informations ainsi communiquées ne soient réutilisées pour critiquer le service public », explique le rapport.
Pour nuancer ce chiffre colossale de 35 millions d’euros, il faut toutefois savoir que la majorité des gains est perçue par trois organismes / ministères : l’INSEE et l’IGN perçoivent chacun près de 10 millions d’euros et le ministère de l’intérieur près de 4 millions d’euros. De plus, ces gains sont en baisse depuis plusieurs années (30% en deux ans).

 

Parlons maintenant des entreprises, avec une phrase de François Bancilhon, PDG de Data Publica : les entreprises « peuvent valoriser leurs données en les ouvrant pour créer un écosystème vertueux autour d’elle ». Cette citation montre bien que les entreprises cherchent elles-aussi à tirer profit de l’Open Data. Petit tour d’horizon des profits attendus par les entreprises.
Premièrement, les entreprises cherchent à améliorer la satisfaction de leurs clients grâce à l’ouverture des données, leur donnant ainsi une meilleure image de marque.
Deuxièmement, elles cherchent à améliorer sa faculté d’innovation : grâce à de tierces personnes (développeurs, indépendants, start-up…) réutilisant leurs données, de nouvelles idées vont alors apparaitre, permettant ainsi aux entreprises de se développer.
Troisièmement, la libéralisation de leurs données permettre de prévenir les réutilisations non autorisées. C’est le cas de la RATP qui a mis fin à ces pratiques en rendant publiques leurs données, celles-ci ayant ainsi permis la création de plusieurs applications pour les usagers de RATP dont une permettant de connaitre les flux de voyageurs, utiles pour les futurs enseignes qui chercheraient la meilleure station de métro pour s’installer.
Un autre point concerne les interfaces de programmation (API). Ces dernières, ouvrant l’accès à des données de l’entreprise, peuvent permettre de réaliser indirectement du profit. Amazon en est un très bon exemple : ouvrant ses bases de données de livres via une API, des nombreux sites professionnels et des amateurs ont pu afficher sur leur site ou blog des informations sur les livres. Les internautes intéressés par un roman sont alors redirigés vers Amazon pour l’acheter. Le revenu est partagé entre Amazon et le site utilisant l’API.
Dernier point : certaines entreprises proposent des services concernant les « Open Data », par exemple un accès à des données personnalisés (triées et sélectionnées pour le client) ou à des données libres enrichis. Data Publica est une entreprise proposant ce type de services. Sans oublier les applications mobiles,  qui représentent la plus grosse visibilité du mouvement Open Data. Leurs omniprésence s’explique par l’utilisation des données de transport permettant alors un service particulièrement adapté à des applis mobiles.

 

On le comprend aisément, l’Open Data prend de la valeur lorsqu’elle circule ou lorsqu’on la transforme. C’est pourquoi il peut être intéressant de devenir producteur d’informations. Mais il faut commencer par se poser les bonnes questions, lesquelles se regroupent en trois principaux points.

  1. La question du mode d’accès aux données : est-ce que nos données vont être accessibles via le site web de l’entreprise, via une portail spécifique, ou bien par le biais de plateforme mobile : tablettes, smartphones, … Tout ceci sans oublier de présenter ces données de manière simple et pratique. Certains producteurs de données ont d’ailleurs du progrès à faire de ce côté-là (qui a di data.gouv.fr
  2. La question de l’hébergement des données : est-il possible de stocker, gérer et maintenir ces données en interne ou mieux vaut-il faire appel à une autre entreprise, spécialisée dans ce domaine ?
  3. La question du niveau de protection : quels vont être les administrateurs du projet ? Qui aura accès à quoi ? Et surtout la sécurité de l’entreprise : cette ouverture de données crée-t-elle une faille de sécurité qui permettrait d’infiltrer le réseau interne de l’entreprise ?

 

Dans un contexte de crise (plus ou moins terminée), on comprend bien pourquoi les administrations et entreprises utilisent l’Open Data à des fins économiques, tout au moins en partie. Toutefois, comme les spécialistes l’avaient déjà constaté lors de la semaine européenne de l’Open Data à Nantes en mai 2012, le modèle économique de l’ « open data » reste encore à trouver.
Si on prend l’exemple des applications basées sur l’Open Data, on se rend compte qu’elles ne génèrent pas assez de revenus pour développeurs… Il est donc impossible que le monde de l’Open Data s’appuie sur les applications qui les utilisent. Ceci s’explique par la faible portée des applications, majoritairement développées pour une certaine ville ou région et pour un domaine spécifique (transport en commun, vélo, tourisme, …). Pour terminer, notez par ailleurs que ces applications sont souvent redondantes et concurrentes.

Nous verrons ainsi dans notre prochain billet quelques unes des applications se basant sur l’Open Data que nous aurons jugés original, intéressante ou, au contraire, redondante entre elles. Nous analyserons ces applications et essayeront de perçer leurs secrets et limites.

Sources (visités le 20 novembre 2013) :

http://www.lesechos.fr/01/06/2012/LesEchos/21196-025-ECH_–open-data—–les-collectivites-sont-en-quete-d-un-modele-economique.htm

http://pro.clubic.com/technologie-et-politique/article-560928-2-open-data-ouverture-ameliorer-societe.html

http://donneesouvertes.info/category/articles/economie-et-strategie-open-data/

http://pro.clubic.com/actualite-e-business/actualite-597650-donnees-publiques-etat-rapport.html

Licence :
Licence Creative Commons

Auteurs :
Sébastien COHENDET & Maxime TERRADE

De la nature des données de l’Open Data

Si le mot Open Data permet d’accéder à de la donnée libre, il semble opportun de s’intéresser aux données en elles-mêmes. Existe-t-il réellement des myriades d’informations mises à disposition librement en ligne ? Sont-elles des initiatives individuelles, d’entreprises ou encore gouvernementales ? Enfin, qui dit données, dit protection de ces données : nous verrons également les licences se cachant derrière l’Open Data.

Il faut savoir que le lancement du mouvement Open Data en France ne s’est pas fait sans anicroches. En effet, la démarche a révélé les lacunes des informations en France : que ce soit un manque d’informations, un mauvais archivage ou encore une mauvaise structuration des données.C’est donc tout l’enjeu actuel : résoudre ces lacunes pour permettre un véritable essor des données libres en France.

Quand bien même de la donnée est présente sur le net, la mouvance Open Data n’est que peu connue du grand public. Pire, elle est très compliquée à appréhender pour ces derniers. En effet, les données publiées sont brutes, sans aucun traitement et dans des formats divers et variés. Difficile pour Mme Michu de s’y retrouver dans les formats exotiques proposés (on trouve sur le site data.nantes.fr du .csv, du json, xml, xls, etc.). On comprend ainsi que l’Open Data fournit la donnée brute qui sera alors interprétée par des applications développées pour le grand public.

La place du citoyen dans le mouvement Open Data
Source :  Le citoyen a t-il une place dans l’open data ?

On retrouve cette idée dans le schéma ci-dessus : les collectivités transmettent leurs données pour l’Open Data à des plateformes de données en ligne sur lesquelles on peut trouver l’information Open Data de façon brute. C’est alors que des personnes expérimentées prennent le relai et vont pouvoir utiliser ces données brutes pour les transformer en un produit fini à plus forte valeur ajoutée. Ainsi, les développeurs vont pouvoir créer des applications se basant sur les plateformes de données. Une entreprise pourra enrichir ses services ou en créer de nouveaux : l’Open Data peut alors favoriser la création de nouvelles entreprises. De la recherche peut être effectuée dans le domaine afin d’y faire des découvertes. Les designers peuvent enrichir l’expérience en créant de nouvelles façons de représenter cette donnée brute. Enfin, les journalistes peuvent écrire des articles dans le cadre du data journalisme (journalisme s’appuyant sur les données libres, typiquement l’Open Data).

Ces nouveaux produits vont ainsi pouvoir toucher le grand public mais aussi les collectivités elles-mêmes. Ainsi, un cercle vertueux semble se mettre en place : les collectivités donnent leurs données libres et ces données pourront être utilisées par d’autres (voire elles-mêmes) pour faciliter leurs fonctionnements grâce aux travaux d’intermédiaires.

Si l’Open Data peut aussi être synonyme de transparence, notamment au niveau du gouvernement et de ses actions, ce but est encore loin d’être atteint. Rares sont les plateformes de données donnant accès aux données budgétaires, des subventions ou encore des actions chiffrées des collectivités. Cette volonté démocratique se met doucement en place, particulièrement sur la plateforme du gouvernement. On y trouve les dépenses en matière de santé, les dépenses des administrations, de grandes villes (de plus de 10 000 habitants) sur différents domaines. Là encore, ces données sont dans un format peu engageant pour le grand public (format excel XLS, peu agréable à lire). De même, le format XLS est très médiocre pour le développement (l’accès à la donnée n’est pas simple car le parsing n’est pas évident…).

Pour terminer cette article, amenons la question des licences sur la table en évoquant les deux licences principales de l’Open Data.

Tandis que la licence ouverte impose seulement de citer la source (il s’agirait d’une licence Creative Commons BY) afin d’utiliser les données, commercialement y compris, la licence ODbL nécessite le partage des données enrichies suivant la même licence (c’est donc une licence Creative Commons BY-SA).

 

Voici tous les éléments de réponses trouvés jusqu’à présent, concernant nos interrogations sur les données Open Data en elles-mêmes.
Pour finir, il peut être bon de noter le sujet du prochain article : il portera sur une analyse des produits finis se basant sur l’Open Data, afin de comprendre si l’Open Data est réellement utilisée en France et comment.


Sources : Plateforme open Data du gouvernement

Blog liberTIC

Blog Open Data Touraine

Licence :
Licence Creative Commons

Auteurs :
Sébastien COHENDET & Maxime TERRADE

“L’Open Data en pratique” : le commencement d’une longue série d’articles.

L’Open Data, tout le monde en parle ces derniers temps mais savez-vous réellement ce que cela signifie ?

Il s’agit d’un principe selon lequel les données publiques (celles recueillies, maintenues et utilisées par les organismes publics) ou privées doivent être disponibles pour accès et
réutilisation par les citoyens et entreprises. Nantes est une des premières villes, en France, a avoir adopté l’Open Data, dès février 2011.

Le mouvement de l’Open Data provient de la fondation américaine Sunlight Foundation qui a énoncé les 10 principes de l’Open Data :

les données doivent être complètes, primaires, fraîches, accessibles électroniquement, lisible par une machine, accessible sans discrimination, respectant les standards ouverts, disponible sous une licence claire, accessibles de façon pérenne et gratuite.”

 Dans le cadre nantais, cette démarche a pour but de dynamiser l’économie nantaise par l’utilisation de ces données et d’améliorer les services dédiés aux usagers et entreprises. C’est ainsi qu’est né le site : data.nantes.fr qui regroupe toutes sortes d’informations que nous nous ferons un plaisir de critiquer (positivement ou non).

Comme nous le verrons dans les prochains mois, Nantes n’est pas la seule ville à s’être lancée : Paris ou le gouvernement français sont d’autres intervenants, pour n’en citer que deux. Bien que nous attachons ici à la France, des données mondiales sont également disponibles (les réseaux de vélos en libre-service a son Open Data mondiale par exemple).

Des données, c’est utile, mais encore faut-il que des applications se basant sur ces données existent : nous passerons en revue un nombre conséquent d’applications pour mieux comprendre ce phénomène.

 

Par exemple, vous êtes vous déjà demandé si des applications réellement utiles utilisant l’Open Data existaient ? En effet, de nombreuses applications sont présentes sur toutes les plateformes, se ventant d’utiliser des données libres issues de l’Open Data. Mais combien sont d’une réelle utilité ? Et combien sont utilisées par un large public ?

On peut aussi se demander à quel type d’Open Data nous avons à faire. Prenons l’exemple d’Open Street Map qui est un projet de cartographie libre, basé sur la collaboration, à l’image de Wikipédia. Tout le monde peut donc proposer ses données (GPS ou autre) pour participer à ce projet de cartes libres. Les données publiées ne sont ainsi pas certifiées… Ne devraient-elles pas l’être, par telle ou telle autorité qui en aurait la compétence ? Autrement dit, peut-on dire que les données libres de droit et partagées par n’importe quel utilisateur font partie de l’Open Data ?

 Autre chose qu’il pourra être important d’aborder : les informations adjacentes aux données Open Data. Certaines sociétés se vantent en effet de publier des centaines et des centaines d’Open Data, mais sont-elles réellement intéressantes ? Ne serait-ce pas plutôt les informations adjacentes, gardées secrètes, qui seraient utiles au public ? Pour quelles raisons ces données sont cachées ? Secret industriel ? Cache-misère ? L’arbre qui cache la forêt ?

Enfin, on parlera des normes en lien avec l’Open Data. On se demandera comment est organisée l’Open Data actuellement ? Quelles sont les normes permettant d’organiser tout cela ? Quelles sont-elles et combien en existe-t-il ? Les entreprises respectent-elles ces normes ?

 

C’est aujourd’hui que débute notre série d’articles concernant l’open data en pratique, encadré par Guillaume MOREAU pour l’Ecole Centrale de Nantes.
Dans les mois qui viennent, nous publierons régulièrement : à raison d’un article par mois, vous pourrez lire les informations que nous aurons recueillis au cours du mois et qui nous semblent intéressantes à développer ici.

Sachez que cette article et tous les autres à venir sont placés sous licence Creative Commons (https://creativecommons.org/licenses/by-nc/3.0/deed.fr). Vous pouvez donc librement réutiliser le contenu de nos articles (hors utilisation commerciale), à condition de faire référence à notre groupe de projet de veille technologique : OPDAPRAT13 et à nos noms : Maxime TERRADE et Sébastien COHENDET.

Pour finir, un autre projet portant également sur l’Open Data est à suivre sur ce même blog. Il traira plus particulièrement de l’avenir de l’Open Data, tandis que nous nous interrogerons sur les problèmes actuels de l’Open Data. Suivez donc avec attention les billets d’Augustin DOURY et Raphaël TRAINEAU, sous le pseudo OPENDATA13.

A bientôt pour une première réponse à ces questions !


Licence :
Licence Creative Commons

Auteurs :
Sébastien COHENDET & Maxime TERRADE