mercredi, janvier 29, 2014

Le nouveau data.gouv.fr : innover à l'âge de la multitude


Vous avez sans doute repéré la nouvelle version du portail www.data.gouv.fr, inaugurée le 18 décembre dernier par le Premier ministre, accompagné de Mme Marylise Lebranchu et de Mme Fleur Pellerin.

C'est un portail qui présente une nouvelle approche de l'open data, en associant très largement les citoyens (particuliers, chercheurs, étudiants, entreprises) à la mise en valeur des données (notamment par les réutilisations qu'ils peuvent poster sur le site), et en accueillant, aux côtés des données partagées par l'administration, des données d'intérêt général produites par les particuliers et les grandes communautés du web social.

Un mois après son ouverture, le portail commence à prendre son essor. Les métriques du site montrent une augmentation constante du nombre de participants, du nombre de données et du nombre de réutilisations. Quelque chose est en train de prendre, et la presse ne s'y est pas trompée, comme on le voit ici, ici, ici, ici ou encore ici.

Ce portail incarne une politique, qui est celle du gouvernement. Mais dans sa conception, son développement comme son fonctionnement, il mobilise des outils, des méthodes et des talents directement issus de la révolution numérique et de ses méthodes d'innovation, qui étaient en partie annoncés ou théorisés dans L'Age de la multitude. Nous pensons ce ces méthodes sont reproductibles, et le SGMAP a d'ores et déjà entrepris de les appliquer à d'autres projets. Il est donc intéressant de les partager sur ce blog. 

1- La recherche d'une solution "numérique" à l'équation politique

L'ouverture et le partage des données publiques, c'est d'abord une politique publique. Elle se fonde sur un droit des citoyens (globalement  la loi CADA), mais la dépasse au sens où elle vise à produire, de manière proactive, le plus possible de données, gratuites et réutilisables, dans des formats ouverts et interopérables. Il s'agit de partager des données "activables", pour augmenter le potentiel de création économique et sociale.
Pour ce faire, il ne suffit pas de répéter que les citoyens ont accès à tous les documents publics qui ne posent pas de questions de vie privée, de défense nationale ou d'autres secrets légaux. Concrètement, les administrations ne savent pas toujours par où commencer, les citoyens réclament parfois des informations qui, ne fait, ne sont pas détenues, telles quelles, par les administrations. Par ailleurs, de nombreuses données publiques sont déjà en ligne, mais dispersées dans de nombreux sites. Et surtout, rares sont les gens qui pressentent ce que la diffusion plus large de ces données peut susciter dans la société.
L'ambition de l'open data ne peut donc pas être atteinte seulement par une approche juridique ou par des instructions ministérielles. Il lui faut une plateforme, des outils, des interfaces, des organisations qui favorisent cette réalisation, qui donnent envie de le faire, qui lui donnent du sens.

C'est pourquoi nous avons eu très tôt la conviction que l'open data doit reposer, aussi, sur une stratégie numérique : c'est dans les règles, la dynamique, le design et l'expérience utilisateur du site que nous allions trouver une grande partie des réponses.

J'insiste sur ce point, parce que certains des plus respectables partisans de l'open data ne l'ont pas immédiatement compris. L'idée qu'un projet politique, voire humain, puisse trouver une réponse numérique peut faire peur. On nous répond : "et l'Humain dans tout ça ?". Mais le numérique, ce n'est pas de la "technologie" : ce sont des rapports humains, des situations, des méthodes pour stimuler l'engagement.  
En travaillant sur l'engagement des citoyens, en confiant à la multitude le soin de faire vivre ces données, en organisant une relation plus étroite entre les administrations et les utilisateurs de leurs données (qui ouvre sur l'open innovation), la réponse numérique a donné corps à un projet politique.


2- La maîtrise du code

Cette conviction entraîne immédiatement une deuxième conséquence : il faut maîtriser son propre code.
Une petite musique agaçante commence à s'instiller dans la société française, qui voit dans la sous-traitance le gage de l'efficacité. Je n'y souscris pas.
On ne développe pas un bon produit sans le tenir soi-même, sans itérer en permanence, sans être en permanence en train de regarder qui s'en sert, comment il s'en sert, à quoi il l'utilise.
Pour ce faire, il faut une intimité avec son produit, une familiarité avec son code, qui ne peut être obtenue sans le produire soi-même, sans intégrer les codeurs au coeur de son équipe.
On peut sous-traiter. On doit même le faire, pour internaliser sans cesse de nouvelles compétences, pour faire face aux brusques montées en charge. Mais je pense qu'on ne peut sous-traiter que ce dont on a soi-même la maîtrise, et qu'il y a des ratios à respecter. Quelque chose comme un sous-traitant pour un membre de son équipe en conception et trois pour un en exécution, par exemple.

- Refonder un imaginaire

Dans le cas précis de data.gouv.fr, nous avions également à faire face à une autre difficulté : celle de s'ancrer dans le bon imaginaire.
Le mouvement open data se situe aujourd'hui au carrefour de plusieurs imaginaires, qui coexistent mais ne sont pas forcément fongibles les uns dans les autres. On sent bien, par exemple, une dimension "droits de l'homme", qui, en France, remonte à la Révolution française (et notre Déclaration des droits de l'homme et du citoyen qui reconnaît que "La Société est en droit de demander compte à tout agent public de son administration"), une autre tradition beaucoup plus proche d'un libéralisme politique assez XVIIIe Siècle, sur la transparence des institutions, que l'on sent bien à l'OGP, une tradition qui s'ancre dans le libéralisme économique façon XXe Siècle ("le marché pur et parfait fondée sur une information partagée"), une tradition "grassroots" qui cherche à faire émerger la co-construction, la démocratie participative, etc. Et une tradition un peu geek, du code source ouvert, du format interopérable, de l'éthique du hacker qui veut avoir le droit de comprendre comment les choses fonctionnent. Nous avions notre propre imaginaire, qui pourrait être appelé le gouvernement comme une plateforme : le gouvernement doit proposer des ressources à la société civile, faire levier sur sa créativité, et s'enrichir (à tous points de vue) des créations qui en résultent.

Ces traditions cohabitent assez bien, dans les faits, mais elles commencent à poser des problèmes quand il s'agit de développer un portail.
Une des difficultés du développement d'un portail open data provient d'abord de son trop grand respect de certains de ces imaginaires, qui avait fait évoluer le site vers un "repository de données brutes", les moins interprétées possibles, les moins retraitées possibles, avec une très grande attention portée sur les règles d'indexation et les métadonnées, et un très grand effort pour aligner toute l'administration, quoi qu'il en coûte pour les producteurs de données, sur ces standards. C'est tout à fait conforme à certains récits sur l'open data, mais ce n'est pas ce que nous cherchions.
Refonder cet imaginaire, c'est le sens exact du projet de Codesign qui nous a occupé pendant quatre mois, et nous a permis, grâce aux questionnaires en ligne, mais surtout grâce aux rencontres sur le terrain, de nous frotter à différentes aspirations, de poser des questions ouvertes à la frontière du technique et du politique, d'écouter toutes sortes de producteurs et d'utilisateurs.
C'est le Codesign qui nous a fait avancer vers l'idée que les données ne prendraient sens que si on les rattachait aux réutilisations, et qui nous a permis de nous convaincre qu'il y avait bien autour de nous une société civile qui pourrait nous apporter de la compétence, de la technologie et même des données.

3- Investir avec parcimonie

Nous avons donc décidé de redévelopper un nouveau data.gouv.fr, ancré dans un nouvel imaginaire plus participatif, plus proche des stratégies de plateforme, de la co-construction et des grands sites sociaux.
Sur l'année 2014, notre projet va réaliser des économies considérables : près de 70 % de coûts en moins. Mais ce n'était pas son objectif principal. En 2013, en effet, nous avons au commencé par investir. Investi pour préparer une nouvelle plateforme tout en maintenant et faisant vivre l'ancienne.
Cet investissement étant financé par d'autres économies sur le budget d'Etalab, il fut parcimonieux.  C'est entre autres pour cela que nous avons immédiatement opté pour deux options qui se sont révélées extrêmement structurantes : l'hébergement dans le cloud, et le noyau open source. C'est sans doute comme cela aussi que nous nous sommes rapidement convaincus de la nécessité de faire appel à des entrepreneurs confirmés. Il y a des bons codeurs partout, mais le propre des entrepreneurs est sans doute de passer leur vie à se casser la tête sur les ressources.

4- Le développement agile

Nous avons donc choisi de confier le développement du projet à une équipe d'entrepreneurs aguerris : Pierre Pezziardi (qui venait d'achever la conduite du projet HelloMerci), Emmanuel Raviart, un pro du libre, rencontré pendant CoDesign, Axel Haustant, qui était alors chez Mappy, mais nous a rejoint pour cette "startup d'Etat", ainsi que Jean-Louis Fréchin et Angelo Chiacchio, de NoDesign, qui ont passé des nuits blanches sur un design qui, vous le savez ici, est bien autre chose qu'une esthétique.

Immédiatement, nous avons adopté des méthodes agiles. Méthodes qui nécessitaient, au passage, le cloud et le logiciel libre.
Cette petite équipe projet s'est mise à coder le 1 juillet. Dès le 7 juillet, ils avaient bâti sur un noyau CKAN (le framework d'open data développé par l'OKFN) une prémaquette que nous soumettions à un producteur de données (une administration, donc) et à quelques réutilisateurs. Cette approche est peut-être l'une des plus grandes ruptures avec les projets habituels des institutions. Elle considère que rien ne doit entraver l'accès très rapide à l'expérience d'utilisateurs réels. On ne peut pas développer un tel projet pour voir, au bout d'un an, si les utilisateurs sont vraiment satisfaites; Faire, tester, itérer, tester, itérer, et itérer encore : c'est ça la grande nouveauté des stratégies numériques.

Le cachier des charges était  minimal mais radical :
- l'administration doit pouvoir déposer ses fichiers en quelques minutes, au lieu des quelques heures, voire jours auparavant ;
- l'utilisateur doit pouvoir trouver ce qu'il cherche en quelques clics (ce qui nous a conduit à regrouper les fichiers pour éviter la navigation dans 350.000 fichiers en désordre qu'aucun moteur de recherche ne réussissait à ordonner proprement) ;
- et l'administration doit pouvoir s'enrichir en rencontrant les réutilisations de la société civile, entrant ainsi dans une véritable logique d'open innovation.

A partir du 7 juillet, la maquette a été développée en interaction permanente avec des réutilisateurs, avec le souci permanent d'améliorer leur expérience d'utilisation, d'intégrer leurs retours d'expérience, mais aussi, de recruter des utilisateurs alliés, considérant que nous les avions aidé à réussir leurs propres missions, et prêts à nous donner un coup de main pour la réussite du projet.

5- Le recours à la multitude

Cette dernière dimension est sans doute l'un des piliers du projet.
La Multitude, on l'a vu, a été conviée à deux reprises dans la conception de ce nouveau data.gouv.fr :
- d'abord au cours du CoDesign, qui nous a donné des retours, des suggestions et des ambitions des plus précieux ;
- en ensuite pendant la phase de développement, puisque la métrique explicité pour vérifier si nous allions dans la bonne direction a été, d'un bout à l'autre, de savoir si nous améliorions le travail des utilisateurs du site.

Mais l'appel à la multitude ne s'est pas limité à cette écoute, indispensable. Progressivement, nous l'avons associée au coeur même du projet, d'abord en intégrant, au coeur du portail, les réutilisations des données publiques. Ensuite, en accuueillant les données mêmes produites par la multitude. Après tout, personne n'a jamais dit qu'un portail d'open data devait se contenter d'être le lieu où l'administration exécute son devoir de rendre des comptes à la société. Tout ce que nous vivions, et apprenions, nous donnait envie de créer un espace où l'administration et la société coopéreraient pour créer une donnée d'intérêt public. 
C'est ce que nous avons décidé, avec l'accord de Matignon, en choisissant, avec un ensemble de règles bien précises, d'accepter aussi des données de la société civile. Et combien sommes-nous fiers, à peine un mois après l'inauguration, d'accueillir des données d'OpenStreetMap, OpenFodFacts, OpenMeteoForecast, UFC Que Choisir ? Celtipharm, etc.
Cette coopération ne s'arrêtera pas là, d'ailleurs, dans les semaines et les mois qui viennent, nous réouvriront les forums, nous ouvrirons des règles d'indexation avec les utilisateurs (folksonomie), nous appuierons le moteur de recherche sur les retours d'usages, nous activerons les fonctions sociales, etc.

6- savoir jouer avec la Multitude
Lorsque nous avons commencé ce projet, tout le monde autour de nous n'était pas convaincu de la pertinence de ce recours à la multitude (même si, à tout prendre, ça a été plus facile que prévu. Le politique a comme avantage, plus que certains entreprises, de connaître le rôle prééminent des électeurs, et de savoir qu'il convient de les écouter...).
On comprend l'inquiétude, en même temps. Internet abonde en exemples de recours ratés à la multitude. C'est ce dont nous avons parlé à ReputationWar.
La presse, hélas, montre souvent ce qu'il ne faut pas faire : des forums ou personne ne vient, ou au contraire des forums qui deviennent des défouloirs orduriers et où, en aucun cas, ne se construit une intelligence collective.
Il n'y a pas de recettes miracles, mais il y a quand même des règles élémentaires à respecter pour se frotter à la multitude.
- d'abord, une certaine culture du travail avec les écosystèmes. Il y a des acteurs importants de l'open data. Il faut les connaître, les comprendre, entrer en relation avec eux, créer une relation de confiance, ce qui suppose une manière de communiquer, une certaine loyauté dans les échanges, etc. CoDesign, le réseau d'experts, le travail avec le comité des correspondants open data, l'opendataCamp, n'étaient pas que du temps de concertation. Ce furent des lieux et des moments pour nouer ces alliances indispensables.
- ensuite, il y a, là encore, des règles et des méthodes cachées dans le code même du site. Pourquoi tous les forums de la presse tournent vinaigre, alors que Wikipédia, TripAdvisor, OpenStreetMap et tant d'autres réussissent à devenir ces sortes d'alambics qui font que la plupart donnent le meilleur d'eux-mêmes, que les utilisateurs deviennent une véritable communauté qui forge et défend elle-même l'éthique d'un bon site ? Il y a des règles et des méthodes, le web social les connaît, il est temps d'apprendre à s'en servir pour toutes sortes de projets, et pas seulement pour le "consumer Internet".
- enfin, il y a la question de la confiance. Aucun pays au monde n'a, à ma connaissance, fait le pari de laisser les gens publier et de nettoyer ensuite (contrôle à posteriori). Il fallait pour le faire une décision politique, mais aussi la maîtrise de ces méthodes issues du web social. Il fallait par exemple travailler sur une "monnaie de réputation", sur des règles poussant les contributeurs à améliorer lles données qu'ils transfèrent, puisque nous ne contrôlons plus cette qualité en amont.

7- Accepter l'imprévu

Enfin, le dernier point de méthode, peut-être le moins évident, a été de commencer le travail en acceptant l'imprévu. Forts d'un imaginaire très travaillé, et d'une bonne vision de ce que nous voulions susciter, nous avons commencé un dialogue avec les utilisateurs dont nous ne savions pas où il allait nous conduire. C'était une interaction loyale au sein d'un cadre clair. Nos amis de The Family définissent une start-up comme une organisation précaire à la recherche d'un modèle économique stable. Et c'est pour cela que les start-ups "pivotent", se vantent de pivoter, et que 70 % de celles qui réussissent font autre chose que ce pour quoi elles avaient levé des fonds. La start-up d'Etat qui a porté ce projet était une organisation provisoire (elle était montée pour six mois), à la recherche d'un "modèle économique" (une valeur d'usage pour les parties prenantes au site et des règles d'échange vertueuses). Nous avons accepté des tests et des reculades. Nous allons continuer à échanger avec nos utilisateurs. 

Il fallait, pour entrer dans cette logique, un réel soutien politique. Nous l'avons eu du Premier ministre, de son cabinet, de l'administration. Il a été plus entier, et plus facile à obtenir que ce que j'imaginais moi-même au début. Après tout, le politique est peut-être plus prêt qu'on ne pense, et plus que certaines structures privées, à se confronter à la Multitude ?

Nous ne savons pas ce que sera data.gouv.fr en janvier 2015. Mais je gage qu'il sera meilleur encore que ce que nous saurions imaginer aujourd'hui.










1 commentaire:

  1. Bel article, merci.

    Je veux vous signaler quelques fautes par contre :
    Il y a deux fois le lien vers http://data.blog.lemonde.fr/2013/12/18/data-gouv-fr-nouvelle-formule-nouvelles-ambitions/ au niveau des "ici, ici..."
    " les citoyens réclament parfois des informations qui, ne fait," *en
    ""le marché pur et parfait fondée" *fondé
    "Nous pensons ce ces méthodes sont reproductibles" *que
    "nous avons au commencé par investir" *avons commencé
    "Investi pour préparer" *Investir
    "Le cachier des charges" *cahier
    "considérant que nous les avions aidé" *aidés
    "la métrique explicité" *explicitée
    "Ensuite, en accuueillant" *accueillant
    "nous réouvriront" *réouvrirons
    "des forums ou personne ne vient" *où

    RépondreSupprimer