lundi, août 11, 2014

L'open data est-il soluble dans la "big society" ?


Début juillet paraissait dans la revue MyScienceWork un article, repris ensuite par La gazette des Communes, puis par Rue89 / Nouvel Observateur, intitulé “L’Open data est-il un leurre politique ?”.

Cette interview d’Evelyne Ruppert, une sociologue britannique, notamment à l’origine du blog “Big data et society”, s'inspire de ses travaux sur la transparence britannique, qu’elle semble bien connaître, mais porte sur la démarche française, qu’elle semble moins connaître. Evelyne Ruppert y développe une analyse que l’on pourrait résumer comme suit :
- la transparence absolue est un leurre, car les gouvernements choisissent toujours ce qu’ils communiquent, et ne partagent jamais les informations les plus importantes ;
- la transparence, parce qu’elle ne peut jamais être complète, ne crée pas la confiance mais au contraire la défiance ;
- la démarche de transparence enferme les citoyens dans les données qu’on veut bien leur transmettre ;
- l'open data promet un rapport plus direct au pouvoir, mais crée en fait une nouvelle technocratie, celle de ceux qui maîtrisent les données ;
- il faudrait donc porter la plus extrême attention à documenter les données elles-mêmes (qui les a produites, quand, pourquoi, etc.), afin de permettre l'exercice par les citoyens d'une critique des données qui leurs sont transmises.

De nombreux amis me demandent ce que je pense ce ce papier. C'est embarassant : je suis à peu près d’accord avec tout ce qui s’y dit, sans me sentir pour autant réellement concerné.

Au fond, je crois qu'Evelyne Ruppert raisonne à partir d’un implicite que je qualifierais de “modèle de la double défiance”. Sa lecture implicite du mouvement open data est la suivante : en réponse à la défiance croissante des citoyens, les gouvernements se résoudraient à lâcher certaines informations permettant aux citoyens de mieux les contrôler, dans l’espoir de restaurer cette confiance. 

Je ne sais si ce raisonnement existe quelque part. On sent bien qu'il est lié à un contexte britannique où l'open data est difficilement séparable du projet de Big Society. Mais ce que je sais, c’est que ce n’est pas celui du gouvernement français, et que ce n’est pas l’esprit dans lequel travaille la mission Etalab. En France, l’ouverture et le partage des données publiques ne sont pas vues comme des fins en soi, mais comme des leviers qui peuvent être mis au service de trois objectifs : une démocratie plus aboutie, l’innovation et la croissance, et une meilleure efficacité de l’action publique.



Transparence, accountability, participation...

Commençons par la dimension démocratique.

L'ouverture des données ne s'appuie pas, en France, sur une valeur accordée à la “transparence”. 
Personnellement, d'ailleurs, je ne suis pas fanatique de ce concept. Je lui trouve une passivité a-politique, des relents de théorie de la main invisible, une méconnaissance des ressorts de l'activité humaine... Je préfère beaucoup le concept de responsabilité, ou de "redevabilité (accountability), qui reconnaît toute la dignité du sujet qui exerce ses responsabilités.
L'ouverture des données publiques, en France, se fonde sur la Déclaration des droits de l’homme et du citoyen et son article 15 : “la société est en droit de demander compte à tout agent public de son administration”. La loi CADA, qui est la traduction législative de cet Article 15, traite des “documents administratifs”,  (mémos, avis, notes, courriers, fichiers, bases de données, etc). On sent bien qu'il ne s’agit pas de placer l'administration dans des murs de verre, d’épier tous les échanges,  de braquer sans cesse les projecteurs sur tous, en toutes circonstances. Il s'agit de rendre public des actes de responsabilités, des "documents" qu'un auteur a travaillé, sur lesquels il a engagé une responsabilité notamment devant sa hiérarchie. La loi prévoit que cette responsabilité doit pouvoir être assumée devant les citoyens. Elle n’interdit pas l’hésitation, le secret de la délibération, la préparation de la décision...
Et au passage, elle prévoit également de nombreuses exception à ce principe de publicité : protection de la vie privée, sécurité nationale, secrets protégés par la loi.

De ce fait, la loi règle aussi la question des données que l’Etat doit produire et partager, qui semble inquiéter Evelyne Ruppert. On ne demande pas à l’Etat de décrire le réel. On lui demande de partager, avec simplicité, les données qu’il utilise dans le cadre de ses missions de service public, telles qu’il les utilise. Il n’est donc pas besoin d’ouvrir la question épistémologique du sens des données, du point de vue qu’elles dissimulent, des biais d’observation éventuels. 
L’open data, ce n’est pas le service de la statistique publique, ce n’est pas non plus un grand récit par lequel l’Etat nous dit quoi penser... C’est le partage des instruments avec lesquels travaille l’Etat et sur lesquels il fonde ses décisions. C’est la recherche d’une deuxième vie, et d’une nouvelle utilité, pour tous les savoirs que crée l’Etat de par son activité quotidienne.

Bien sûr il existe des activités, dans l’Etat, qui, pour de plus ou moins bonnes raisons, revendiquent le secret. Et il existe des luttes démocratiques pour faire reculer le périmètre de ce secret. Mais il existe aussi de très nombreux autres métiers qui entrent de plus en plus dans cette démarche de partage et qui apprennent à trouver de nouvelles efficacités grâce aux relations ouvertes par ce partage.

Evidemment, l’ouverture des données n’est rien sans dialogue et la concertation autour de ces données : elle vise à créer les conditions d’une citoyenneté active, éclairée, responsable. 
Echanger avec les utilisateurs de ces données, répondre à leur questions, recueillir leurs critiques ou leurs suggestions, c’est l’un des changements essentiels que produit cette démarche. C’est l’une des dimensions du portail data.gouv.fr, qui, premier au monde en son genre, autorise les
utilisateurs, administrations, citoyens, chercheurs... à dialoguer avec le producteur de la donnée, à partager des points de vue qui ne sont pas le sien, à améliorer la donnée, à la croiser avec d’autres, voire à déposer des données qui ne sont pas celles de l’Etat.
Avec plus de 1300 réutilisations un semestre après l’ouverture de cette plateforme, force est de constater que s’est créée une communauté vivante qui s’est emparée de cette ressource...

Nous croyons beaucoup à ce débat, qui se noue sur la plateforme, sur Twitter, dans les nombreux hackathons que nous organisons, comme au sein des organisations. Plus encore qu'aux métadonnées. Car je voudrais souligner le paradoxe de la position d'evelyne Ruppert : après avoir fait le constat de l'impossibilité de la transparence, et de son impossibilité à restaurer la confiance, elle nous propose "une transparence sur la transparence", une "méta-transparence". Sans communautés actives, confiantes et bienveillantes, vous pourrez monter la transparence au carré, voire-même au cube, il ne se passera rien. Ce qui compte, comme toujours avec Internet, ce sont les communautés humaines qui s'organisent grâce aux ressources.

La France a une haute conscience du fait que partager des données doit permettre de construire de véritables gestes d’échange démocratique, du susciter la contribution éclairée du citoyen à la décision publique. L’ouverture des données doit déboucher sur une ouverture de la décision publique elle-même. C’est le sens de l’adhésion de la France au Partenariat pour un gouvernement ouvert, annoncée en mai dernier par le Président de la République. En rejoignant cette communauté d’innovateurs publics, qui nous a élus à son Comité directeur le 4 août dernier, la France a choisi de bâtir un partenariat avec des gens qui savent que l’open data prend tout son sens dans l’open government, et qui travaillent concrètement en ce sens.

Une démocratie des acteurs

Mais il y a d'autres dimensions de l'open data, qui ne se limite pas au contrôle de la démocratie représentative. Il y a une dimension de capacitation (empowerment) curieusement absente de cette interview. Pour bien la saisir, il faut comprendre combien ce mouvement est lié à la révolution numérique en cours, et combien il peut impacter l’économie de l’innovation.

Nous sommes entrés dans un monde où tous les dix ans, la puissance des ordinateurs est multipliée par trente, et leur coût est divisé de même. Le numérique a libéré dans la société une puissance d'agir inimaginable il y a très peu de temps encore. 
Ajoutée à l’existence d’Internet, qui permet aux citoyens de de synchroniser, de s'organiser, et de coopérer, cette révolution nous fait entrer dans un monde nouveau où la puissance de la multitude est devenue un paramètre politique essentiel.
Certes, comme le souligne à bon droit Evelyne Ruppert, tous ne sont pas égaux devant la technologie. Certes, le risque de fracture numérique est chronique. Certes, on voit apparaître de nouveaux technocrates. Mais il en va de même de toutes les révolutions démocratiques. 1789 ou 1830 n’ont pas distribué également le pouvoir à tous les Français. Mais elles ont associé plus de monde au pouvoir.
Cette hiérarchie des capacités n'est pas antidémocratique. La multitude, ce n’est pas la masse. C’est un corps vivant, mouvant, ayant ses propres dynamiques et ses propres organisations.
Les compétences y sont plurielles. L’organisation sociale devient multipolaire. De nouvelles élites apparaissent, qui fondent leurs légitimités dans des dimensions incommensurables. Des blogueurs tiennent la dragée haute aux journalistes. Des collectifs développent Linux, Wikipédia ou OpenStreetMap. La curation sur le web social permet de nouvelles hiérarchisations de l’information...
Penser la société, sans prendre acte de cette réalité, c’est s’enfermer dans une vision pré-numérique. C’est renoncer à faire levier sur cette dynamique.
Si data.gouv.fr s’est ouvert aux contributions de la multitude, ce n’est pas pour “faire interactif”, c’est parce que le site ambitionne de devenir la plateforme donnant corps à une communauté de producteurs et d’utilisateurs de données. C’est parce que l’Etat n’a plus le monopole de la capacité à créer de l’information d’intérêt général. C'est parce que OpenStreetMap, OpenMétéoForecast, OpenFoodFacts, Wikidata, mais aussi CeltipharmQue Choisir ?, la Croix Rouge, et demain pourquoi pas les syndicats, les associations, les think tank... ont des choses à dire, à partager. Pourquoi cliver cette communauté de producteurs et de réutilisateurs qui travaillent en réseau ?
C'est aussi le sens des nouvelles alliances que nous recherchons avec cette société civile, quand nous soutenons les lauréats Dataconnexions sur Kiss Kiss Bank Bank, quand nous épaulons le projet BANO, quand nous développons des modèles pour la recherche comme OpenFisca...

Certes l'Etat a un rôle à part. Data.gouv.fr sépare nettement les données d’autorité, produites par l’Etat, qui engage sa responsabilité sur leur sincérité, et les données produites par d’autres acteurs, dont l’Etat se contente d’authentifier l’identité, s’ils le demandent. Mais cette différence n'empêche pas la coopération.


La révolution des usages

Car ce qui compte avant tout avec l'open data, c'est ce qu'on peut en faire. C'est cette dimension qui fonde les deux autres ambitions de l'open data : le carburant pour l'innovation et le ressort pour l'efficacité de l'action publique. Ces données, ce n'est pas seulement pour "surveiller l'Etat", loin de là. Ce sont des matériaux pour l'exercice d'une citoyenneté active. Ce sont des matérriaux de création.
Certes, il existe des secrets infondés, et il faudrait plus de Mediapart pour les mettre à jour. Mais ce n'est pas la mission première de l'open data. La mission de l'open data, c'est qu'il existe des masses de savoirs inutilisés dans nos systèmes. Des savoirs qui prennent vie, et valeur, quand on les met en circulation. Il n'y a pas que des petits secrets, dans l'Etat, il y a aussi des milliers d'informations utiles et passionnantes, qui résultent du travail de milliers d'agents publics et qui embarquent leur savoir professionnel. La carte géolocalisée et horodatée des accidents de la route, qui a nourri le hackathon récemment organisé par l'OKFN et le ministère de l'intérieur, et qui a permis le magnifique travail de Rue 89, vaut son pesant de kilobits... Le fichiers des noms de rues, qui a nourri tant de développements. Les statistiques de pollution, les fonds de carte, les données météo...

C'est l'histoire de Moneyball, film culte chez les datascientists. Il y avait dans les statistiques de la
Ligue de base ball de quoi refonder ce sport. Il y a dans les données de l'Etat de quoi refonder des pans entiers de l'action publique. L'important, c'est de rendre ces données activables, pour que de nouveaux acteurs puissent s'en emparer et poser de nouvelles questions.

C'est une dimension qui échappe fréquemment aux non codeurs : l'open data ne se limite pas à révéler des données. Il vise à les rendre accessibles, maniables, activables. Et c'est pour cela qu'il ouvre sur un univers de réutilisations imprévues. On ne réclame pas les données brutes au nom d’une sorte de naturalisme de la donnée. On réclame les données brutes pour avoir des données les plus maniables possibles, pour enlever le plus d’interprétations possible, pour faciliter le plus de manipulations possibles. C'est ce que voulait dire Tim Berneers-Lee avec son "raw data". Ce n'est pas un postulat sociologique : c'est une revendication d'ingénieur. Au fond, on  ne comprend pas l’open data tant qu’on ne comprend pas la différence entre une information dissimulée page 1459 d’un rapport de la Cour des comptes, et la même information replacée dans une série complète dans un tableur facile d’utilisation.

La révolution des données

Nous sommes en effet entrés dans un monde nouveau dans lequel des pans entiers du réel sont mis en données et deviennent donc analysables, dans lequel un nombre croissant de personnes et d'entités sauront en tirer de nouveaux usages, dans lequel les big data ouvrent des perspectives épistémologiques dont on ne voit pas encore les limites.
Partager des données publiques, sous des licences qui en empêchent la captation au profit d'un seul, c'est introduire une dimension politique dans cette révolution de la donnée, c'est rééquilibrer les pouvoirs, empêcher les monopoles, créer du bien commun. C'est une des formes d'action politique essentielles à l'heure de la révolution numérique. 

Reste la question de la qualité de ces données, de leur pertinence et de leur capacité à décrire le réel. Il faut admettre que les sciences humaines ont une longue histoire avec les données. De la phrénologie au marketing contemporain, de Gobineau à Alexis Carrel,  du QI au QE elles ont souvent traduit leurs préjugés en pseudo-savoirs. Elles sont bien placées pour connaître le risque d’utiliser des  ontologies contestables, de sélectionner des corrélations qui seront présentées comme des causalités , de cacher de la politique sous les apparences de l'objectivité (voir Stat-Activisme, comment lutter avec les nombres) ou de travailler sur des données qui ne reflètent que les préjugés de leurs auteurs.
On l'a dit plus haut, ce n'est pas tout à fait le problème de l'open data, qui demande le simple partage des outils qu'utilise l'Etat pour ses missions.
Mais si on souhaite en parler un peu quand même, rappelons tout d’abord que toutes les données ne sont pas de même nature. Le chiffre exact de la population carcérale, la géolocalisation des hôpitaux, les horaires des trains, le nombre exact de professeurs ou d’agents du fisc, les prix des carburants, les codes postaux des villages de France, les prévisions météos, le tracé des routes, sont certes des constructions intellectuelles, mais ne posent pas pour autant de grande question épistémologique. On ne va pas nous servir à chaque fois la différence entre noumènes et phénomènes et le mythe de la caverne. Il existe des faits informations, que des citoyens demandent, et que l'on peut partager sans un grand luxe de précautions.

D'autres données sont plus de l'ordre de l'interprétation et méritent analyse. Depuis les travaux de la commission Stiglitz, par exemple, la France est familiarisée avec les problèmes que pose la mesure du PIB. Pourquoi la création de valeur par les fonctionnaires n’y est-elle abordée qu’à travers  leur masse salariale ?
Il est vrai que de nombreuses données ne disent pas tout à fait ce qu’elles prétendent dire. Il est vrai que dans ce cas, la plus grande transparence sur les choix ayant présidé à la construction de ces données, la plus grande précision sur les hypothèses implicites sont de mise.
Mais symétriquement, il faut souligner que chacune de ces données répond au moins à une question. Les statistiques de la justice, par exemple : la distribution sociale des peines décrit-elle la distribution de la délinquance ? Les stratégies de punition adoptées par les juges ? La capacité à faire appel à un bon avocat ? Ou parle-elle de la distribution des formes de délinquance et de la sévérité de la loi en fonction de ces formes ?

Je ne sais pas. Mais effectivement, l'analyse précise des conditions de construction de cette donnée permettrait de le comprendre. Il faut juste poser les bonnes questions à ces données. Et le monde de l’open data me semble, à tout prendre, plus capable de poser ces bonnes questions que bien d'autres mondes sociaux, à commencer par les médias.




Aucun commentaire:

Enregistrer un commentaire