La semaine dernière, j'ai été invité par Sabine Blanc et Samuel Goëta à participer à un passionnant débat de l'OKFN sur le "Statactivisme".
Le prétexte à cet échange était la parution, en mai dernier, du livre d'Isabelle Bruno, Emmanuel Didier et Julien Prévieux : Statactivisme, comment lutter avec des nombres.
C'est un livre joyeux et stimulant, qui, constatant le lien intime entre la statistique et le pouvoir, s'efforce d'armer ses lecteurs pour qu'ils résistent mieux à cette collusion. C'est un livre tonique et rebelle, qui se propose de nous apprendre à lire les statistiques, de nous familiariser avec les innombrables moyens de les manipuler, mais surtout de nous apprendre à lutter avec ces armes de pouvoir, en sachant critiquer les statistiques, en produisant nous-mêmes des contre-statistiques, voire par d'autres formes de subversion, y compris artistique (c'est d'ailleurs l'une des dimensions importantes et imprévues de ce bel ouvrage)...
Il y a un lien intime entre la statistique et le pouvoir. Son nom même, forgé par l'économiste Allemand Gottfried Achenwall signifie "la science de l'homme d'Etat". Rassemblant dans ses indicateurs la multitude des hommes et les caprices de la nature, pour en faire émerger les constantes, les tendances et les directions, la statistique permet l'application de la raison aux phénomènes épars. elle permet l'anticipation, le jugement et la décision. La statistique est par essence l'outil du Souverain.
Le prétexte à cet échange était la parution, en mai dernier, du livre d'Isabelle Bruno, Emmanuel Didier et Julien Prévieux : Statactivisme, comment lutter avec des nombres.
C'est un livre joyeux et stimulant, qui, constatant le lien intime entre la statistique et le pouvoir, s'efforce d'armer ses lecteurs pour qu'ils résistent mieux à cette collusion. C'est un livre tonique et rebelle, qui se propose de nous apprendre à lire les statistiques, de nous familiariser avec les innombrables moyens de les manipuler, mais surtout de nous apprendre à lutter avec ces armes de pouvoir, en sachant critiquer les statistiques, en produisant nous-mêmes des contre-statistiques, voire par d'autres formes de subversion, y compris artistique (c'est d'ailleurs l'une des dimensions importantes et imprévues de ce bel ouvrage)...
Ce fut une belle soirée, où nous avons pu échanger avec Joël Gombin, de l'Université de Picardie, Laure Lucchesi, directrice adjointe d'Etalab, Hervé Paris, d'Altercarto ("mutuelle de données, de cartes et de savoir-faire"), Xavier Moisant, le célèbre blogueur ferroviaire, et Edouard Schlumberger, fondateur de Vroomvroom.fr.
Et pourtant, cette soirée m'a laissé un sentiment d'inachevé. Comme l'impression que la manière dont on posait la question risquait de nous faire rater quelque chose d'essentiel sur les évolutions en cours des rapports entre le nombre et le pouvoir. Au risque, paradoxal, de renforcer les formes de pouvoir que ce "statactivisme" prétend combattre.
De ce fait même, elle est sans cesse menacée de petits arrangements, conscients et volontaires volontaires, à peine conscients (comme le flottement entre les plaintes et les main-courantes que l'on peut sentir dans tous les commissariats) ou même totalement inconscients (du fait tout simple que les grandeurs mesurées correspondant toujours à l'histoire politique et sociale du moment). C'est pourquoi d'ailleurs, dès son article 1er, la loi sur la statistique française proclame et organise l'indépendance de l'INSEE, indépendance encore renforcée par la création de l'Autorité de la statistique publique dans la loi de 2008 sur la modernisation de l'économie.
Alors bien sûr les citoyens, les militants, les activistes ont raison de vouloir savoir comment sont faites ces statistiques, de vouloir comprendre qui les juge et qui les utilise. Et ils ont raison de vouloir traduire leurs propres points de vues sur le réel dans des statistiques alternatives, plus à même de décrire ces points de vue alternatifs.
Mais il me semble que cette contestation là risque de manquer l'essentiel de ce qui change aujourd'hui avec la multiplication des données numériques et des manières de les utiliser.
Car au fond, la contre-statistique, c'est toujours une statistique. C'est-à-dire une manière de construire un savoir surplombant sur le réel, une synthèse qui permet de l'embrasser et de le manier, un instrument pour le Souverain. Or, la construction de ce type de point de vue n'épuise pas, loin s'en faut, tout ce qu'il est possible de faire avec les données.
Je voudrais partager avec vous quatre exemples d'autres manières d'utiliser les données de l'Etat, en espérant qu'elles inspireront de nouvelles formes d'engagement.
Je voudrais partager avec vous quatre exemples d'autres manières d'utiliser les données de l'Etat, en espérant qu'elles inspireront de nouvelles formes d'engagement.
1- Convertir la donnée en modèle puis en moteur
C'est ce que nous avons fait avec France Stratégie, l'IPP et l'IDEP en travaillant le projet Openfisca.
OpenFisca, c'est la loi de finance traduite en moteur informatique.
Ici, la donnée en tant que telle comprendrait des centaines de pages et serait très difficile à manier. En revanche, le système socio-fiscal, traduit en moteur informatique, accessible au développeurs d'applications web, devient un outil à la fois personnel (permettant de simuler sa propre feuille d'impôts), un outil de test de réformes fiscales annoncées ou envisageables, un outil de simulation capable d'importer un million de cas-types et donc de mesurer les effets de bord de l'impôt (comme ce travail réalisé au cours du hackathon OpenFisca pour analyser les effets de la conjugalisation de l'impôt en fonction des revenus des deux membres du couple), mais surtout une ressource pour développer de nombreuses applications.
Ainsi, c'est grâce à cette mise en code du droit qu'il a pris toute sa valeur, d'innovation, permettant notamment le développement de ce magnifique service qu'est Mes-aides, qui permet à chaque citoyen de venir vérifier l'ensemble de ses droits. C'est la mise en code de cette donnée qui a permis tous les projets prometteurs nés dans les hackathons : le debogueur en ligne, le comparateur d'impôt, la visualisation de l'interdépendance des formules, etc. C'est la mise en code (open source) qui permet à différentes équipesde recherche, dont certaines, des plus prestigieuses, de venir tester et améliorer leurs propres moteurs de simulation socio-fiscale (et le nôtre au passage).
Rendre la donnée vivante, accessible, maniable est une autre forme d'activisme, au moins aussi prometteuse que la construction d'autres statistiques.
C'est ce que nous avons fait avec France Stratégie, l'IPP et l'IDEP en travaillant le projet Openfisca.
OpenFisca, c'est la loi de finance traduite en moteur informatique.
Ici, la donnée en tant que telle comprendrait des centaines de pages et serait très difficile à manier. En revanche, le système socio-fiscal, traduit en moteur informatique, accessible au développeurs d'applications web, devient un outil à la fois personnel (permettant de simuler sa propre feuille d'impôts), un outil de test de réformes fiscales annoncées ou envisageables, un outil de simulation capable d'importer un million de cas-types et donc de mesurer les effets de bord de l'impôt (comme ce travail réalisé au cours du hackathon OpenFisca pour analyser les effets de la conjugalisation de l'impôt en fonction des revenus des deux membres du couple), mais surtout une ressource pour développer de nombreuses applications.
Ainsi, c'est grâce à cette mise en code du droit qu'il a pris toute sa valeur, d'innovation, permettant notamment le développement de ce magnifique service qu'est Mes-aides, qui permet à chaque citoyen de venir vérifier l'ensemble de ses droits. C'est la mise en code de cette donnée qui a permis tous les projets prometteurs nés dans les hackathons : le debogueur en ligne, le comparateur d'impôt, la visualisation de l'interdépendance des formules, etc. C'est la mise en code (open source) qui permet à différentes équipesde recherche, dont certaines, des plus prestigieuses, de venir tester et améliorer leurs propres moteurs de simulation socio-fiscale (et le nôtre au passage).
Rendre la donnée vivante, accessible, maniable est une autre forme d'activisme, au moins aussi prometteuse que la construction d'autres statistiques.
2- systèmes d'aide à la décision
Une deuxième forme de subversion de la dictature des statistiques consiste à déplacer le lieu du savoir. Agrégée, la donnée est par essence l'outil de celui qui prend des décisions globales : elle sert la pointe de la pyramide. Répartie sur ceux qui en ont besoin, elle devient un outil d'empowerment. Il y a des dizaines d'exemples de savoirs qui, au lieu d'être agrégés, sont présentés de sorte de servir la décision locale. On me parlait ainsi récemment d'un logiciel d'aide à la prescription médicale (comme le logiciel développé pour les médecins par Bilog à partir de la base Thériaque). Il y a aussi ce projet en cours d'étude chez Pôle emploi : les statistiques du chômage et du retour à l'emploi peuvent nourrir la décision macro-économique, voire les décisions d'organisation et de gestion de Pôle emploi. Mais elles pourraient aussi être codées de manière à permettre à chaque demanderu d'emploi d'évaluer ses options personnelles : "si je cherche le même poste, j'attendrai en moyenne 16 mois", "si j'accepte de déménager, j'attendrai en moyenne 12 mois", si j'accepte de changer de secteur, ce sera probablement 14 mois"... On sort ainsi de la statistique traditionnelle pour donner à chacun une espérance de résultat, et surtout pour nourrir sa décision individuelle...
Assumer, tout simplement, que les données doivent revenir à la base et éclairer la décision quotidienne de ceux qui travaillent, et les dispenser ainsi d'attendre la décision de leur chaîne de commandement est une autre forme de détournement des outils statistiques, dont les conséquences sont innombrables.
Une deuxième forme de subversion de la dictature des statistiques consiste à déplacer le lieu du savoir. Agrégée, la donnée est par essence l'outil de celui qui prend des décisions globales : elle sert la pointe de la pyramide. Répartie sur ceux qui en ont besoin, elle devient un outil d'empowerment. Il y a des dizaines d'exemples de savoirs qui, au lieu d'être agrégés, sont présentés de sorte de servir la décision locale. On me parlait ainsi récemment d'un logiciel d'aide à la prescription médicale (comme le logiciel développé pour les médecins par Bilog à partir de la base Thériaque). Il y a aussi ce projet en cours d'étude chez Pôle emploi : les statistiques du chômage et du retour à l'emploi peuvent nourrir la décision macro-économique, voire les décisions d'organisation et de gestion de Pôle emploi. Mais elles pourraient aussi être codées de manière à permettre à chaque demanderu d'emploi d'évaluer ses options personnelles : "si je cherche le même poste, j'attendrai en moyenne 16 mois", "si j'accepte de déménager, j'attendrai en moyenne 12 mois", si j'accepte de changer de secteur, ce sera probablement 14 mois"... On sort ainsi de la statistique traditionnelle pour donner à chacun une espérance de résultat, et surtout pour nourrir sa décision individuelle...
Assumer, tout simplement, que les données doivent revenir à la base et éclairer la décision quotidienne de ceux qui travaillent, et les dispenser ainsi d'attendre la décision de leur chaîne de commandement est une autre forme de détournement des outils statistiques, dont les conséquences sont innombrables.
3- Passer des stats aux probas
Une des grandes difficultés de l'ancien monde scientifique et industriel, quand il est confronté au big data est de passer des statistiques aux probabilités. C'est bien compréhensible. Pendant des siècles, "faire science" c'était produire un savoir dont Karl Popper a bien montré qu'il devait être prédictif, reproductible et "falsifiable". Un savoir neutre, objectif, véfifié, critiquable et transmissible. Ce n'est que fort de ces savoirs certains que l'on pouvait, avec crainte et tremblement, prendre le risque de l'action...
Or, avec l'invasion du numérique, avec la masse de savoirs désormais accessibles, avec les technologies et les méthodes développées pour le big data, on apprend de plus en plus à agir dans un monde incertain, en fondant la décision sur des indices, des présomptions, des probabilités. Quand Michël Flowers développe, pour la ville de New-York, des algorithmes qui permettent de mieux cibler les contrôles sanitaires, les patrouilles de police ou la recherche des pharmacies impliquées dans la fraude au médicament, il n'a pas besoin de théorie scientifique de la fraude. Il repère des corrélations, il envoie les patrouilles, il mesure le nouvel impact, il corrige si nécessaire. Il utilise les statistiques pour engager une démarche de test and learn et pour construire un système dynamique. Un système apprenant.
J'ai la conviction qu'il y a plus d'innovation, plus de disruption, plus de subversion en changeant la manière d'utiliser les données - en changeant les questions que l'on pose aux données - qu'en changeant les données elles-mêmes.
Une des grandes difficultés de l'ancien monde scientifique et industriel, quand il est confronté au big data est de passer des statistiques aux probabilités. C'est bien compréhensible. Pendant des siècles, "faire science" c'était produire un savoir dont Karl Popper a bien montré qu'il devait être prédictif, reproductible et "falsifiable". Un savoir neutre, objectif, véfifié, critiquable et transmissible. Ce n'est que fort de ces savoirs certains que l'on pouvait, avec crainte et tremblement, prendre le risque de l'action...
Or, avec l'invasion du numérique, avec la masse de savoirs désormais accessibles, avec les technologies et les méthodes développées pour le big data, on apprend de plus en plus à agir dans un monde incertain, en fondant la décision sur des indices, des présomptions, des probabilités. Quand Michël Flowers développe, pour la ville de New-York, des algorithmes qui permettent de mieux cibler les contrôles sanitaires, les patrouilles de police ou la recherche des pharmacies impliquées dans la fraude au médicament, il n'a pas besoin de théorie scientifique de la fraude. Il repère des corrélations, il envoie les patrouilles, il mesure le nouvel impact, il corrige si nécessaire. Il utilise les statistiques pour engager une démarche de test and learn et pour construire un système dynamique. Un système apprenant.
J'ai la conviction qu'il y a plus d'innovation, plus de disruption, plus de subversion en changeant la manière d'utiliser les données - en changeant les questions que l'on pose aux données - qu'en changeant les données elles-mêmes.
4- changement des relations entre les acteurs
Enfin, et c'est sans doute le plus important, on pourrait s'efforcer de modifier la manière dont sont produites les données elles-mêmes, et notamment les formes de relations entre les différents acteurs impliqués.
La confrontation de deux écoles de statistiques a évidemment de l'intérêt. Mais la coopération, autour de la donnée, entre pusieurs acteurs impliqués dans un même projet a encore plus d'intérêt.
Vendredi, dans le cadre de la Semaine de l'innovation publique, l'IGN, OpenStreetMap France et l'Administrateur général des données signeront un accord de coopération qui a vocation à s'élargir à l'ensemble des acteurs de l'adresse... Cet échange permettra à tous ces acteurs de coopérer ensemble à l'établissement d'une base de données de la géolocalisation de toutes les adresses postales. Et chacun conservera le droit d'exploiter ces adresses dans son propre modèle, OpenStreetMap en particulier les diffusant en open data (sous licence share alike). Les échanges ayant présidé à cet accord se sont révélés d'une fécondité inouïe. La discussion entre des géomètres, des géographes, des citoyens engagés, des opérateurs publics autour de la manière dont ils avaient concrètement choisi de retranscrire telle ou telle dimension du réel, les échanges entre praticiens autour des grandes options technologiques et juridiques, les efforts respectifs pour comprendre les motivations de l'autre, ses contraintes, ses ambitions et ses choix structurants provoqueront, à terme, bien plus de changements et d'innovations, et peut-être de subversion, que des années de confrontations statistiques.
J'espère que ces quelques exemples donneront envie à tous nos amis statactivistes d'amplifier encore leurs efforts pour devenir vraiment révolutionnaires. Il est essentiel que des citoyens, des militants, des activistes s'emparent des données et construisent d'autres points de vue. Mais ils peuvent faire beaucoup, beaucoup plus de choses que des contre-statistiques. Ils peuvent devenir des acteurs majeurs de l'émergence de nouvelles pratiques politiques et sociales qui utiliseront toutes les ressources qu'offre la révolution de la donnée.
La confrontation de deux écoles de statistiques a évidemment de l'intérêt. Mais la coopération, autour de la donnée, entre pusieurs acteurs impliqués dans un même projet a encore plus d'intérêt.
Vendredi, dans le cadre de la Semaine de l'innovation publique, l'IGN, OpenStreetMap France et l'Administrateur général des données signeront un accord de coopération qui a vocation à s'élargir à l'ensemble des acteurs de l'adresse... Cet échange permettra à tous ces acteurs de coopérer ensemble à l'établissement d'une base de données de la géolocalisation de toutes les adresses postales. Et chacun conservera le droit d'exploiter ces adresses dans son propre modèle, OpenStreetMap en particulier les diffusant en open data (sous licence share alike). Les échanges ayant présidé à cet accord se sont révélés d'une fécondité inouïe. La discussion entre des géomètres, des géographes, des citoyens engagés, des opérateurs publics autour de la manière dont ils avaient concrètement choisi de retranscrire telle ou telle dimension du réel, les échanges entre praticiens autour des grandes options technologiques et juridiques, les efforts respectifs pour comprendre les motivations de l'autre, ses contraintes, ses ambitions et ses choix structurants provoqueront, à terme, bien plus de changements et d'innovations, et peut-être de subversion, que des années de confrontations statistiques.
J'espère que ces quelques exemples donneront envie à tous nos amis statactivistes d'amplifier encore leurs efforts pour devenir vraiment révolutionnaires. Il est essentiel que des citoyens, des militants, des activistes s'emparent des données et construisent d'autres points de vue. Mais ils peuvent faire beaucoup, beaucoup plus de choses que des contre-statistiques. Ils peuvent devenir des acteurs majeurs de l'émergence de nouvelles pratiques politiques et sociales qui utiliseront toutes les ressources qu'offre la révolution de la donnée.
Aucun commentaire:
Enregistrer un commentaire