mardi, mars 19, 2013

Non, les données ne sont pas du pétrole...

Il ne se passe plus une semaine sans un dossier spécial titrant sur "les data, pétrole du XXIe Siècle", "data is the new oil", "les données, le nouvel or noir", "vos données personnelles valent 315 milliards d'euros", "profitez des opportunités des big data", voire même un "trésor caché" et j'en passe.

On comprend bien la métaphore : les données personnelles, les données publiques, les données de l'internet des objets seraient comme le pétrole : une ressource naturelle, fluide, susceptibles de toutes sortes de transformations, et porteuses d'un énorme potentiel de valeur. Plus encore, elles seraient le ferment d'une nouvelle révolution industrielle, appelées à plier l'économie mondiale à leur puissant potentiel industriel.

On comprend la métaphore, mais elle n'en n'est pas moins lassante. C'est en passe de devenir l'un de ces memes qu'affectionne Internet, comme son prédécesseur, le fameux "content is king". Elle désigne un aspect du réel mais, par sa force de suggestion, en dissimule d'autres et entraîne une cascade d'attitudes et de raisonnement, parfois fortement biaisés.  C'est surtout une pauvre métaphore, qui débouche sur une pauvre pensée. Car, comme toute métaphore, elle est partiellement fausse, elle contraint la pensée et lui fait prendre des chemins hasardeux. La donnée, c'est à la fois beaucoup plus compliqué, et, dans l'économie, c'est à la fois beaucoup moins, et beaucoup plus que du pétrole.

Le pétrole est une ressource naturelle non renouvelable. On investit pour l'extraire, on l'accumule, le transporte, le distribue. Puis on le transforme en énergie, ou en matériaux. Utiliser le pétrole, même transformé, le détruit et donc en détruit la valeur. Il a en effet une valeur d'usage qui disparaît après utilisation. Il a un propriétaire, il s'échange sur les bourses du monde entier, il disparaîtra... Sa valeur est transitive : 100 fois plus de pétrole vaudra 100 fois plus de valeur.
Les données n'ont rien de naturel. Elles sont produites par des dispositifs techniques, développés par des ingénieurs, en fonction de certains objectifs, et qui ont trouvé des financements... Elles s'articulent d'une manière ou d'une autre au réel, dont elles sont la trace, le symbole ou l'empreinte. Un réel qui peut parfois même être le for intérieur de l'individu, inaliénable et incessible... Elles sont parfois extraites (comme le pétrole), mais de plus souvent produites et échangées librement par les individus. Ce ne sont pas des ressources rares. Non seulement elles ne s'usent pas quand on les utilise, mais elles prennent sans doute même de la valeur. Cette valeur, comme leur sens, dépend profondément du contexte. Les données peuvent être accaparées, mais il est difficile de les stocker, notamment parce qu'elles coûtent de moins en moins cher à produire et que la multitude finit toujours par les produire elle-même à bas prix. Elles peuvent aussi servir à constituer des biens communs non rivaux. Leur valeur est donc plus que transitive (le tout vaut plus que la somme des parties).


Il y a donc beaucoup d'inconvénients à pousser trop loin la métaphore du pétrole. D'abord ce réflexe de thésaurisation. Cette pulsion, pour ceux qui ont des données, qui pousse à croire qu'il suffit de les conserver, et qu'on finira bien par leur trouver acquéreur. Ensuite, cette tentation de vendre les données brutes, comme on vend du pétrole brut, en imaginant qu'on touchera une fraction significative de la valeur d'usage et qu'on pourra continuer à vendre des données après épuisement des premières.
Mais surtout, il y a la tentation de penser les données comme une ressource brute, au mieux comme un immatériel de type I (voire L'Age de la multitude), d'en faire un patrimoine. Je pense pour ma part que les données brutes n'ont quasiment pas de valeur : ce sont les stratégies d'immatériels de type II qui s'imposent : utiliser les données comme support d'innovation, créer de grands référentiels qui ouvrent le champ des possibles, créer de grandes plateformes autour de ses jeux de données, les croiser pour mieux les féconder, les faire vivre dans les interactions.

Non, les données ne sont pas un nouveau pétrole, pas plus que le pétrole n'était un nouveau cheval...

D'une part, les données sont "moins" qu'une matière brute. De plus en plus un substrat, un continuum qui décrit de plus en plus l'ensemble de la réalité et dans lequel il faut désormais apprendre à se mouvoir.
Un substrat de plus en plus complexe, avec lequel les gens apprennent à construire une image d'eux-mêmes (comme dans le mouvement du quantifiedself), avec lequel ils nouent de nouveaux rapports sociaux.
Travaillées comme nous essayons de le faire chez Etalab, les données peuvent devenir un bien commun de la Nation, un référentiel partagé, un "common knowledge" sans lequel aucun savoir, aucun lien social, aucune action n'est seulement envisageable...

Et en même temps, les données sont "plus" qu'une matière première ou une énergie.
Elles deviennent insensiblement à la fois le contenant et le contenu de la révolution numérique. Elles deviennent le nouveau code au coeur de la machine Internet, le flux sur lequel se greffent toutes les autres applications, le principe d'organisation et de régulation du numérique.
Elles conjuguent à la fois, dans un format fluide et maniable, du sens, de la raison, de l'imagination et même de l'esthétique.

Les données restent un impensé. A la fois empreintes, quasiment organiques, et matière éminemment politique, pénalisées par une 
définition, qui, en Français, est un faux ami (rien de moins "donné" qu'une donnée), leur fonction, qui est souvent confondue avec une variable alors qu'elles sont de plus en plus le principe fondamental sur lequel se greffent le code, les applications et les usages, et leur régulation qui a été pensée pour les informations et les documents, mais pas pour cette matière hyperfluide, il reste un énorme travail de pensée à fournir pour comprendre comment vont s'architecturer désormais nos économies, nos rapports sociaux et nos identités.



4 commentaires:

  1. Bonjour
    effectivement le terme "données" est ambiguë.
    mais le terme "valeur" l'est encore plus, et tout le monde en use et en abuse.
    Il y a le totalitarisme de la valeur financière (que l'on retrouve par exemple dans les travaux sur le capital immatériel qui sont polarisés sur cet aspect.http://www.observatoire-immateriel.com/index.php?option=com_content&view=article&id=96&Itemid=40&lang=fr ).
    Pour la comparaison avec le pétrole voici un extrait de nos débats au sein du Club Urba-EA (association de 1901) sur l'Entreprise Numérique :"Les données, quant à elles, sont assimilables à un produit de fabrication intermédiaire. Elles peuvent être valorisées (au sens financier) si elles ont une valeur marchande externe, voir interne (cf le prix de cession interne). Ce sont des choix relativement arbitraires ou stratégiques. Par exemple, les réseaux sociaux de fait « valorisent » les données de leurs clients (cf http://www.value-architecture.com/2013/03/les-reseaux-sociaux-sorientent.html ). L’open data vise à créer une « externalité »… Mais je ne vois pas bien l’intérêt d’inscrire les données au bilan, cela me semble pervers, idem pour l’idée de fiscaliser les données détenues par les réseaux sociaux… qui accrédite l’idée que les données ont une valeur financière intrinsèque. Car le vrai sujet est que les données ont une valeur non financière (secret de fabrication, confidentialité, protection des libertés) !"
    On voit bien que tout le débat tourne autour de la valeur, terme qui est asémantique ...
    Voir à ce sujet le polymorphisme de la valeur :http://www.value-architecture.com/2013/02/polymorphisme-de-la-valeur.html

    RépondreSupprimer
  2. Quel plaisir de lire ces réflexions ici. Qu'enfin les analyses des travaux des Science and Technology Studies, de Bruno Latour, Steve Woolgar, John Law (qui parlent des données "non données" et des faits "faits" depuis la fin des années 1970) infusent là où des données se fabriquent et circulent.

    La question est déjà ancienne et se déplace aujourd'hui, via l'Opendata, du monde des grandes bases de données scientifiques (voire les travaux, notamment, de G. Bowker et S.L. Star) vers les institutions publiques. Certains politologues et sociologues commencent à s'y pencher et traitent de problèmes semblables à ceux que vous posez. Nous avons tout intérêt à travailler ensemble ces vastes sujets, pour montrer aussi à quel point des théories, absconses aux yeux de certains, sont au contraire bien opérationnelles et « pratiques » au sens fort du terme.

    (quelques éléments d'analyse ici : http://coulisses-opendata.com/2013/02/27/ouvrir-la-boite-noire-de-lopen-data-quelques-premieres-pistes-issues-des-coulisses/)

    RépondreSupprimer
  3. Bonjour Henri,
    Texte très intéressant, merci.
    Du coup, que pensez vous de l'analyse de Stéphane Grumbach d'INRIA, qui reprend la métaphore mais pour affirmer sa limite?
    Selon lui, il faut retourner entièrement le processus de création de valeur : le pétrole est concentré dans des puits, puis extrait, raffiné et consommé par des individus.
    La donnée est "extraite" des individus, concentrée par des entreprises, et raffinée par le big data, ...
    http://www.inriality.fr/vie-citoyenne/data/donnees/les-donnees-plus-importantes/
    et son article dans le Monde
    http://abonnes.lemonde.fr/idees/article/2013/01/07/les-donnees-puissance-du-futur_1813693_3232.html

    Geoffrey Delcroix

    RépondreSupprimer
  4. Data is the new oil , maybe this is right to some extent.That is to say data become more important than oil itself.

    RépondreSupprimer