Henri Verdier Blog: Big Data : comment faire du neuf avec du neuf ?

lundi, février 14, 2011

Big Data : comment faire du neuf avec du neuf ?

C'est toujours pareil avec l'innovation. On commence par lui demander d'imiter l'ancien.
Parfois, cette absence d'imagination suffit à éteindre une technologie prometteuse. Parfois, c'est une phase transitoire qui débouche ensuite seulement sur les grandes créations.

Cela fait près d'un an que nous travaillons à l'analyse de grands corpus de données relationnelles. On commence à être à l'aise dans leur extraction, leur clusterisation, leur analyse, la modélisation de certains phénomènes, le filtrage social, les moteurs de recommandation ou la datavisualisation... On a eu fait quelques missions captivantes et quelques résultats insoupçonnés...

Mais je ne peux m'empêcher de penser que nous, nos concurrents, nos clients ou nos partenaires, nous passons encore à côté des vrais enjeux. Nous n'avons pas encore trouvé les questions qui mériteraient d'être posées aux masses de données désormais disponibles.

C'est toujours l'histoire du génie dans la bouteille. Si vous aviez trois voeux à formuler, vous commenceriez par quoi ?

La plupart des usages actuels des "big data" tiennent en quelques catégories : prédire l'évolution d'un phénomène, détecter un noeud particulièrement stratégique, repérer des corrélations pour optimiser une stratégie (notamment marketing), organiser une communication virale, mieux cibler, mieux appareiller, mieux relier....

Ces usages ne sont certes pas insignifiants. Sans doute même vont-ils révolutionner le marketing du futur. Sans doute seront-ils essentiels aux futures stratégies de sécurité. Sans doute permettront-ils l'avènement des "villes intelligentes", de la "maison intelligente", du "transport intelligent" (même si "optimisé" me semblerait un qualificatif préférable à "intelligent"). Mais ils me semblent ancrés dans la vision d'un monde qui ne serait que le prolongement du nôtre, avec simplement une puissance de calcul et des masses de données accrues.

Les craintes - légitimes - exprimées face à cette révolution sont également fondées sur d'anciennes représentations. On nous ressert "big brother" à toutes les sauces, c'est-à-dire l'idée qu'on saura tout sur chacun. Mais c'est là encore une crainte fondée sur des représentations anciennes. C'est la police du Tsar qui cherchait à tout savoir sur chacun. Le pouvoir s'est fait plus subtil, plus euphémique, plus manipulateur. Il s'est fait biopolitique, et peut-être même infopolitique depuis cette époque. Il s'est fait Spectacle, et plus encore depuis cette époque. Il n'a vraiment plus besoin de tout savoir sur chacun. Les contre-pouvoirs eux-mêmes se cherchent des formes sans centre, comme l'ont en partie illustré les événements en Tunisie et en Egypte.

Même si nous trouvons déjà de magnifiques résultats en contemplant les corrélations, les circuits de l'influence, la naissance des phénomènes, j'ai la conviction qu'il nous faut travailler sans relâche à dépasser ces simples analyses. Si nous n'y arrivons pas, d'autres y réussirons et nous serons dans la position peu enviable des fabricants de carrosses à moteur, de tables en formica ou des éditeurs de musique.

Cette ambition exige un effort constant. Je n'en n'ai pas le résultat, mais j'ai quelques convictions, et notamment deux idées fortes que je voudrais partager ce soir :

1- Modéliser des phénomènes plus complexes.

Pourquoi s'attarder à chercher des "influenceurs" ou des corrélations simples quand nous avons désormais toutes les données nécessaires pour attaquer des questions aussi complexes et intégrées que "qu'est-ce qu'une opinion, comment se forme-t-elle et comment circule-t-elle ?", "quel est l'état émotionnel des différentes composantes du corps social ?", "quelle est la réalité perçue par les différentes composantes de la société ?", "quelle est l'organisation optimale de mon équipe par rapport à une question précise ?", "quel est le degré d'influence d'une culture étrangère sur les différents groupes sociaux ?". Toutes ces questions font appels à des notions complexes, approchés par les sciences sociales depuis des années à travers des concepts maladroits, fragiles, souvent empreints de préjugés. On peut aujourd'hui refonder ces concepts à travers des approches positives. On peut faire un modèle numérique de l'influence, de l'opinion, de la confiance populaire. On peut mettre un peu de science dans ces opinions et ces représentations.

Il faudra croiser beaucoup de sciences humaines avec l'analyse de données, puiser aux sources de la psychologie, de la sociologie, de l'anthropologie. Il faudra forger de nouveaux concepts. Mais c'est possible. Il est temps de s'y mettre.

2- Rechercher des propriétés émergentes

J'ai déjà évoqué, dans un précédent billet, le fait que les big data nous permettaient d'entrevoir des propriétés émergentes. On m'a d'ailleurs fait remarquer à juste titre que je n'y citais pas Prigogine, ce qui est effectivement regrettable et que je corrige immédiatement à vous renvoyant à ce très bel article de Jean-Paul Basquiat.

Ce qui est compliqué avec les propriétés émergentes, c'est justement que l'analyse des parties ne permet pas d'anticiper le comportement du tout.
Quelques règles simples attribuées à des robots fourmis suffisent à déclencher des stratégies collectives extrêmement sophistiquées. Quelques règles simples (mais dynamiques) attribuées au pavage d'un modèle aboutissent à une évolution que personne ne sait anticiper, et qui peut repousser l'équilibre stable à des millions de tours de jeu.

Au fond, on se comporte aujourd'hui face aux données du web comme un biologiste qui prétendrait tout connaître de la pensée parce qu'il dispose de belles images d'IRM.
Il verrait effectivement des états d'activation des neurones, des zones d'activité du cerveau, mais que saurait-il de la mémoire, de la volonté, des affects et des passions ? Rien. Ce qui ne serait pas bien grave s'il ne prétendait pas en savoir tout.

Chacun d'entre nous est une sorte de neurone dans le cerveau qu'est aujourd'hui le web social. Nous émettons des messages, nous filtrons ceux qui nous parviennent en les arrêtant ou en les passant à d'autres. Nous obéissons à quelques règles simples, qui commencent à être connues pour partie dans les modèles de l'économie de l'attention, ou de la notoriété. Que pense ce cerveau ? Où pense-til ? Nous n'en savons rien. Nous faisons simplement notre petit bout de travail.
Je ne cède pas, en disant cela, à une impulsion new-age. Au contraire, je pense qu'il y a un fabuleux gisement de valeur, de services, d'applications très concrètes que sauront inventer ceux qui s'emploieront à réfléchir au niveau de ces propriétés émergentes.

Si un jour apparaît un génie qui me propose trois voeux, je pense, finalement que mon premier voeu serait d'en avoir plus que trois.

Libellés

lundi, février 14, 2011

Big Data : comment faire du neuf avec du neuf ?

Aucun commentaire:

Enregistrer un commentaire