lundi, juillet 25, 2011

7 sondages mondiaux par minute

Je viens de tomber par hasard sur cette belle infographie

60 Seconds - Things That Happen On Internet Every Sixty Seconds
Infographic by- Shanghai Web Designers

Elle nous vient de Dubaï...
Elle nous montre, avec des chiffres récents, l'emprise incroyable qu'a pris Internet dans la vie quotidienne de la planète. 600 nouvelles vidéos par minute sur Youtube, 100.000 tweets, 13.000 ventes d'applications I-Phone... On le sent bien, mais ça fait toujours du bien d'avoir des chiffres actualisés.

Ce qui m'a frappé, tout comme Milan Stankovic, qui l'a relevé sur Twitter, ce sont deux chiffres étrangement similaires.
Presque 700.000 recherches par minute sur Google. Presque 700.000 modifications de statuts par minute sur Facebook.


C'est intéressant parce que nous savons bien qu'avec un échantillon de 1.000 personnes, soigneusement qualifiées, un institut de sondage prédit à peu près correctement le résultat d'une élection.
Il suffit de 1.000 personnes et d'un peu de méthode pour prédire l'opinion française.
Il suffit donc de 100.000 personnes correctement qualifiées pour prédire l'opinion mondiale.
Et qualifiés par Google et Facebook, c'est peu dire que nous le sommes.

Concrètement, Google et Facebook prennent donc chaque minute une photographie instantanée de l'opinion égale à 7 sondages.
Chaque minute.
On comprend qu'ils investissent dans le traitement des big data...

3 commentaires:

  1. Meme si je suis moi-meme tres enthousiaste sur ce genre de sujets (#webutopian), il me semble que votre raisonnement va bien trop vite. On compare souvent les sondeurs à des charlatans, des marabouts, voire a des tueurs de démocratie--ce qui est évidemment grossier. Mais comparer Google et Facebook a des sondeurs, cela me parait presque aussi inexact. Il y a au moins deux raisons à cela.

    Tout d'abord, le problème de la représentativité. Je ne veux pas faire le rabat-joie, mais avec 1/3 de la population mondiale dans des conditions socio-économiques extrêmement dégradées--cela ne veux pas toujours dire aucun accès aux moyens de télécommunications, notamment aux téléphones portables, mais bon, cela limite quand meme assez sévèrement les possibilités)--Facebook, dont je rappelle qu'il n'a "que" 750 millions d'utilisateurs (soit environ 10% de la population mondiale) et Google ne sont pas les vraies priorités. Cela veut dire que la barrière matérielle pour atteindre ces personnes est extrêmement haute, et donc que la représentativité du "sondage" a de très fortes chances d'être exécrable. Les "600 nouvelles vidéos par minute sur Youtube, 100.000 tweets, 13.000 ventes d'applications I-Phone" viennent en priorité de Californie, New York, Londres Paris, ne nous voilons pas la face. Bien sûr, Facebook progrès dans les pays en voie de développement et stagne aux Etats-Unis, mais on est encore loin d'une utilisation homogène sur la planète--très, très, très, très loin.

    Pour les sondeurs, ce problème n'existe pas--ou plutôt si, mais il est assez facilement résolu. C'est la raison pour laquelle ils utilisent non seulement le téléphone pour recueillir les opinions, mais aussi les mobiles, les entretiens en face-à-face, les panels Internet… Un institut qui se permet de ne pas inclure dans ses échantillons 1/3 de la population française (ou de la population étudiée, quelle qu'elle soit) s'expose à des critiques pour un fois méritée. ; les résultats n'auraient aucun sens!

    [Sur l'accès aux nouvelles technologies, bien sûr, des progrès sont faits. Je participe par exemple à un programme qui me permet de devenir le "correspondant" d'un(e) petit(e) namibien(ne) ; je vais recevoir le premier e-mail qu'il/elle aura jamais envoyé dans quelques jours!]

    J'ai utilisé plus haut le mot "homogène"--il est au coeur de mon deuxième point. En effet, les individus et les vies qu'ils mènent sont formidablement plus différentes à l'échelle mondiale qu'à l'échelle nationale. Bien sûr, toutes les destinées ne sont pas semblables en France, heureusement. Mais sur la planète, ces différences sont tellement plus prononcées qu'elle menacent le concept même de "sondage". Comment utiliser des concept communs, des référents similaires, et arriver à des résultats significatifs. La communauté nationale est une communauté justement, et dans un monde si hétérogène, la question de l'homogénéité des points de vue et des identités se pose certainement (Dominique Reynié a par exemple travaillé sur l'opinion publique internationale).

    Pour résumer, dans "Concrètement, Google et Facebook prennent donc chaque minute une photographie instantanée de l'opinion égale à 7 sondages", je ne suis pas d'accord avec l'esprit de cette égalité, et encore moins avec le "concrètement" ; il n'y a vraiment, mais alors vraiment rien de concret pour l'instant à mon avis. Dégager quelques tendances grâce à l'Internet, pourquoi pas, mais l'utilisation du mot "sondages" ne me paraît pas justifié.


    @boris_tweets

    RépondreSupprimer
  2. Un statut facebook ne constitue pas une data au même titre qu'une réponse à une question de sondage.

    Compter les mots ne suffit pas. Les analyses sémantiques efficaces ne sont pas encore complètement automatisées (ex. le twittoscope de semiocast).

    RépondreSupprimer
  3. @Emmanuel, @Boris_tweets

    Certes, j'ai voulu faire une image. Mais je pense que vous sous-estimez la puissance du data-mining.

    Au fond, chaque statut répond à une question, et même à plusieurs. Une réponse partielle à une petite question, certes. Mais il y en a un milliard par jour. 1 milliard d'indices qui permettent à de petits sherlock Holmes de faire une infinité de déductions.

    C'est comme le travail d'Eric Fischer :(http://www.flickr.com/photos/walkingsf/sets/72157624209158632/). La somme des photos mises en ligne sur FlickR, ca permet de voir ce que les touristes et les locaux photographient dans les capitales mondiales. Le jour, la nuit, l'été, l'hiver, les Américaines, les Japonais, etc.

    RépondreSupprimer