jeudi, juillet 14, 2011

Le graphe secret de Google +


Le web social a transformé notre monde, et Google + (avec 10 millions d’utilisateurs en deux semaines) est bien destiné à en devenir l’un des géants. Or, avec Google +, le web social vient de changer de trajectoire.

Tous les réseaux sociaux s'approprient les informations qu’on y partage et les relations qu’on y établit. Cette capacité à nous « profiler » était intégrée. On essayait de la contrôler tant bien que mal en choisissant les informations qu’on publiait ou non.

Cette paix armée vient d’être rompue.

Elle est rompue par  la puissance de monitoring d’un réseau social qui connaît aussi mes activités « non sociales » comme par exemple mes recherches en ligne, mes amis blogueurs, les lecteurs de mon blog, les destinataires de mes mails, et qui maintenant connaît la structure profonde de mon réseau social et la nature des échanges qui s’y produisent.

Mais surtout, elle est rompue par la production par les autres d’un savoir constitué à mon insu, et sa maîtrise par Google. Un savoir dont je ne sais rien.

Je parle, naturellement, des cercles.


Pour ceux qui n’auraient pas franchi le pas, je précise que Google + nous propose de ranger nos amis dans des petits groupes (les « cercles ») que l’on crée à la volée et que l’in intitule comme l’on veut. C’est ainsi qu’à côté des cercles « famille », « amis » ou « camarades de classe » on peut créer « MFG », « Cap Digital » et autant d’autres cercles que requis. Un même contact peut être assigné à plusieurs cercles. Une publication peut être ouverte à tous les publivs, ou affectée à un ou plusieurs cercles auxquels elle reste cantonnée.

Cette amélioration de la gestion des relations sociale introduit une asymétrie structurelle de l’information dont je pense que les conséquences seront lourdes.

Pour faire court, il faut rappeler que le rangement d’un graphe en fonction des « liens » entre les noeuds, la « clusterisation », est une clé de lecture très importante pour l’analyse d’un système en interaction.



Soit une population d’acteurs représentés par des petits points de couleur figurant certaines propriétés des individus (l’âge par exemple).


Une approche classique (celle des sociologues ou des sondeurs) peut consister à rapprocher les individus en fonction de ces propriétés pour voir émerger des sous-ensembles homogènes dont on va étudier la dynamique. C’est ce que j’ai représenté sur la figure 2, profitant de ce que mon train était arrêté en pleine voie et que j’avais donc du temps à perdre.

La connaissance des relations réelles entre les individus peut changer l’image que l’on se fait de la population. Nous l’avons fait 100 fois chez MFG, et l’on découvre ainsi des correspondances insoupçonnées. Dans bien des cas, on découvre des caractères plus importants que les déterminations sociales. On découvre par exemple des groupes de femmes enceintes, des pêcheurs à la carpe, etc.




La puissance de prévision, d’analyse de l’opinion ou de communication virale de cette clusterisation est extrême.



La connaissance et l'étude du graphe des relations donne, au détenteur du graphe, ne connaissance incroyable des dynamiques sociales : affinités, distribution des propriétés, propagation des opinions.

Dans un graphe normal, type Facebook ou Twitter, chaque "noeud" du graphe connaît l'organisation de son "noeud". Ce sont les liens qu'il a établi ou accepté.

Dans Google +, avec la généralisation des cercles, le "noeud" (c'est-à-dire vous ou moi) ne connaît pas la structure dans laquelle il se trouve. Google +, vu par Google, c'est le graphe constitué par 10 millions d'utilisateurs (aujourd'hui) qui ont tous rangé les autres utilisateurs dans une infinité de cercles. C'est le graphe de l'humanité après que chacun ait rangé les autres à leur insu.

Google sait comment chaque noeud du graphe est rangé par les autres noeuds. Il le sait de manière mathématique. La centaine d’amis que j’ai en ce 14 juillet m’a peut-être rangé dans les cercles hacktiviste, dans « Cap Digital » ou « entrepreneur », ou même « blogueur bavard ». Ca n’a aucune importance. L’important c’est que j’ai un certain nombre de co-occurences avec d’autres utilisateurs et que Google seul les connaît.

Google +, c’est une machine à produire une information dont ne dispose que Google.


On me dit que Facebook ou Twitter proposaient déjà la possibilité de faire des gropes. C'est exact. Mais jamais la constitution des groupes n'avait été à ce point au centre du design de l'interface. Et jamais la promesse de les garder secrets n'avait été aussi forte.

Je suis frappé d’ailleurs de la similarité avec l’invention du Googleranking, qui a fondé le succès du moteur de recherche de Google.
A une époque où Yahoo ! classait les sites à la main, en payant des étudiants, et où les Français, ou les Suédois de Northenlight cherchaient des méthodes de classement automatique fondées sur des technologies de traitement automatique du langage, Google a eu le trait de génie de recueillir une trave de l’activité d’indexation par les utilisateurs (les liens hypertextes) pour un appliquer un traitement mathématisé, fondé sur les chaînes de Markoff. L’histoire recommence, avec la même efficacité. Mais ce ne sont pas nos productions qui sont rangées désormais. Ce sont nos vies.

23 commentaires:

  1. Vous avez déjà été plus clair.

    RépondreSupprimer
  2. En outre, si j'ai bien compris vos arguments, je ne pense pas que vous ayez raison - et vous le dîtes dès le début: il n'y a qu'une différence de degré pas de nature entre Google et par exemple Facebook.

    Le fait que Google soit le seul à connaître les connexions n'améliore en rien sa capacité de prédiction statistique par rapport à ce que Facebook connaît sur ses propres utilisateurs. Alors que l’algorithme de ranking améliorait de façon immédiate la qualité de la recherche.

    Circles est avant tout une astuce pour recruter plus d'utilisateurs et tirer avantage de leur volonté de garder une vie privée. Au final, il s'agit d'un "truc" additionnant marketing / interface utilisateur / etc... pour remplacer un service existant vieillissant - tenter de refaire le coup de gmail face à Outlook.

    Quant à l'utilisation, sous toutes ses formes, d'un contenu constitué par d'autres, c'est depuis l'origine le cœur même du métier de google, le seul lien entre ses différentes activités, sa grande force et surtout sa grande faiblesse - les dirigeants de Google sont conscients de cette fragilité et mènent une lutte frénétique et constante pour générer une plus-value à partir de contenu non produit par Google (sites / livres / mails et maintenant Circles). Voir aussi http://thierry-klein.speechi.net/2010/01/22/internet-ou-la-pauperisation-croissante-des-travailleurs-intellectuels/

    RépondreSupprimer
  3. @Thierry

    Vous avez raison. Je suis un peu partagé. Et je modifie d'ailleurs légèrement.

    RépondreSupprimer
  4. Tout d'abord personne n'est obligé de faire les rangements que vous signalez.

    Ensuite tout le monde peut faire des rangements erronés et falsifiés.

    Ensuite personne n'est obligé d'utilisez Google+, mais peut avantageusement utilisez Diaspora.

    Et enfin les personnes qui pensent pouvoir analyser l'information sociale du net en supposant que les autres n'ont pas la même capacité, non seulement sous-estiment leurs semblables, mais on de plus près de 10 ans de retard sur la machine...

    Qui a attendu Google+ pour réaliser des analyses de groupes et des analyses sociales ? Qui a attendu Google+ pour comprendre qu'il vaut mieux développer un outil social P2P tel que diaspora ?

    Tout ceci nous semble bien un peur A POSTERIORI de ce qui existe depuis BIEN L0NGTEMPS déjà !

    RépondreSupprimer
  5. Henri, d'une certaine façon vous êtes d'accord avec le titre de mon article que vous pouvez lire sur mon ressenti de Google+ http://blog.networkvb.com/2011/07/google-un-ecosysteme-ferme-en-devenir.html

    RépondreSupprimer
  6. Ce que vous dites est faux :

    1/ Facebook à travers son innocent petit bouton like en savait déjà énormément sur vous, Facebook savait simplement tous les contenus (que vous consultiez)

    2/ N'importe quel réseaux social pouvait facilement reconstituer vos communautés d'intérêts, ceci est bien plus pointue à expliquer publiquement mais un petit essai avec votre compte LinkedIn vous bluffera certainement : http://inmaps.linkedinlabs.com/

    RépondreSupprimer
  7. @AsTeR : essayez de me lire calmement. Je dis qu'on faisait des graphes à tour de bras, autour des liens ou des like, mais que c'étaient des graphes constitués à partir d'informations que vous contrôliez. Pas à partir d'informations produites par d'autres sur vous et que vous ne connaissez pas...

    RépondreSupprimer
  8. @Henri: les informations en entrée de l'analyse de reseaux, c'est vos connexions et celle de vos amis. Par ailleurs, vous surfez sur le net, vous avez un cookie Facebook, Mark connait tout votre parcours sur Internet sous réserve que les sites intègrent un seul élément des libraries Facebook.

    Désolé pour le caractère un peu enflammé de mon premier commentaire, mais les apparences sont trompeuses et Google n'accumule pas beaucoup plus d'infos sur vous qu'un Facebook.

    RépondreSupprimer
  9. La grosse différence entre Google et Facebook me semble être la disparition de l'approbation mutuelle : n'importe qui peut vous ajouter dans un de ces cercles, et vous n'y pouvez rien faire.

    Grâce à celà, Google récupère quelque information supplémentaire sur vous, donnée par quelqu'un qui n'a pas nécessairement votre approbation.

    Pour le reste, pas de différence fonctionnelle majeure; il sera difficile de persuader les gens à migrer.

    RépondreSupprimer
  10. Je pense que G+ (n'oublions pas qu'elle est toujours en beta) se doit d'être modifiée en fonction des réactions des inscrits...

    Je pense que ce concept de cercles n'est pas mal fait, il est possible de bloquer des utilisateurs qui vous auraient ajoutés alors que vous ne les connaissez pas... mais ce qu'il faudrait entre autre c'est une demande d'autorisation avant l'ajout (comme les liens de parenté sur FB par exemple )

    Ce que je considère chez google c'est qu'ils s'efforcent de proposer tous les services que d'autres sites, tous indépendants proposent séparément, ce qui engendre des problèmes pratiques... comme le nombre multiple de boites mails, d'albums photos etc...

    Avec Google, le but est depuis une page d’accueil, pouvoir disposer d'une vrai boite mail, d'un album photo privé et online, de partage de documents etc etc etc ...

    Il est clair que G+ n'est pas encore au top, l'interface est fort basique, les possibilités sont moindres que sur FB et c'est normal... Ce que j'espère c'est que ce réseau social sera un peu plus "adulte" que FB ou l'on est en permanence invité à des applications et des tests plus stupides les uns que les autres ...

    connaissant la capacité de google à évoluer de façon rapide, je ne peux avoir qu'un avis objectif sur le lancement de ce réseau , j'croise les doigts pour ma part :-)

    RépondreSupprimer
  11. une bonne réflexion mais tous les outils de Google permettent depuis un certain temps une analyse de notre vie, il faut juste être dans une démarche totale vis à vis de ses groupes en étant dans une découverte maximum qui rend plus difficile toutes les classifications ! et régulièrement faire des rappels éthiques sur les données

    RépondreSupprimer
  12. Si tout ce chmilblik mathématique sert à mieux me servir en tant qu'utilisateur de réseaux sociaux, moi, ça me va. On est des pions sur cette planète c'est pas nouveaux, et j'ai confiance en google.

    Je vois la dedans un échange de bons procédés.

    Grâce à nous : un modèle social plus précis.
    Grâce à eux un outil plus performant à notre disposition.

    Ca ne changera pas radicalement ma vie le fait que google sait que j'ai créé des cercles pour certaines personnes :).

    C'est bien d'analyser, et ce que vous dite est sûrement vrai en grande partie, mais faut pas non plus dramatiser ou présenter ça comme une cyber-catastrophe ou le début d'une nouvelle ère, ou encore une fin de la vie privée... bref vous m'avez compris !

    Pour moi le fait que les informations de plusieurs systèmes différents soient centralisées par un seul système père (google+) c'est un futur outil formidable de partage et d'accès à l'information.

    David

    RépondreSupprimer
  13. Amusant... Mais j'ai l'impression que cette analyse, comme d'autres du phénomène Google+ passe à côté d'une donnée (et c'est un avis très personnel) essentielle de l'outil : il n'est pas destiné au grand public mais au seul domaine où Google n'a pas encore réussi à percer massivement : l'entreprise.

    A bien y regarder et avec l'intégration prochaine d'autres outils Google : Gmail, Google Docs, Knol etc... G+ ressemble à s'y méprendre à un ERP global de 1ère classe...

    Ca n'empêchera pas que pour la partie Grand Public Google utilise à son bénéfice exclusif l'ensemble des informations échangées pour encore optimiser le positionnement de ses publicités...

    (le moteur de recherche Northernlight est vraiment suédois ? Bizarre...)

    RépondreSupprimer
  14. Mais ils ont déjà beaucoup plus d'infos sur leurs usagers via les statistiques de gmail... qui écrit à qui, quand, combien de fois, avec quel taux de réponse, sur quels sujets, etc.

    Et en plus, ils n'ont besoin de le demander à personne ça... du coup le fait de rajouter les gens dans des cercles me paraît beaucoup plus gadget qu'autre chose. Je ne vois pas pourquoi ils laisseraient tomber des données beaucoup plus riches et automatiques pour utiliser des cercles plus aléatoires et dépendant terriblement de la bonne volonté des gens.

    RépondreSupprimer
  15. @boronali Le moteur qui utilise ce nom est aujourd'hui enregistré à Cambridge. Dans mon souvenir, c'était nordique. On parle des années 90, hein...
    Sinon, l'idée de l'ERP est intéressante, c'est sûr.

    RépondreSupprimer
  16. Cela fait longtemps que Google connaît votre Graphe social. L'enjeu de Google c'est d'être sur le passage de tous vos moyens de communications. Et l'enjeu est bien là. C'est une hydre.

    J'avais déjà écrit sur le sujet en 2005.
    http://la-grange.net/2005/09/29

    Et là où c'est encore plus pernicieux, c'est qu'il n'y a même pas besoin d'avoir de compte Google. Tous les mails que nous envoyons sur des listes, sur des adresses dont les destinataires sont sur gmail se retrouvent indexés par Google. DoubleClick == Google, Analytics == Google, etc. Donc nos clicks, notre adresse IP, nos comportements. Tous les navigateurs proposent une boite de recherche. Cette boite de recherche envoie non seulement la requête de recherche pour effectuer le service mais également les hésitations intermédiaires dans le cas de Instant Search. Il faut penser à Google comme d'une troisième personne toujours là dans la pièce enregistrant tout ce que nous faisons. Nous révélons à Google des choses que nous ne dirions pas à nos plus proches.

    L'enjeu… n'est pas la surveillance totale, quoique qu'une entreprise soumise aux search warrants des États-Unis est également un concept intéressant.

    Non l'enjeu est la robotisation progressive de nos comportements, déplacements, achats, etc.
    http://www.la-grange.net/2011/05/17/robots

    RépondreSupprimer
  17. @Henri c'est un ami qui l'a repris (NLsearch) et l'exploite depuis mais je ne savais pas qu'il l'avait racheté à des nordiques, je pensais qu'il avait racheté le truc à des étudiants du MIT... 91 ou 92 effectivement !

    RépondreSupprimer
  18. @Henri
    "Cette amélioration de la gestion des relations sociale introduit une asymétrie structurelle de l’information dont je pense que les conséquences seront lourdes."

    Tu mets en évidence un point crucial.

    Aucun jeu ne peut fonctionner lorsque l'un des joueurs a accès à la quasi-totalité des cartes alors que son adversaire ne connaît que sa donne.

    À rapprocher de ce que dit Mike Shatzkin à propos du 'dynamic pricing' : http://www.idealog.com/blog/dynamic-pricing-what-it-is-and-what-it-isnt
    Peut-il y avoir une 'place de marché' équitable, quand le vendeur a accès à volonté à l'information accumulée sur l'acquéreur et que le secret interdit à celui-ci le même niveau d'information ?

    En d'autres lieux, des régulateurs (pas de place de marché sans autorité de régulation ?) ont fixé des limites et parleraient de délit d'initié.

    RépondreSupprimer
  19. Google+ place les cercles au centre, et c'est effectivement une idée de génie.

    Elle permet de concevoir l'identité numérique elle-même comme un cercle : « je » suis l'intersection des cercles auxquels j'appartiens... sans le savoir.

    Si "Dieu est un cercle dont le centre est partout et la circonférence nulle part" (Hermès Trismégite), l'internaute de Google+ est un cercle dont le centre est nulle part et la circonférence partout.

    RépondreSupprimer
  20. Pour moi ces infrastructures non pas d'avenir.
    Toutes les informations sont centralisées par des gros qui n'ont aucun respect des droits de l'individu.

    Le réseau social ne doit pas être centralisé. Votre information doit être chez vous et nul par ailleurs.

    Aujourd'hui cela est possible via des réseaux sociaux de type : retroshare.
    Exemple de fonctionnalités :
    1. Toutes vos informations reste chez vous.
    2. Toutes les informations transmises entre vos cercles (même terminologie) sont cryptées en PGP.
    3. Les invitations s'effectue par des échanges de clé PGP.

    Bien sur cela n'est pas aussi simple que Facebook ou Google+.
    Mais si vous voulez maîtriser vos données et votre vie privée, cela nécessite des efforts.

    Plus de renseignement ici : http://retroshare.sourceforge.net/index_fr.html

    RépondreSupprimer
  21. @Stéphane Laborde, @jeanjot.
    Je suis tout à fait d'accord avec vous.
    Le fond de ma pensée est que les grands du service (Axa, Casino, Carrefour, etc.), menacés inéluctablement par les nouveaux Barbares (http://www.henriverdier.com/2011/05/la-resistible-ascension-des-nouveaux.html) devraient se dépêcher de soutenir l'émergence d'une plate-forme sociale ouverte et distribuée pour bloquer ces gens là.

    RépondreSupprimer
  22. question un peu idiote: du point de vue des utilisateurs y'a t'il une différence fondamentale entre créer des groupes dans un address book avec ses contacts emails et créer des cercles de contacts dans G+? #googleplus dans les deux cas mes contacts ne savent pas dans quels groupes ou cercles je les ai placé, il me semble? si je rajoute google dans l'équation, est ce que google connait les groupes de contacts que je crée pour classer les personnes présentes dans mon adresse book gmail?

    RépondreSupprimer
  23. Ravie de vous avoir lu, grâce aux conseils d'un de mes étudiants d'HETIC, stagiaire chez vous ;-)
    Je cherchais plus d'infos sur Google + : avantages/inconvénients par rapport aux réseaux dont je fais déjà partie (Viadeo, LinkedIn, Twitter activement et ceux que j'ai laissé tomber Facebook, GoogleBuzz, ...). Votre article (bon à part qq fautes qui gênent ma lecture, défaut "professionnel") et ses commentaires sont passionnés et passionnant. La question qui me taraude est : où n'est on plus "profiler" pour la e-pub si ce n'est ... hors du web ? En tant que consultante et formatrice en E-marketing, je me dois (et c'est aussi mon ADN) d'échanger, de communiquer et donc d'être "visible" ... au risque effectivement d'être classée, rangée, mais est-ce si différent de ce qui s'est toujours fait dans la vie sociale hors du web ? L'impact est plus rapide, plus fort, plus durable ... et nous plus avertis, plus mâtures, plus prompts à oublier sous le flot d'informations aussi.
    Je m'aperçois, d'année en année, moi aussi je suis une "dinosaure" du web des années 90', que finalement je peux (vu mon sexe, mon âge et mon parcours atypique) "tromper" les statistiques et les cases et je m'en amuse aussi souvent que je le peux ... on peut aussi jouer à brouiller les pistes ? ou croire qu'on le peut ? pour garder l'espoir de maîtriser encore un peu notre vie numérique ;-)

    RépondreSupprimer