Précieux Big Data
Une enquête du New York Times et de The Observer a révélé comment Cambridge Analytica, spécialiste du big data, a pu influencer les votes de millions d’électeurs grâce à l’utilisation de leurs données Facebook.
Le scoop est dévoilé par Christopher Wylie, lanceur d’alerte et ancien employé de Cambridge Analytica. “Nous nous sommes servis de Facebook pour récupérer les profils de millions de personnes. Nous avons ainsi construit des modèles pour exploiter ces connaissances, et cibler leurs démons intérieurs” a‑t-il révélé samedi 17 mars au New York Times et The Observer, édition dominicale de The Guardian.
Lors de la campagne électorale américaine de 2016, Cambridge Analytica a utilisé les données de nombreux utilisateurs Facebook afin de dégager des profils, d’anticiper leur vote et même de l’influencer. Ces informations ont été récoltées grâce à une application “thisisyourdigitallife”, développée par Aleksandr Kogan, psychologue à l’Université de Cambridge, qui proposait de payer les utilisateurs pour répondre à des tests de personnalités. 270 000 personnes ont téléchargé cette application, mais ont également donné à Cambridge Analytica, sans le savoir, l’accès aux données de tous leurs amis Facebook. Au final, 50 millions d’utilisateurs ont pu être atteints en l’espace de quelques mois. Facebook explique que Kogan a récolté légalement ces données mais a “violé les règles de la plateforme” en les transmettant à Cambridge Analytica et à Christopher Wylie sans le consentement des utilisateurs.
La technique du Big Data dans les élections n’est pas nouveau. En 2012, l’équipe de Barack Obama avait utilisé les données d’utilisateurs, récupérées grâce aux registres électoraux publics, aux affiliations au parti démocrate ou républicain, aux profils des supporters sur MyBarackObama et ObamaForAmerica et, grâce à Facebook Connect (utilisé pour se connecter sans créer un profil), les informations que Mark Zuckerberg accepte de partager avec des partis tiers. Cette masse de données était ensuite étudiée par des spécialistes qui pouvaient anticiper le vote des électeurs mais aussi l’influencer.
Mais le Big Data c’est quoi en fait ? On pourrait traduire ce terme par la masse de données qui transite tous les jours sur le web. Il s’agit de photos, vidéos, like, statuts qui augmentent de manière gigantesque. Comme une empreinte numérique, les données sont stockées sans pouvoir être analysées. Pour pouvoir les traiter, il faut créer des algorithmes ultra complexes permettant de dégager des tendances et des conclusions. Le Machine Learning est donc la technologie qui permet d’exploiter pleinement le potentiel du Big Data. Cette science moderne décèle des “patterns” et effectue des prédictions à partir de données.
On estime qu’en 2020, le volume des données atteindra 40 zettaoctets, ce qui équivaut à prendre tous les grains de sable de la planète et de les multiplier par 75. Avec le développement des objets connectés et le flou sur l’utilisation de nos données, le Big Data pourrait bien devenir roi.
La culture, un Paris d’enfants