Big Data, big dégâts

178
vus
big data
© Andrew Armstrong

Précieux Big Data

Une enquête du New York Times et de The Observer a révé­lé com­ment Cambridge Analytica, spé­cia­liste du big data, a pu influen­cer les votes de mil­lions d’électeurs grâce à l’utilisation de leurs don­nées Facebook. 

Le scoop est dévoi­lé par Christopher Wylie, lan­ceur d’alerte et ancien employé de Cambridge Analytica. “Nous nous sommes ser­vis de Facebook pour récu­pé­rer les pro­fils de mil­lions de per­sonnes. Nous avons ain­si construit des modèles pour exploi­ter ces connais­sances, et cibler leurs démons inté­rieurs” a‑t-il révé­lé same­di 17 mars au New York Times et The Observer, édi­tion domi­ni­cale de The Guardian.

Lors de la cam­pagne élec­to­rale amé­ri­caine de 2016, Cambridge Analytica a uti­li­sé les don­nées de nom­breux uti­li­sa­teurs Facebook afin de déga­ger des pro­fils, d’anticiper leur vote et même de l’influencer. Ces infor­ma­tions ont été récol­tées grâce à une appli­ca­tion “thi­si­syour­di­gi­tal­life”, déve­lop­pée par Aleksandr Kogan, psy­cho­logue à l’Université de Cambridge, qui pro­po­sait de payer les uti­li­sa­teurs pour répondre à des tests de per­son­na­li­tés. 270 000 per­sonnes ont télé­char­gé cette appli­ca­tion, mais ont éga­le­ment don­né à Cambridge Analytica, sans le savoir, l’accès aux don­nées de tous leurs amis Facebook. Au final, 50 mil­lions d’utilisateurs ont pu être atteints en l’espace de quelques mois. Facebook explique que Kogan a récol­té léga­le­ment ces don­nées mais a “vio­lé les règles de la pla­te­forme” en les trans­met­tant à Cambridge Analytica et à Christopher Wylie sans le consen­te­ment des utilisateurs. 

La tech­nique du Big Data dans les élec­tions n’est pas nou­veau. En 2012, l’équipe de Barack Obama avait uti­li­sé les don­nées d’utilisateurs, récu­pé­rées grâce aux registres élec­to­raux publics, aux affi­lia­tions au par­ti démo­crate ou répu­bli­cain, aux pro­fils des sup­por­ters sur MyBarackObama et ObamaForAmerica et, grâce à Facebook Connect (uti­li­sé pour se connec­ter sans créer un pro­fil), les infor­ma­tions que Mark Zuckerberg accepte de par­ta­ger avec des par­tis tiers. Cette masse de don­nées était ensuite étu­diée par des spé­cia­listes qui pou­vaient anti­ci­per le vote des élec­teurs mais aus­si l’influencer.

big data

Mais le Big Data c’est quoi en fait ? On pour­rait tra­duire ce terme par la masse de don­nées qui tran­site tous les jours sur le web. Il s’agit de pho­tos, vidéos, like, sta­tuts  qui aug­mentent de manière gigan­tesque. Comme une empreinte numé­rique, les don­nées sont sto­ckées sans pou­voir être ana­ly­sées. Pour pou­voir les trai­ter, il faut créer des algo­rithmes ultra com­plexes per­met­tant de déga­ger des ten­dances et des conclu­sions. Le Machine Learning est donc la tech­no­lo­gie qui per­met d’exploiter plei­ne­ment le poten­tiel du Big Data. Cette science moderne décèle des “pat­terns” et effec­tue des pré­dic­tions à par­tir de données. 

On estime qu’en 2020, le volume des don­nées attein­dra 40 zet­ta­oc­tets, ce qui équi­vaut à prendre tous les grains de sable de la pla­nète et de les mul­ti­plier par 75. Avec le déve­lop­pe­ment des objets connec­tés et le flou sur l’utilisation de nos don­nées, le Big Data pour­rait bien deve­nir roi. 

big data
© Manon Ricou