Ogni giorno, nelle nostre azioni quotidiane, inconsapevolmente, produciamo un'immensa quantità di dati. Al nostro risveglio il nostro smartwatch registra i nostri dati biologici, in metropolitana gli obliteratori tracciano il nostro passaggio, navigando sul web lasciamo le nostre preferenze, ritiriamo del contante al bancomat che registra l'operazione, svolgendo un'attività sportiva registriamo le nostre prestazioni, facendo la spesa utilizziamo una carta fedeltà e registriamo le nostre preferenze. Molte altre ope- razioni ancora lasciano quotidianamente una traccia indelebile delle nostre attività. Ogni giorno, del resto, per prendere le nostre decisioni, facciamo di continuo ricorso a un insieme di dati registrati da altri. Nella scelta di un viaggio confrontiamo i prezzi di diversi operatori turistici, per un investimento leggiamo gli andamenti in borsa di diversi prodotti finanziari, per decidere dove trascorrere una serata a cena leggiamo i punteggi di vari ristoranti.

Per secoli l'umanità ha cercato di prendere le proprie decisioni sulla base delle informazioni disponibili, tuttavia, mai prima d'ora esse ci sono giunte con tale ritmo, varietà e volume. Tutto questo enorme flusso di dati si sostanzia in un insieme di numeri, testi, immagini, suoni, e altro, il quale ha il potenziale di modificare radicalmente il modo nel quale prendiamo le nostre decisioni come singoli individui, come imprese, come amministrazioni pubbliche e come società in tutti i campi dell'agire umano. Ci riferiamo a tale fenomeno con il termine Big Data.

Per renderci conto della fenomenale espansione dei dati che stiamo osservando, Varian e Lyman, due economisti di Berkeley, hanno quantificato la produzione totale di dati a livello mondiale stimando che essa nel 2000 ammontava a circa 1,5 miliardi di gigabyte, ovvero circa 37.000 volte la Libreria del Congresso degli Stati Uniti. L'evoluzione del volume dei dati in circolazione è stata esponenziale: nel 1986 i dati erano 281 petabytes (281 milioni di gigabyte), nel 1993 erano saliti a 471 petabytes, nel 2012 raggiungevano 650.000 petabytes!

A quantificare l'esplosione nella produzione di dati dell'ultimo decennio, un dato sconvolgente emerge dal calcolo effettuato dall'allora amministratore delegato di Google, Eric Schmidt, nel 2010, il quale afferma: «Dall'alba della civiltà fino al 2003 l'umanità ha generato 5 exabytes (5 miliardi di gigabytes) di dati mentre ora produciamo 5 exabytes ogni 2 giorni con un ritmo accelerato che raddoppia ogni 40 mesi». La previsione di Schmidt si è, in effetti, rivelata errata per difetto. Nel 2013 avevamo già prodotto ben 4.400 exabytes, mentre seguendo i calcoli di Schmidt avrebbero dovuto essere solo 3.000.

Tutta questa mole di dati porta con sé enormi potenzialità e vantaggi che stiamo già sperimentando. Tuttavia, l'esplosione dei Big Data solleva anche importanti questioni etiche e giuridiche legate all'uso che può esserne fatto. Immaginiamo, infatti, che esista qualcuno in grado di raccogliere tutti questi dati in uno schema unico, incrociando fonti diverse e mettendo così insieme, utilizzando sofisticati metodi statistici, i pezzi dell'enorme puzzle costituito dalle nostre attività. Moltiplichiamo tali informazioni per gli oltre 7 miliardi di utenti di internet nel mondo e ne ricaveremo la possibilità di costruire un profilo accuratissimo di ciascun individuo e il potere di interferire pesantemente nelle sue scelte. Questo è quanto già accade nel campo della pubblicità digitale dove le nostre preferenze vengono registrate ed elaborate con sofisticati procedimenti statistici e utilizzate per dirigere le scelte di acquisto. È il metodo impiegato, ad esempio, dal servizio offerto da Amazon per suggerirci libri che possono piacerci, o da Facebook e Linkedin, per indicarci persone che potremmo conoscere, o dai servizi turistici di Booking, Expedia o Tripadvisor relativi a viaggi che potrebbero essere di nostro interesse. In effetti tali servizi sono molto utili a orientare le nostre scelte, tuttavia, se una tale metodologia venisse utilizzata per influire sulla vita democratica, essa costituirebbe un serissimo pericolo. Invero, chi raccoglie e gestisce tutta la ricchezza dei Big Data detiene oggi un nuovo ed enorme potere che va ad affiancarsi a quelli tradizionalmente alla base di uno Stato di diritto.

La teoria della separazione dei poteri, esposta da Montesquieu nel suo saggio Lo spirito delle leggi del 1748, consiste nell'individuazione di tre funzioni distinte nell'ambito dello Stato e nell'attribuzione a esse di tre distinti poteri: il potere legislativo, che si occupa di creare le leggi, il potere esecutivo, che si occupa di applicarle, e quello giudiziario, che si occupa di farle rispettare. Secondo tale principio i tre poteri devono essere assolutamente indipendenti al fine di garantire la democrazia.

A tale tripartizione tradizionale dei poteri si sono aggiunti successivamente nel linguaggio comune altri due poteri emersi negli anni. L'espressione quarto potere (resa popolare in Italia dal celebre film di Orson Welles), fu coniata dal deputato inglese Edmund nel 1787 per riferirsi alla stampa come strumento di vita democratica. Il quinto potere, invece, è una locuzione derivata dal nome di un giornale underground della controcultura americana degli anni Sessanta (anch'essa resa popolare in Italia da un film: quello di Sidney Lumet) e si riferisce ai mezzi di comunicazione radiotelevisiva (e per estensione successiva a internet) come strumenti di possibile manipolazione della pubblica opinione. Abbiamo avuto in passato, e abbiamo di continuo ancora, esempi dei pericoli nei quali si incorre quando stampa e radiotelevisione non siano sufficientemente indipendenti dal potere politico favorendo regimi totalitari.

I Big Data rappresentano oggi il sesto potere, un'espressione usata per la prima volta da Bauman e Lyon nel 2014 sia pure con un'accezione leggermente diversa da quella usata da noi. Il sesto potere esercita un'importante funzione di riequilibrio democratico, ma anche per esso deve valere il requisito di indipendenza dagli altri poteri pena l'indebolimento se non l'annichilimento della democrazia. Il sesto potere è maggiormente occulto rispetto agli altri, persino più subdolo e pervasivo del grande potere persuasivo della stampa, della televisione e di internet. Possiamo infatti immaginare di sottrarci al potere persuasivo della stampa e della televisione, ma mai pensare di sottrarci a quello dei Big Data.

Alcuni recenti esempi di cronaca ci hanno mostrato in maniera evidente i rischi a esso connessi. In tal senso è paradigmatico il caso di Cambridge Analytica. Nella primavera del 2018, le testate Guardian e New York Times hanno pubblicato una serie di articoli i quali sostenevano che l'azienda statunitense di marketing online Cambridge Analytica avrebbe utilizzato un'enorme quantità di dati per condizionare la campagna presidenziale statunitense del 2016 e il referendum sull'uscita del Regno Unito dall'Unione Europea (Brexit). Cambridge Analytica è una società specializzata nel raccogliere dai social network dati relativi agli utenti al fine di crearne, attraverso procedure statistiche avanzate, un profilo psicometrico per sviluppare un sistema di microtargeting comportamentale che può essere usato per realizzare messaggi pubblicitari personalizzati facenti leva sui gusti di ciascun individuo. Il creatore di questi algoritmi, Michal Kosinski, sostiene che è possibile predire la personalità di un soggetto analizzando solo 10 dei suoi Mi piace. Ne basterebbero 70 per saperne più di quello che sanno di lui i suoi amici, 150 per conoscerlo meglio della sua famiglia e 300 per superare la conoscenza del partner. Con quantità superiori sarebbe possibile conoscere del soggetto più di quanto ne sappia egli stesso! Secondo Guardian e New York Times, le informazioni detenute da Cambridge Analytica sarebbero state in passato incrociate con quelle provenienti da un'applicazione chiamata thisisyourdigitallife alla quale si sarebbero collegate tramite Facebook circa 270mila persone per ricevere un profilo psicologico personale in cambio di alcune informazioni e della condivisione (previo consenso) di informazioni relative ai propri amici. Quando tale pratica fu bloccata da Facebook perché troppo invasiva della privacy, l'applicazione aveva già raccolto dati relativi a 50 milioni di utenti. La condivisione di tali dati con Cambridge Analytica, qualora fosse provata, sarebbe in violazione con i termini d'uso di Facebook.

A seguito dell'indagine di Guardian e New York Times, il procuratore speciale che indagava sulle presunte interferenze nelle elezioni statunitensi del 2016 ha chiesto che Cambridge Analytica fornisse documenti sulle proprie attività per fugare il sospetto che essa abbia utilizzato i dati per fare propaganda elettorale a favore di uno dei candidati. Nello stesso periodo il Guardian aveva dedicato una lunga inchiesta al ruolo dell'azienda nella campagna referendaria per il Brexit, sostenendo che essa aveva usato dati e informazioni per fare propaganda a favore dell'uscita del Regno Unito dall'Unione Europea. A sua difesa, la società Cambridge Analytica ha affermato di non avere infranto alcuna regola raccogliendo dati solo con il consenso degli utenti e di averli usati con metodologie già utilizzate in precedenti campagne elettorali.

Chiamato a rispondere dell'accaduto davanti al Congresso degli Stati Uniti il presidente di Facebook, Mark Zuckerberg, ha ammesso che i controlli attualmente messi a disposizione sono insufficienti e che è inevitabile introdurre nuove e più stringenti regole per il loro utilizzo.

Al di là di quello che sarà l'esito delle indagini, ancora incerto al momento in cui scriviamo, le inchieste del Guardian e del New York Times hanno avuto il merito di portare al centro del dibattito nuovi elementi relativi all'uso dei Big Data, rendendo l'opinione pubblica cosciente dei rischi a essi connessi e della necessità di normative maggiormente restrittive sul loro utilizzo. Una regolamentazione più precisa è sollecitata da tempo dalle organizzazioni per la tutela della privacy online. Negli ultimi anni l'Unione Europea ha inasprito le regole, ma data la globalità del problema, è solo da un'azione coordinata di tutti i Paesi che il problema potrà essere risolto in modo soddisfacente, così da garantire un uso etico dei Big Data.