Scienze e Tecnologia

Cosa sono i Big data e perché vanno protetti

Dall’uso che facciamo delle informazioni dipende parte della ricerca scientifica e del progresso. I Big data non sono il male assoluto ma la loro portata non va neppure sottostimata e presa alla leggera

I Big data e il loro uso
I Big data e il loro uso

I Big data, letteralmente “grandi moli di dati”, sono informazioni tipicamente digitali tanto ingenti da non potere essere elaborate senza il supporto di calcolatori. Quantità di dati, per dare una misura comprensibile, ben superiore a quelli che possono essere conservati sul disco fisso di un computer per quanto capiente questo possa essere.

Nel corso del 2018 l’umanità ha prodotto tanti dati quanti ne sono stati generati nell’intera storia dell’uomo fino al 2017. Una quantità di dati che, si stima, raddoppi di anno in anno. Sono figure letterarie, è impossibile misurare con precisione quanti dati produciamo offline e soprattutto online. Ne creiamo di nuovi ogni giorno, quando andiamo a fare la spesa consegnando alla cassiera la tessera fedeltà del supermercato, quando inviamo email, quando paghiamo il pieno di benzina con il bancomat, quando partecipiamo a concorsi a premi indicando le nostre generalità… Ne produciamo sempre di più grazie ai nostri smartphone o ai dispositivi connessi (orologi smart, termostati smart, assistenti vocali, eccetera). Ne produciamo quando navighiamo in Rete, quando guardiamo video o ascoltiamo musica in streaming. Qualsisi cosa facciamo generiamo dati che possono essere usati in modo egregio e in modo pessimo, come vedremo più sotto.

Il punto di vista delle aziende

Il termine Big data è incorporeo, non restituisce l’idea né di quanto debbano essere “big” né di cosa si celi dietro la parola “data”. Le organizzazioni ne fanno incetta e li archiviano in virtù anche del costo ormai accessibile delle tecnologie che servono per immagazzinarli e per esaminarli al fine di evincere informazioni non visibili a occhi nudo, come per esempio abitudini di acquisto, attitudini comportamentali, preferenze di viaggio, principi secondo i quali scegliamo ristoranti, mete turistiche e tante altre attività.

Un conto, però, è raccogliere dati e tutt’altro paio di maniche è saperli organizzare ed elaborare. Compiti di natura diversa tra loro così come è diverso il loro grado di difficoltà. Quasi tutte le aziende sono abili nel raccoglierli, molto meno sono quelle che sanno usarli in modo completo. Al di là di un manipolo di aziende che ne sanno fare uso non sempre buono (Facebook, Amazon e Google, per citare le principali) è la scienza in generale quella che sta dando maggiori dimostrazioni del potenziale dei Big data.

I Big data e la scienza

Estrarre valore dai Big data è una cosa che la scienza riesce a fare molto bene. Tra gli esempi più importanti si può citare l’astronomia, che amplia sempre più i propri orizzonti, la medicina di precisione ma anche compiti più ambiziosi e complessi dal punto di vista delle predizioni: si stanno usando i Big data (e le Intelligenze artificiali) per prevedere le pandemie (o anticipare secondo quali modelli si espandono), per prevedere i terremoti (missione ai limiti dell’impossibile) e persino gli attentati terroristici. Legare i Big data e la capacità di esaminarli al progresso umano è ormai inevitabile.

Non sono il male ma devono rimanere anonimi

Il percorso dell’estrazione di valore di dati sottostà a una logica chiara: trasformare i dati in informazione, l’informazione in conoscenza e la conoscenza nel sapere.

Interrogare i Big data, scoprire modelli (chiamati “pattern”) comportamentali e scientifici ha una grande importanza. Durante la pandemia le grandi moli di dati hanno avuto un ruolo fondamentale anche per la ricerca sui vaccini che, vale la pena ricordarlo, sono stati creati in tempi record. I dati prelevati da chi ha contratto il virus sono stati trattati in modo anonimo ed elaborati, esaminati e studiati per scoprire come debellare il Covid-19.

Se la scienza avesse avuto a disposizione meno dati, non ci fossero stati modi rapidi e attendibili per organizzarli e studiarli, avremmo avuto vaccini meno efficienti e in tempi meno rapidi.

Per la ricerca scientifica non ha avuto nessuna importanza che i dati fossero in chiaro e parlanti, non c’è stato alcun bisogno che le informazioni fossero abbinate alle identità delle persone che le hanno generate.

L’esempio opposto, ovvero una situazione in cui i Big data mostrano il lato peggiore, la troviamo in un caso non recentissimo di cui si è resa volontariamente protagonista Facebook.

Torniamo al 2017, negli Stati Uniti d’America. La storia è lunga e particolareggiata, la riduciamo all’essenziale senza togliere nulla alla chiarezza. Una donna prende l’aereo per andare a fare visita al figlio e, all’aeroporto, le viene sequestrata la bottiglietta di profumo perché non confacente alle misure di sicurezza. Qualche giorno dopo nel feed Facebook del figlio è apparsa la pubblicità del medesimo profumo.

Sembra magia ma tutto ciò ha una spiegazione molto semplice: Facebook sa che la donna è a casa del figlio perché sul social, nel campo in cui ogni utente può inserire gradi di parentela o il nome del partner, la madre ha esplicitato chi fosse il figlio (o viceversa). La donna ha poi collegato il proprio dispositivo mobile alla rete Internet della casa del figlio, da qui Facebook ha (giustamente) dedotto che i due fossero sotto lo stesso tetto.

Incrociando le informazioni commerciali che la donna ha disseminato (per esempio con le tessere fedeltà) è risultato che è solita usare proprio il profumo che le è stato sequestrato all’aeroporto e che ne acquista una bottiglietta ogni due anni. Sapendo che la donna sarebbe comunque stata prossima ad acquistarlo ancora e immaginando che il figlio glielo avrebbe regalato con piacere, Facebook ha fatto convergere le informazioni nella profilazione pubblicitaria. In questo caso i dati, geolocalizzazione aggiornata inclusa, sono legati a nomi e cognomi specifici.

E se si fosse trattato di un prodotto diverso (magari di natura più privata, come può essere un presidio farmacologico) o di due persone con un grado di parentela diversa? Questo uso dei Big data è da circoscrivere tramite leggi chiare, cosa su cui i Garanti per la privacy dei diversi Stati si stanno impegnando a fondo.

I Big data non sono il male, al contrario, segneranno il progresso dell’umanità.

L’uso che se ne fa e l'ambito in cui si adoperano, è tutt’altro discorso.

Commenti