Cultura e Spettacoli

Ecco come è nato "iSA" il geniale software che cattura le opinioni

Il più sofisticato mezzo per monitorare i social network è stato inventato negli scantinati della Statale di Milano. Ora tutti aspettano i suoi responsi

Ecco come è nato "iSA" il geniale software che cattura le opinioni

Erano due e non quattro. Non stavano seduti al Roxy Bar ma in un suo equivalente a Tokyo. Nei bicchieri non whiskey ma birra nipponica. E in testa un'idea che, se non ha cambiato il mondo, ha modificato il modo in cui viene letto.

Sono gli ultimi mesi del 2010 e Luigi Curini e Stefano Iacus, docenti all'università degli Studi di Milano in Scienza Politica e Probabilità e Statistica Matematica, tra una birra e l'altra gettano le basi di iSA (Integrated Sentiment Analysis), l'algoritmo che monitora le opinioni espresse in rete più efficiente del mondo. Ispirato alle ricerche di Gary King a Harvard ma migliore, ha un tasso di accuratezza del 97 per cento ed è l'unico a cogliere le motivazioni che stanno dietro a un'idea.

Così nasce «Voices from the Blogs», l'osservatorio scientifico che nel dicembre 2012 diventa una startup spin-off dell'Università degli Studi di Milano. E da lì prende il volo. Si susseguono collaborazioni con media e aziende nazionali e internazionali, e l'ultima con il Guardian potrebbe trasformarsi in qualcosa di più. Oltre 400 milioni i post analizzati, circa 300 milioni i testi archiviati solo in Italia. Un gioiello tecnologico che sembra uscito dalla Silicon Valley ma è nato negli scantinati della facoltà di Scienze Politiche, in via Conservatorio a Milano. Un gioiello ora premiato anche nel contest promosso da Google e Istat e intitolato, appunto, «Produrre statistica ufficiale con i Big Data».

A Curini e Iacus si aggiungono poi Giuseppe Porro, docente di economia all'Università degli Studi dell'Insubria, e Andrea Ceron, ricercatore di Scienza Politica nell'ateneo milanese. Si lavora sull'algoritmo, autofinanziati, nei locali e con i server dell'università. Poi arrivano le prime commissioni dalla Camera di Commercio di Milano e di Monza e Brianza, che «hanno investito al buio».

Il primo vero banco di prova è l'analisi delle opinioni in rete riguardo all'aggressione all'allora premier Silvio Berlusconi in piazza Duomo a Milano, nel 2009. «Volevamo capire se un evento traumatico come quello avrebbe comportato un cambiamento di opinione, ai tempi molto critica, nei confronti del Presidente del Consiglio. E in effetti era una delle cose che eravamo riusciti a catturare», spiega Ceron.

«È stato la nostra prima analisi, fatta con un paio di migliaia di post - sorride - quella realizzata per il Guardian , per determinare il sostegno all'Isis da parte del mondo arabo, ne ha passati in rassegna due milioni e 500 mila».

In mezzo oltre 600 studi, fra pubblici e privati. Dall'analisi della felicità degli italiani su Twitter, che monitora tutti i giorni dal 2012 l'andamento delle 110 province italiane, all'indice di speranza di ripresa del Paese, fino alle previsioni, corrette - inutile specificarlo- dei risultati elettorali americani, francesi e italiani.

Ma non è solo sui grandi numeri che l'algoritmo iSA stacca gli altri. «Le società di analisi utilizzano motori di ricerca semantici che stabiliscono a priori le regole per identificare un testo e poi fanno tutto in automatico», spiega Iacus.

Il linguaggio invece si evolve continuamente in base all'argomento ma anche all'età e al background di chi scrive. Cose che un algoritmo non può percepire da solo. O meglio, che devono essergli insegnate. Questa è la chiave per arrivare a un'accuratezza del 97 per cento: le persone.

E, infatti, iSA si basa su una prima fase di analisi manuale e identificazione del contenuto di circa mille post. È così che apprende il linguaggio usato per parlare di un certo tema e poi estende la sua analisi all'intero universo che ne discute. «Come un bambino- aggiunge Curini - all'inizio bisogna aiutarlo a stare in piedi. Poi corre da solo».

Sono circa venti i codificatori, per la maggior parte studenti e tesisti, che aiutano iSA a imparare. Tutti esperti di un argomento o di una lingua. E tutti pagati.

Fa sorridere che le analisi di «Voices» siano così accurate senza mai porre una sola domanda. Non serve, dicono, perché le risposte ci sono già, in rete e sui social. La gente le fornisce liberamente e forse anche un po' senza riflettere. «Su tutte le tematiche un po' delicate a domanda diretta si tende a non dire esattamente la propria opinione ma conformarsi a quello che si ritiene più politically correct. Sui social invece tutti sembrano scordarsi il concetto di privacy. E noi stiamo ad ascoltare» continua.

«Non siamo l'oracolo» - tengono a ribadire - «chi scrive in rete non è necessariamente sinonimo dell'italiano medio. Però è vero che sui grandi numeri si coglie una tendenza e lo si fa in tempo reale. Al momento un italiano su due è su Facebook. Un numero che si allargherà sempre più e ci permetterà di cogliere un segnale sempre più raffinato».

Sorridono molto Curini, Iacus e Ceron. Sono orgogliosi. «Siamo arrivato sul Guardian dalla nostra scrivania - scherzano - e abbiamo appena aperto una nuova sede nel coworking Talent Garden, in via Merano, dove lavoreranno due persone». Un modo per segnare il territorio in attesa della piccola, e ancora segretissima, rivoluzione in programma per il 2015. In cantiere ci sono collaborazioni e prodotti internazionali.

La fase di gestazione di «Voices» è finita.

Ora corre da sola.

Commenti