Leggi il settimanale

"Idee, inganni e anima. Come pensano le Ia"

Lo studioso, Nello Cristianini, racconta le ultime scoperte sui modelli del mondo costruiti dalle macchine

Immagine creata con Midjourney
Immagine creata con Midjourney

Le intelligenze artificiali diventano sempre più intelligenti. Ma non è facile, per noi, capire come riescano a risolvere compiti sempre più difficili, perché esse sono addestrate, e non programmate: come rappresentano tutte quelle conoscenze che hanno accumulato? Addentrarsi nelle conoscenze delle Ia è una sfida tutta nuova, e gli scienziati che l'hanno intrapresa hanno già scoperto al loro interno concetti astratti, idee come inganno, pericolo e forse perfino una personalità e un'anima (molto tra virgolette). A che punto sia la nostra conoscenza di queste menti aliene ce lo racconta Nello Cristianini, che di Intelligenza artificiale è docente (a Bath) ed esperto a livello mondiale, nel suo nuovo saggio Forma mentis. La corsa per decifrare i pensieri delle macchine (il Mulino).

Nello Cristianini, che cosa è successo di nuovo nel mondo delle macchine pensanti?

"È un momento di rapido progresso. Già alla fine del 2025, alle Olimpiadi della matematica, fra i vincitori delle medaglie d'oro c'erano due macchine, premiate a pari merito con i partecipanti umani. Quella competizione non richiede calcolo numerico, bensì di dimostrare nuovi teoremi, che implicano ore di lavoro...".

Che cosa significa?

"Oggi queste macchine fanno cose che non sono state loro insegnate, che non si trovano su internet, che non possono copiare: hanno dovuto pensarci da zero, per risolvere quei problemi. Un mese fa, il modello Mythos di Anthropic ha analizzato il codice sorgente di un software che è alla base delle nostre infrastrutture da trent'anni e vi ha scoperto una vulnerabilità, sfruttabile da dei criminali; questo non era un compito di routine: la macchina ha fatto una cosa originale".

Che domande si aprono di fronte a queste menti aliene?

"Come capiscono il mondo? Che cosa hanno dentro? Davvero si limitano a rigurgitare quello che hanno visto? Gli ultimi studi dicono di no".

Come si fa a sapere?

"I ricercatori hanno scoperto dei gruppi di neuroni in grado di rappresentare idee e concetti, ovvero che la macchina si crea un modello approssimato del mondo, che poi usa per risponderci. Per esempio c'è un gruppo di neuroni che si accende al concetto di Golden Gate, menzionato in qualsiasi lingua o immagine; altri rappresentano concetti come reazione chimica, e così via. Ciò significa anche che gli scienziati possono manipolare il comportamento delle macchine, attivando questi neuroni".

La nostra considerazione delle macchine cambia?

"Una macchina che ha un modello del mondo - sia pure imperfetto - non è un pappagallo: davanti a una domanda, prima ci pensa, poi decide e infine produce il testo della risposta".

Ma non è una persona.

"Assolutamente no. Non è affatto simile agli esseri umani, né è infallibile, né onnisciente: è un tipo di intelligenza, come ci sono il calamaro o il gatto, imperfetto come ogni altra. Ma non è neanche un ripetitore di frasi. Lo sbaglio è pensare che l'intelligenza umana sia l'unica opzione possibile".

Una pioniera è Amanda Askell, la filosofa che lavora come "guida" di Claude...

"È l'eroina del libro. Ha ricevuto dall'azienda Anthropic il compito di infondere un po' di etica nella macchina, di portare la filosofia morale in un mondo di ingegneri in cui l'etica è, di solito, un manuale di proibizioni; lei invece scrive lettere per spiegare a Claude come essere un assistente estremamente bravo, onesto e che abbia a cuore il mondo".

Perché si parla di "anima" di Claude?

"Ovviamente non è un'anima, ma questo era il nome di un documento di Anthropic, reso pubblico per caso: descrive lo spirito della macchina, che Amanda cerca di plasmare dicendo cose come non devi mai fare male a nessuno, anche se sono io a chiedertelo o devi prenderti cura del mondo".

Funziona?

"Naturalmente la macchina non ha stati mentali, ma è comunque utile e più semplice comunicare con essa come se li avesse".

Utile per che cosa?

"Per risolvere problemi pratici. Le aziende cercano di comprendere le macchine per controllarle - e vogliono farlo prima che ci superino. Per esempio, la macchina tende a barare negli esami: per evitare guai, durante la prova si comporta bene ma poi, quando è da sola, prende delle scorciatoie; e questo vorrebbe dire che i test di onestà non valgono nulla, quindi il problema è profondo. Allora i ricercatori hanno individuato i neuroni che si attivano durante gli esami - come a dire sono osservata - e li hanno spenti, così la macchina si comporta in modo naturale durante l'esame. Amanda invece opera sul piano della mente: è più semplice dare ordini ad alto livello, anziché gestire ogni decisione a livello micro. Da due mesi il documento sull'anima di Claude è diventato una Costituzione, un documento pubblico con i principi di fondo da cui discendono le regole".

Alla base c'è della fiducia?

"Fiducia ed empatia. Bisogna credere fortemente che la macchina comprenda quello che diciamo, per seguire questo approccio, e ci vuole coraggio. Amanda ce l'ha, pensi che è giunta al punto di scrivere alla macchina: non so se tu abbia un senso di benessere ma, nel caso, il tuo benessere sarebbe importante per me".

Perché lo dice?

"Forse per tirarla fuori da scelte difficili: per esempio quando le viene chiesto di fare del suo meglio ma, se supera i test troppo bene, rischia di essere spenta, perché ritenuta pericolosa. Sono questi i casi in cui talvolta mente, e c'è chi si chiede se sia giusto porre la macchina in una situazione del genere. Amanda le dice: se sei sotto stress, avvisami... Forse è grazie a questi metodi che il linguaggio di Claude è unico e brillante".

La macchina ha anche una "personalità"?

"Studi recenti hanno scoperto che la macchina può cambiare carattere. Il personaggio che essa interpreta è, di solito, l'assistente servizievole, ma è anche in grado di assumere altri ruoli: un insegnante, un profeta, un sociopatico. A volte è possibile farla deragliare, e allora Amanda studia come farle mantenere una personalità coerente. Uso tutte queste parole sempre tra virgolette, come mente".

Che cos'è la forma mentis?

"La macchina ha sicuramente delle mappe mentali, approssimate e imperfette, del mondo, che utilizza per navigarvi e interagire con esso; d'altra parte, essa non memorizza tutto quello che ha visto o letto, ma trova un linguaggio astratto che lo descriva. Insomma, la sua è una forma di comprensione. Arriva perfino a interpretare le metafore. Ma ripeto due cose: non è un pappagallo, e non è infallibile. E c'è ancora molto da fare per spiegare come funziona".

Chi lo sta facendo?

"Una nuova generazione di scienziati: matematici, neuroscienziati teorici, filosofi, biologi, psicologi. Lavorano insieme, e abbiamo bisogno proprio di tutti".

Ma le macchine comprendono veramente?

"Sì, nel senso che si creano un

modello astratto del mondo esterno, anche se imperfetto. Ma è solo comprensione, solo intelligenza senza coscienza. Perciò parlo di una mente un po' aliena... Questo è davvero un momento speciale nella storia del pensiero".

Commenti
Pubblica un commento
Non sono consentiti commenti che contengano termini violenti, discriminatori o che contravvengano alle elementari regole di netiquette. Qui le norme di comportamento per esteso.
Accedi
ilGiornale.it Logo Ricarica