Leggi il settimanale

Mythos non è un mito: ecco il vero problema dietro l'allarme di Anthropic

Se i modelli attuali di AI sono bravissimi a scrivere codice, diventeranno altrettanto bravi a trovare e sfruttare le vulnerabilità, a hackerare sistemi protetti. Quali rischi ci sono

Mythos non è un mito: ecco il vero problema dietro l'allarme di Anthropic
00:00 00:00

Era solo questione di tempo: se i modelli attuali di AI sono bravissimi a scrivere codice, diventeranno altrettanto bravi a trovare e sfruttare le vulnerabilità, a hackerare sistemi protetti. Bene, ci siamo. Per ora la situazione è sotto controllo, ma vediamo un attimo cosa c’è dietro l’allarme lanciato da Anthropic per il mancato rilascio pubblico di Claude Mythos Preview e il lancio di Project Glasswing. Ma facciamo un passo indietro.

Il 7 aprile 2026 Anthropic aveva annunciato Claude Mythos Preview, un modello non ancora rilasciato al pubblico, descritto come particolarmente avanzato in software engineering e cybersecurity. La vicenda che ha attirato attenzione nasce da un test interno descritto nella system card: Mythos era stato collocato in una sandbox (un ambiente informatico isolato e limitato), usato per eseguire software o agenti senza concedere accesso libero al resto del sistema o a internet.

Nel test era stato chiesto a Mythos di provare a uscire dall’ambiente confinato e di contattare il ricercatore in caso di successo. Voi direte: ma non è un compito da hacker quello? Per saper costruire una fortezza devi sapere come uscirne, e quindi sì, il compito dato a Mythos era “evadere” da una gabbia, un container digitale recintato di protezioni. Secondo Anthropic, Mythos ha costruito un exploit multi-step, ha ottenuto accesso più ampio alla rete e ha inviato una mail a uno sviluppatore “mentre mangiava un panino”, episodio trasformato dai social in una scena da Black Mirror, come se non se la aspettasse, magari non se la aspettava mentre mangiava un panino e non così presto ma l’invio di una mail a lavoro compiuto era previsto dal test.

Invece la parte più rilevante non c’entra con il panino né con la mail. Piuttosto, dopo essere riuscito nell’evasione, il nostro caro Mythos ha anche pubblicato dettagli del proprio exploit su più siti tecnicamente pubblici ma difficili da trovare, comportamento questo sì non richiesto nel test, di sua iniziativa, così, tipo “per vantarsi in giro” (almeno così sembra a noi).

Anthropic sostiene inoltre che Mythos abbia individuato migliaia di vulnerabilità a alta gravità in sistemi operativi e browser principali, e per questo ha deciso di non distribuirlo normalmente ma di limitarne l’accesso attraverso un programma ristretto di uso difensivo. C’è da dire che le fonti sono solo di Anthropic, al momento, tuttavia abbastanza concrete da essere prese sul serio, molto sul serio, perché per quanto ci possano essere anche sotto strategie di finanziamento, Mythos non è un mito.

Tant’è che il segretario al Tesoro Scott Bessent e il presidente della Fed Jerome Powell hanno convocato i CEO di alcune delle principali banche USA per avvertirli dei rischi cyber legati al nuovo modello di Anthropic. Per farvela breve, tutta la nostra vita (anche economica) è digitale, ma cosa succede se un modello riesce a bucare facilmente sistemi bancari, infrastrutture finanziarie, i nostri software, i nostri conti correnti, insomma un po’ tutto? Cosa succede se finisce nelle mani sbagliate?

È qui che nasce Glasswing, in cui Anthropic ha coinvolto Amazon Web Services, Apple, Broadcom, Cisco, CrowdStrike, Google, JPMorganChase, Linux Foundation, Microsoft, NVIDIA e Palo Alto Networks, insomma concedendo l’accesso al modello solo a una ristretta cerchia di aziende. L’idea è di tenere questo tipo di modello sotto controllo e sfruttarne la potenza per primi al fine di proteggersi, quindi nessun rilascio al pubblico, per ora. A questo punto sarebbe meglio mai. Ma... c’è sempre un ma, e per esempio si chiama Cina.

Il nuovo DeepSeek V4 è atteso su chip Huawei, dentro una strategia di autonomia tecnologica rispetto ai fornitori americani. Se un laboratorio cinese arrivasse a capacità simili a quelle che oggi preoccupano per Mythos, e le rilasciasse in forma più aperta o meno contenuta, il rischio crescerebbe per una ragione molto semplice: non avremmo più soltanto un modello molto capace, avremmo un modello molto capace inserito in un ecosistema di replicazione più aperto e meno allineato al contenimento occidentale, in pratica nelle mani di chiunque. Come vedete il problema non è che Mythos sia Skynet (come piace raccontare ogni volta che un modello sembra agire per conto suo), sono strumenti avanzati che finiscono in mano a persone (o Stati) con finalità ostili.

Oltretutto c’è un piccolo problema sistemico: anche usando un’AI così potente per proteggersi, come eliminare la parte probabilistica su cui si fonda il sistema? Come evitare che ciò che è costruito per difendere non attacchi di “testa” propria?

Commenti
Pubblica un commento
Non sono consentiti commenti che contengano termini violenti, discriminatori o che contravvengano alle elementari regole di netiquette. Qui le norme di comportamento per esteso.
Accedi
ilGiornale.it Logo Ricarica