Leggi il settimanale

Guardiamo la cronologia: la prima falla di Mythos è Anthropic?

Sembra che Project Glasswing nasca in seguito a una sequenza di incidenti e fughe, non in un laboratorio sterilizzato dalla retorica della sicurezza

Guardiamo la cronologia: la prima falla di Mythos è Anthropic?
00:00 00:00

Ho un sospetto, su tutta la vicenda che riguarda Mythos, il più potente modello sperimentale per la cybersicurezza, però siccome non sono un complottista vi metto in fila solo i fatti, e le date, anche perché qui non c’è tanto un complotto ma da osservare una cronologia strana.

Dunque, il 26 marzo Fortune rivela l’esistenza di un nuovo modello di Anthropic, Claude Mythos, emersa da materiali interni finiti in una cache pubblicamente accessibile. Anthropic conferma che sta testando un modello di cyber-security più potente dei precedenti. Fortune scrive anche che il materiale era un data store pubblico e ricercabile, con 3000 asset non pubblicati, tra cui proprio una bozza di Mythos/Capybara, e attribuisce la cosa a un “errore umano”.

Lo stesso 26 marzo Anthropic risponde a Fortune che considerata la capacità del modello, ha deciso di procedere con cautela, e di farlo testare a un piccolo gruppo di utenti early access, decidendo con chi. Testualmente: “Given the strength of its capabilities, we’re being deliberate about how we release it”. Tenete ancora a mente la prima pubblicazione per “human error”. Insomma, Mythos è troppo potente per essere rilasciato a altri.

Il 1 aprile il Guardian rileva che sempre il 31 marzo, di nuovo per errore umano, Anthropic ha diffuso una parte del codice interno di Claude Code. Anche qui Anthropic risponde sulla difensiva, non negando, spostando l’attenzione: non c’erano dati clienti né credenziali, e ribadisce l’errore umano. Da notare: due ammissioni in seguito a rilevamenti giornalistici, e una smentita: non c’era niente di pericoloso. Sul serio? Andiamo avanti.

Il 7 aprile Anthropic annuncia Project Glasswing, definendolo un’iniziativa per mettere in sicurezza software critici usando Claude Mythos Preview (i partner includono Apple, Aws, Microsoft, Google, JPMorganChase, Linux Foundation e molti altri). In sostanza Anthropic dichiara di avere tra le mani un modello capace di trovare e sfruttare vulnerabilità software con una potenza tale da non poter essere rilasciato al pubblico, e anziché gestirlo in proprio decide di condividerlo con un gruppo ristretto di partner selezionati e infrastrutture critiche. Questo dopo due fughe ravvicinate, entrambe liquidate come errore umano, entrambe scoperte da giornali. Non ci sarà quindi nessun rilascio pubblico, per la sicurezza di tutti. Anche perché, specifica nella system card, Mythos non solo ha capacità mai viste nel penetrare i sistemi di sicurezza informatici, ma anche chi non ha una specializzazione in sicurezza avrebbe potuto chiedere a Mythos di penetrare in una banca dati (anche in una banca) durante la notte e trovarsi la mattina con il lavoro fatto. Benissimo.

Il 17 aprile Mythos entra direttamente in contatto con la Casa Bianca, Dario Amodei incontra Susie Wiles, capo di cabinetto, e Scott Bessent, segretario del Tesoro: Axios parla di disgelo tra Anthropic e governo americano, e Reuteur aggiunge che Treasury e State Department avevano chiesto briefing e accesso al modello, insomma Mythos diventa una questione di Stato.

Arriviamo al 21 aprile, quando Bloomberg (e il giorno dopo il Guardian) pubblica la notizia che un piccolo gruppo di utenti non autorizzati avrebbe avuto accesso a Mythos. La risposta di Anthropic è “stiamo indagando su un report di accesso non autorizzato attraverso un vendor terzo”.

Qui arrivo al sospetto, perché le coincidenze sono molte e la tempistica stretta: non è che Project Glasswing nasce come toppa d’emergenza? Insomma, non sei una startup con quattro smanettoni, sei una delle aziende cardine dell’AI, annunci di avere una bomba atomica per la sicurezza digitale globale, ti fai fare le pulci dai giornali, ammetti tutto, errore umano, solo dopo decidi di condividere la bomba con partner selezionati, e ora potrebbe essere in mano a qualsiasi hacker, e stai indagando? La ragione per cui vi ho messo in fila la cronologia è che sembra che Project Glasswing nasca in seguito

a una sequenza di incidenti e fughe, non in un laboratorio sterilizzato dalla retorica della sicurezza. E che Anthropic sulla sicurezza abbia un problema di vulnerabilità non artificiale ma umana, che è proprio Anthropic.

Commenti
Pubblica un commento
Non sono consentiti commenti che contengano termini violenti, discriminatori o che contravvengano alle elementari regole di netiquette. Qui le norme di comportamento per esteso.
Accedi
ilGiornale.it Logo Ricarica