Leggi il settimanale

Uno studio matematico spiega perché le melodie sono orecchiabili. E conferma il limite dell’AI creativa

La matematica descrive oggi ciò che la teoria musicale e la semiotica sostengono da decenni, e cioè che la percezione musicale dipende da strutture apprese

Uno studio matematico spiega perché le melodie sono orecchiabili. E conferma il limite dell’AI creativa

Quanto orecchiabile l’ultima di Annalisa?E quella di Emma? Ma cosa significa “orecchiabile”? Ve ne parlo in merito a un recente lavoro che spiega come la matematica possa spiegare perché alcune melodie risultano immediatamente orecchiabili (non è novità, tra poco vi spiego perché, ma prendo la notizia perché è un buono spunto per ragionare nell’era dell’AI).

Olga Ibragimova e Chrystopher L. Nehaniv, ricercatori dell’Università di Waterloo hanno applicato la teoria delle simmetrie alle frasi musicali, trattando le melodie come strutture trasformabili (trasposte, invertite o percorse al contrario per intenderci) senza perdere identità. Il lavoro, presentato alla conferenza matematica AMMCS e pubblicato nella serie Springer Proceedings in Mathematics & Statistics, mostra come ciò che l’orecchio trattiene non sia la singola nota ma la forma, una configurazione che può mutare mantenendo riconoscibilità. In altre parole, l’orecchiabile coincide con ciò che si lascia comprimere e ripetere.

Non è una tesi nuova, dicevo, anzi: la matematica descrive oggi ciò che la teoria musicale e la semiotica sostengono da decenni, e cioè che la percezione musicale dipende da strutture apprese. Come ricordava Umberto Eco già negli anni Sessanta, l’ascoltatore occidentale è educato a prevedere determinati sviluppi melodici e armonici: l’“orecchiabile” non è un istinto, è un codice. Roland Barthes era ancora più radicale: ripeteva nei suoi saggi quanto l’ascolto non fosse mai neutro, bensì organizzato da un “sistema culturale”, e il fatto che una simmetria risulti “naturale” o “piacevole” dipende dalla grammatica musicale interiorizzata. Anche da quella innata, ma quella innata, fuori dalla cultura, è molto basica e ritmica (le orecchie sono sensi che si sono evolute per sopravvivere, non per ballare diventare Elvis Presley o Michael Jackson).

Comunque sia, la matematica contiene la premessa perfetta per una fabbrica dell’hit: basta individuare le simmetrie giuste nella cultura giusta e il cervello farà il resto (o meglio l’AI, il cervello non va più di moda). Non a caso coincide con ciò che un sistema predittivo sa fare meglio: produrre regolarità riconoscibili. Enrico Mensa, altrimenti conosciuto sul web come Enkk, giovane e brillante professore e ricercatore universitario (seguitelo se vi interessa l’argomento), ha un motto, anzi due: AI senza Hype, e anche prediction is not reasoning. Detta altrimenti: l’AI ci stupisce quando prevede, ma per prevedere deve avere una statistica di ciò che può prevedere. Sull’arte e sulla musica e sulla scrittura vanno bene finché sono nella media, statisticamente “orecchiabili”.

Ecco perché vi ho collegato questo studio sull’orecchiabilità musicale all’intelligenza artificiale (per essere più precisi ai LLM impiegati in vari campi, che chiamiamo Intelligenza Artificiale). Un modello generativo vive di ciò che ritorna e di ciò che non costringe l’ascoltatore a cambiare codice mentre ascolta. Senza considerare che i codici di riconoscimento devono già esistere. Per cui oggi avete decine di app per fare musica anche se siete stonati come una campana (un modo di dire popolare in cui mi ritrovo, ho sempre odiato le campane). Non stupitevi se andate su Spotify e trovate in testa alle classifiche una canzone fatta con Suno (l’app più famosa per “comporre” musica con AI). È orecchiabilità matematica.

E proprio qui entra il limite culturale che la matematica da sola non vede: l’“orecchiabile” non è universale (e non parlo dell’universo, dell’universale terrestre, e stringi stringi neppure di quello, perfino all’interno dello stesso contesto culturale). Il ritmo elementare può attraversare più culture, fino a un certo punto, ma ciò che un orecchio riconosce dipende dalla grammatica che ha imparato. Un villaggio che vive di percussioni e canti modali può sentire l’heavy metal come rumore. La simmetria, insomma, non è una legge della musica, piuttosto una legge della “familiarità” con una musica. Fun fact: l’heavy metal, come il rock, possono risultare fastidiosi a chi ascolta solo musica classica, anche nello stesso contesto culturale, e perfino gli amanti di un certo genere di musica, come il rock progressivo, detestano, che so, Vasco Rossi, pur riconoscendolo (è “orecchiabile”). Ma non è ancora qui che voglio arrivare.

Intanto prendo il paradosso più interessante della matematica dell’orecchiabile applicata a un brano epocale, orecchiabile ma non prevedibile, matematicamente destrutturato e ristrutturato, e vi faccio questo esempio: un modello può imitare Bohemian Rhapsody perché Bohemian Rhapsody esiste, può imitare Mozart perché Mozart è diventato un continente matematico strutturalmente prevedibile, quindi può perfino produrre complessità pop o classiche perché quelle complessità hanno determinato una mappa, un database matematico preciso.

La domanda vera, in generale, è se un’AI avrebbe potuto creare Bohemian Rhapsody quando non c’era. Mi sposto sul mio territorio, la letteratura e l’arte: se portassi ChatGPT, Claude o Grock, addestrati oggi, all’inizio del secolo scorso, prima di Proust, Kafka o Joyce, cosa scriverebbero? Scordatevi la Recherche, Il Processo o l’Ulisse. Scriverebbero ciò che allora era plausibile, cioè i Pierre Hamp del tempo, i bestseller che non restano nella Storia e rappresentano la media, diventano matematica replicabile (il romanzo piacevole, la musica orecchiabile). A proposito: oggi Pierre Hamp, lo ricordo sempre a tutti, ce lo ricordiamo solo perché lo nomina Proust nel suo epistolario, in una lettera a Gallimard, editore di entrambi, il cui senso era più o meno questo, detto non alla francese: «Perché pubblicizzi quella nullità di Pierre Hamp e non me?».

Oppure: immaginate di portare un modello di generazione di immagini nel 1870: avrebbe riprodotto infinite varianti “nuove” di ciò che esisteva, i quadri leccati di battaglie con i soldati dagli elmi luccicanti (i pittori dell’avanguardia che stava per nascere li chiamavano “i pompieristi” perché quegli elmi, dipinti benissimo, ricordavano quelli dei pompieri), all’impressionismo da solo non ci sarebbe mai arrivato. Il capolavoro di Manet, Le Déjeuneur sur l’herbe, fu esposto nel 1863 al Salon de Refusés, per il Salon ufficiale era non solo inappropriato ma impensabile, e eravamo solo agli inizi.

Insomma, per tornare alla matematica, spingiamo il ragionamento all’estremo: mettiamo di poter generare qualsiasi tipo di musica, anche la più complessa, anche il pop che cambia forma mentre lo ascolti (che suoni “orecchiabile”, altrimenti anche Suno, pur rielaborando il già fatto, suona male).

Avremo una hit generata, anche fantastica, però quando alzi gli occhi dal Spotify e e guardi il palco bene che vada al posto di Freddie Mercury trovi un robot, peggio c’è solo Kaney West che canta Bohemian Rhapsody. Bell’affare, signore mie.

Commenti
Pubblica un commento
Non sono consentiti commenti che contengano termini violenti, discriminatori o che contravvengano alle elementari regole di netiquette. Qui le norme di comportamento per esteso.
Accedi
ilGiornale.it Logo Ricarica