fbpx

OpenAI Jukebox 2.0: l'intelligenza artificiale avrà finalmente una sua carriera musicale?

Se ChatGPT scrive saggi e DALL-E disegna, chi ha detto che l'intelligenza artificiale non sappia anche cantare?

Foto: Jan Macarol / Ai art

L'intelligenza artificiale ci ha già insegnato come scrivere correttamente un curriculum, scrivere e-mail, disegnare gatti nello stile di Picasso e risolvere complessi problemi matematici con la facilità di un bambino. Tutto bene. Ma ora OpenAI sta provando qualcosa che va oltre i fogli di calcolo Excel e i meme esteticamente gradevoli: utilizzare OpenAI Jukebox per creare una canzone che le persone vorrebbero effettivamente ascoltare più di una volta.

Sebbene non ci sia ancora una data di uscita ufficiale, la stessa domanda circola negli ambienti underground e di ricerca della tecnologia: È OpenAI ti stai preparando per una nuova versione di Jukebox: OpenAI Jukebox 2.0? Questo è il modello sperimentale di intelligenza artificiale che anni fa ha dimostrato di poter comporre una canzone, cantarne il testo e persino imitare con stile Elton John, i Nirvana o chiunque si sia mai esibito su MTV, il tutto senza usare una sola nota umana. Beh, almeno non del tipo che proverrebbe dalle corde vocali stesse.

Ora, alcuni indizi – sotto forma di pubblicazioni accademiche, pagine GitHub aggiornate di nascosto e tweet apprezzati "accidentalmente" – suggeriscono che potrebbe esserci una nuova versione di questa meraviglia musicale. Forse presto. Forse la fine di aprile. Forse solo d'estate. Proprio come nell'industria musicale: l'uscita è "TBA", ma il pubblico è già in attesa con le cuffie.

OpenAi Jukebox: un'intelligenza artificiale che può fare di più che ripetere il Do maggiore

Quando OpenAI presentò per la prima volta Jukebox, i critici sollevarono giustamente delle perplessità. Un modello che genera musica da zero, comprese le parti vocali, sembra uno scenario futuristico che un produttore musicale con troppo tempo a disposizione e troppo pochi artisti potrebbe inventare. Ma il Jukebox funzionava. Analizzando oltre un milione di canzoni, inclusi testi, generi, artisti e persino l'anno di uscita, ha creato una nuova forma di composizione musicale: una che si basa non sugli strumenti, ma sui dati.

Il modello non creava note, ma suoni. E questo direttamente in formato audio, con la qualità di registrazione in studio. Hai ascoltato una canzone che non è mai esistita, ma qualcuno potrebbe facilmente scambiarla per una demo perduta dei Radiohead del 1998.

Foto: Jan Macarol / OpenAi

Come nasce una poesia artificiale? Lentamente, pazientemente e con più strati di trasformatori

Tecnicamente parlando, Jukebox funziona codificando innanzitutto il suono grezzo in un linguaggio compresso e simbolico, un'approssimazione del DNA musicale. Questa registrazione codificata viene poi elaborata da tre livelli di reti neurali, ognuno dei quali contribuisce a suo modo alla melodia, al ritmo, alla voce e alla consistenza del suono. Il passaggio finale è la decodifica inversa, in cui l'intelligenza artificiale ripiega letteralmente l'onda sonora e crea qualcosa che un essere umano può sentire, ma che l'intelligenza artificiale si limita a "prevedere".

Il tutto funziona come una specie di studio digitale, dove il produttore non ha mai bisogno di pause, il cantante non balbetta mai e l'ispirazione dell'autore non dipende dalle condizioni meteorologiche. L'unico problema: generare una canzone nella sua forma attuale richiede circa nove ore per un solo minuto di audio. Ciò significa che ora Jukebox è più un compositore di sinfonie al rallentatore che un creatore di successi immediati.

Cosa suggeriscono le indiscrezioni sulla nuova versione?

Nelle ultime settimane si è registrata una crescente attività tra gli sviluppatori associati alla divisione audio di OpenAI. Su GitHub sono apparsi log di commit che menzionano le ottimizzazioni del modello. Diversi ricercatori hanno accennato nei podcast (e ancor di più nelle conversazioni informali su X/Twitter) che sono in corso lavori su nuova architettura, che dovrebbe consentire una generazione più rapida, una migliore articolazione vocale, il supporto per più lingue e, cosa particolarmente interessante, una migliore comprensione della struttura della canzone.

Ciò significa che la nuova versione potrebbe, per la prima volta, generare canzoni con ritornelli, introduzioni, bridge e finali chiaramente definiti, qualcosa che si sente in una canzone vera e propria, non in uno schizzo digitale.

Se a questo si aggiungono le voci su un'interfaccia utente più accessibile e sull'integrazione con altri strumenti creativi (come le API per i creatori di contenuti), il concetto diventa chiaro: qualcosa sta bollendo in pentola, e non è lontano.

OpenAI Jukebox
Foto: Jan Macarol / OpenAi

L'intelligenza artificiale nella musica: assistente o concorrente?

La nuova versione di Jukebox riaprirà la classica domanda: l'intelligenza artificiale sostituisce la creatività o la amplia? I critici diranno che si tratta di una decontestualizzazione tecnologica dell'arte: una poesia senza anima, un'emozione senza esperienza. Ma i sostenitori saranno entusiasti, perché Jukebox offre qualcosa di completamente nuovo: la possibilità di creare musica come idea, non come esecuzione.

Immaginate un artista indipendente che crea una canzone in stile Massive Attack dal suono professionale, senza avere a disposizione un budget da studio. Oppure uno sviluppatore indipendente che genera una colonna sonora per il suo progetto video con poche righe di testo. Oppure uno studente che scrive una canzone sulla persona per cui ha una cotta e la ascolta nello stile degli Arctic Monkeys.

Non è più fantascienza: è Jukebox. O più precisamente: Jukebox, una versione che non esiste ancora. Ma sappiamo tutti che arriverà.


Conclusione: a volte il suono migliore proviene dal silenzio prima della première

Non c'è ancora nulla confermato ufficialmente. OpenAI è silenziosa, ma il suo silenzio è sospettosamente forte. L'atmosfera tra i ricercatori è simile a quella che si respira quando si parla di un album di Kanye West: nessuno sa quando uscirà, ma tutti stanno già scrivendo recensioni. Se Jukebox 2.0 è davvero ciò che predicono le indiscrezioni, presto potremmo ascoltare canzoni che non saranno più basate sull'ispirazione di un singolo individuo, bensì sulla memoria collettiva di milioni di canzoni. E questo con una voce che non avevamo mai sentito prima, ma che suona sorprendentemente familiare.


In altre parole: se pensate che non ci sia nulla di nuovo nella musica di questi tempi, abbiate ancora un po' di pazienza. Forse il prossimo successo è già in arrivo. Silenziosamente, lentamente, nella nuvola. E quando sarà finita, nessuno la canterà, ma tu continuerai a cantare insieme a lei.

Con te dal 2004

Dall'anno 2004 ricerchiamo le tendenze urbane e informiamo quotidianamente la nostra comunità di follower sulle ultime novità in fatto di stile di vita, viaggi, stile e prodotti che ispirano con passione. Dal 2023, offriamo contenuti nelle principali lingue globali.