OpenAI Jukebox 2.0: Hoće li umjetna inteligencija konačno dobiti vlastitu glazbenu karijeru? City Magazin

Umjetna inteligencija već nas je naučila kako pravilno sastavljati životopis, pisati e-mailove, crtati mačke u Picassovom stilu i s dječjom lakoćom rješavati složene matematičke probleme. Sve lijepo i dobro. Ali OpenAI sada pokušava nešto što nadilazi Excel proračunske tablice i estetski ugodne memeove: korištenje OpenAI Jukeboxa za stvaranje pjesme koju bi ljudi zapravo željeli čuti više puta.

Iako nema službenog datuma izlaska, isto pitanje kruži tehnološkim podzemljem i istraživačkim krugovima: Je li OpenAI pripremate li se za novu verziju Jukeboxa – OpenAI Jukebox 2.0? Ovo je eksperimentalni model umjetne inteligencije koji je prije mnogo godina dokazao da može skladati pjesmu, otpjevati tekst, pa čak i stilski imitirati Eltona Johna, Nirvanu ili bilo koga tko je ikada nastupao na MTV-u - sve bez ijedne ljudske note. Pa, barem ne onakav kakav bi proizašao iz pravih glasnica.

Sada, nekoliko naznaka – u obliku akademskih publikacija, tiho ažuriranih GitHub stranica i “slučajno” lajkanih tweetova – sugeriraju da se možda događa nova verzija ovog glazbenog čuda. Možda uskoro. Možda krajem travnja. Možda samo ljeti. Baš kao u glazbenoj industriji – izdanje je "TBA", ali publika već čeka sa slušalicama na ušima.

OpenAi Jukebox: AI koji može učiniti više od pukog ponavljanja C-dura

Kada je OpenAI prvi put predstavio Jukebox, kritičari su s pravom podigli obrve. Model koji generira glazbu od nule, uključujući vokale, zvuči kao futuristički scenarij koji bi smislio glazbeni producent s previše vremena i premalo umjetnika. Ali Jukebox je radio. Analizirajući više od milijun pjesama - uključujući tekstove, žanrove, izvođače, pa čak i godinu izdanja - stvorio je novi oblik glazbene kompozicije: onu koja se ne temelji na instrumentima, već na podacima.

Model nije stvarao note, već zvuk. I to izravno u audio formatu, u studijskoj kvaliteti snimanja. Slušali ste pjesmu koja nikada nije postojala, ali bi je netko lako mogao zamijeniti za izgubljeni Radiohead demo iz 1998. godine.

Kako se rađa umjetna pjesma? Polako, strpljivo i s više slojeva transformatora

Tehnički govoreći, Jukebox radi tako da prvo kodira sirovi zvuk u komprimirani, simbolički jezik – aproksimaciju glazbene DNK. Ovu kodiranu snimku zatim obrađuju tri razine neuronskih mreža, od kojih svaka na svoj način doprinosi melodiji, ritmu, vokalu i teksturi zvuka. Posljednji korak je obrnuto dekodiranje – gdje AI doslovno savija zvučni val i stvara nešto što čovjek može čuti, ali AI samo "predviđa".

Cijela stvar funkcionira poput svojevrsnog digitalnog studija, gdje producent nikad ne treba odmor, pjevač nikad ne zamuckuje, a autorova inspiracija ne ovisi o vremenu. Jedini problem: generiranje pjesme u sadašnjem obliku traje gotovo devet sati za jednu minutu zvuka. Što znači da je sada Jukebox više skladatelj usporenih simfonija nego instant hitmejker.

Što govore glasine o novoj verziji?

Posljednjih tjedana došlo je do povećane aktivnosti među programerima povezanim s audio odjelom OpenAI-ja. Na GitHubu su se pojavili zapisnici predaje u kojima se spominju optimizacije modela. Nekoliko je istraživača nagovijestilo u podcastovima (a još više u neformalnim razgovorima na X/Twitteru) da je u tijeku rad na nova arhitektura, koji bi trebao omogućiti brže generiranje, bolju vokalnu artikulaciju, podršku za više jezika i – što je posebno zanimljivo – bolje razumijevanje strukture pjesme.

To znači da bi nova verzija mogla po prvi put generirati pjesme s jasno definiranim refrenima, uvodima, mostovima i završecima – nešto što čujete u stvarnoj pjesmi, a ne u digitalnoj skici.

Najbolji suradnik: ChatGPT sada snima vaše sastanke i čita vaš Google disk

Dodajte ovome glasine o pristupačnijem korisničkom sučelju i integraciji s drugim kreativnim alatima (kao što su API-ji za kreatore sadržaja), i postaje jasno: nešto se kuha, i nije daleko.

OpenAI Jukebox — Fotografija: Jan Macarol / OpenAi

AI u glazbi: pomoćnik ili konkurencija?

Nova verzija Jukeboxa ponovno će otvoriti klasično pitanje: zamjenjuje li umjetna inteligencija kreativnost ili je proširuje? Kritičari će reći da je to tehnološka dekontekstualizacija umjetnosti – pjesma bez duše, emocija bez iskustva. No zagovornici će biti oduševljeni jer Jukebox nudi nešto potpuno novo: mogućnost stvaranja glazbe kao ideje, a ne kao izvedbe.

Zamislite neovisnog umjetnika koji stvara pjesmu profesionalnog zvuka u stilu Massive Attacka bez studijskog budžeta. Ili indie programer koji generira zvučni zapis za svoj video projekt s nekoliko redaka teksta. Ili student koji napiše pjesmu o svojoj simpatiji i sluša je u stilu Arctic Monkeysa.

Ovo više nije znanstvena fantastika – ovo je Jukebox. Ili preciznije: Jukebox, verzija koja još ne postoji. Ali svi znamo da dolazi.

Zaključak: Ponekad najbolji zvuk dolazi iz tišine prije premijere

Ništa još nije službeno potvrđeno. OpenAI je tih, ali je njegova tišina sumnjivo glasna. Atmosfera među istraživačima slična je onoj na albumima Kanyea Westa - nitko ne zna kada će izaći, ali svi već pišu recenzije. Ako je Jukebox 2.0 doista ono što glasine predviđaju, uskoro bismo mogli čuti pjesme koje se više ne temelje na inspiraciji jednog pojedinca, već na kolektivnom sjećanju milijuna pjesama. I to s glasom koji nikad prije nismo čuli, ali zvuči iznenađujuće poznato.

Watch this video on YouTube

Drugim riječima: ako vam se čini da ovih dana nema ništa novo u glazbi – samo se još malo strpite. Možda se sljedeći pogodak već generira. Tiho, polako, u oblaku. I kad bude gotovo, nitko je neće pjevati – ali ćeš ti i dalje pjevati.