fbpx

OpenAI Jukebox 2.0: Krijgt kunstmatige intelligentie eindelijk een eigen muziekcarrière?

Als ChatGPT essays schrijft en DALL-E tekeningen maakt, wie zegt dan dat AI niet kan zingen?

Foto: Jan Macarol / Ai art

Kunstmatige intelligentie heeft ons al geleerd hoe we een cv op de juiste manier moeten opstellen, e-mails moeten schrijven, katten moeten tekenen in de stijl van Picasso en ingewikkelde wiskundige problemen met kinderlijk gemak moeten oplossen. Allemaal leuk en aardig. Maar OpenAI probeert nu iets uit dat verder gaat dan Excel-spreadsheets en esthetisch aantrekkelijke memes: met OpenAI Jukebox een nummer maken dat mensen daadwerkelijk meer dan één keer willen horen.

Hoewel er geen officiële releasedatum is, circuleert dezelfde vraag in de technische underground en onderzoekskringen: Is het AI openen Bereidt u zich voor op een nieuwe versie van Jukebox – OpenAI Jukebox 2.0? Dit is het experimentele model van kunstmatige intelligentie dat jaren geleden al bewees dat het een liedje kon componeren, de tekst kon zingen en zelfs Elton John, Nirvana of iemand die ooit op MTV heeft opgetreden, stijlvol kon imiteren. En dat allemaal zonder ook maar één menselijke noot. Nou ja, in ieder geval niet het soort geluid dat van de stembanden zelf afkomstig zou zijn.

Nu suggereren een paar hints – in de vorm van academische publicaties, stilletjes bijgewerkte GitHub-pagina's en 'per ongeluk' gelikete tweets – dat er wellicht een nieuwe versie van dit muzikale wonder gaande is. Misschien binnenkort. Misschien eind april. Misschien alleen in de zomer. Net als in de muziekindustrie: de release is nog niet bekend, maar het publiek staat al met de koptelefoon op te wachten.

OpenAi Jukebox: een AI die meer kan dan alleen C majeur herhalen

Toen OpenAI Jukebox voor het eerst introduceerde, keken critici terecht bedenkelijk. Een model waarbij muziek helemaal vanaf nul wordt gegenereerd, inclusief zang, klinkt als een futuristisch scenario dat zou worden bedacht door een muziekproducent met te veel tijd en te weinig artiesten. Maar de Jukebox werkte. Door meer dan een miljoen nummers te analyseren, inclusief songteksten, genres, artiesten en zelfs het jaar van uitgave, creëerde hij een nieuwe vorm van muzikale compositie: een die niet op instrumenten is gebaseerd, maar op data.

Het model maakte geen noten, maar geluid. En dit rechtstreeks in audioformaat, in studio-opnamekwaliteit. Je hebt geluisterd naar een nummer dat nooit heeft bestaan, maar iemand zou het gemakkelijk kunnen aanzien voor een verloren gegane demo van Radiohead uit 1998.

Foto: Jan Macarol / OpenAi

Hoe ontstaat een kunstmatig gedicht? Langzaam, geduldig en met meerdere lagen transformatoren

Technisch gezien werkt Jukebox door eerst het ruwe geluid te coderen in een gecomprimeerde, symbolische taal – een benadering van het muzikale DNA. Deze gecodeerde opname wordt vervolgens verwerkt door drie niveaus van neurale netwerken, die elk op hun eigen manier bijdragen aan de melodie, het ritme, de zang en de geluidstextuur. De laatste stap is omgekeerd decoderen, waarbij de AI de geluidsgolf letterlijk terugvouwt en iets creëert dat een mens kan horen, maar de AI "voorspelt" het alleen.

Het geheel functioneert als een soort digitale studio, waarin de producer nooit pauze nodig heeft, de zanger nooit stottert en de inspiratie van de auteur niet afhankelijk is van het weer. Er is één probleem: het duurt bijna negen uur om een liedje in de huidige vorm te maken voor één minuut audio. Dat betekent dat Jukebox nu meer een componist van langzame symfonieën is dan een maker van instant hits.

Wat suggereren de geruchten over de nieuwe versie?

De afgelopen weken is er sprake van toegenomen activiteit onder ontwikkelaars die verbonden zijn aan de audiodivisie van OpenAI. Er zijn commit-logs verschenen op GitHub waarin modeloptimalisaties worden vermeld. Verschillende onderzoekers hebben in podcasts (en nog meer in informele gesprekken op X/Twitter) aangegeven dat er aan gewerkt wordt nieuwe architectuur, wat een snellere generatie, betere vocale articulatie, ondersteuning voor meerdere talen en – wat vooral interessant is – een beter begrip van de songstructuur mogelijk zou moeten maken.

Dit betekent dat de nieuwe versie voor het eerst nummers kan genereren met duidelijk gedefinieerde refreinen, intro's, bruggen en eindes – iets wat je in een echt nummer hoort, niet in een digitale schets.

Voeg hieraan toe de geruchten over een toegankelijkere gebruikersinterface en integratie met andere creatieve tools (zoals API's voor makers van content), en het wordt duidelijk: er is iets aan het koken, en het is niet ver weg.

OpenAI Jukebox
Foto: Jan Macarol / OpenAi

AI in de muziek: assistent of concurrent?

De nieuwe versie van Jukebox opent de klassieke vraag: vervangt kunstmatige intelligentie creativiteit of vergroot het deze? Critici zullen zeggen dat het een technologische decontextualisering van kunst is: een gedicht zonder ziel, een emotie zonder ervaring. Voorstanders zullen enthousiast zijn, want Jukebox biedt iets compleet nieuws: de mogelijkheid om muziek te creëren als idee, niet als uitvoering.

Stel je een onafhankelijke artiest voor die een professioneel klinkend nummer in de stijl van Massive Attack maakt, zonder studiobudget. Of een indie-ontwikkelaar die met een paar regels tekst een soundtrack voor zijn videoproject genereert. Of een student die een liedje schrijft over zijn/haar crush en er vervolgens naar luistert in de stijl van Arctic Monkeys.

Dit is geen sciencefiction meer – dit is Jukebox. Of preciezer: Jukebox, een versie die nog niet bestaat. Maar we weten allemaal dat het gaat gebeuren.


Conclusie: Soms komt het beste geluid uit de stilte vóór de première

Er is nog niets officieel bevestigd. OpenAI is stil, maar de stilte is verdacht luid. De sfeer onder onderzoekers is vergelijkbaar met die rond de albums van Kanye West: niemand weet wanneer ze uitkomen, maar iedereen schrijft er al recensies over. Als Jukebox 2.0 inderdaad is wat de geruchten voorspellen, dan horen we wellicht binnenkort nummers die niet langer gebaseerd zijn op de inspiratie van één enkel individu, maar op het collectieve geheugen van miljoenen nummers. En dat met een stem die we nog nooit eerder hebben gehoord, maar die toch verrassend bekend klinkt.


Met andere woorden: als je het gevoel hebt dat er tegenwoordig niets nieuws meer is in de muziek, heb dan nog even geduld. Misschien wordt de volgende hit al gegenereerd. Stil, langzaam, in de cloud. En als het klaar is, zal niemand het zingen – maar jij zingt toch mee.

Bij jou sinds 2004

Vanaf jaar 2004 we onderzoeken stedelijke trends en informeren onze community van volgers dagelijks over het laatste nieuws op het gebied van lifestyle, reizen, stijl en producten die met passie inspireren. Vanaf 2023 bieden we content aan in de belangrijkste wereldtalen.