fbpx

OpenAI Jukebox 2.0: Bekommt Künstliche Intelligenz endlich ihre eigene Musikkarriere?

Wenn ChatGPT Aufsätze schreibt und DALL-E Bilder zeichnet, wer sagt dann, dass KI nicht auch singen kann?

Foto: Jan Macarol / Ai art

Künstliche Intelligenz hat uns bereits beigebracht, wie man einen Lebenslauf richtig verfasst, E-Mails schreibt, Katzen im Stil von Picasso zeichnet und komplexe mathematische Probleme mit kindlicher Leichtigkeit löst. Alles schön und gut. Doch OpenAI versucht nun etwas, das über Excel-Tabellen und ästhetisch ansprechende Memes hinausgeht: Es verwendet OpenAI Jukebox, um einen Song zu erstellen, den die Leute tatsächlich mehr als einmal hören möchten.

Obwohl es kein offizielles Veröffentlichungsdatum gibt, kursiert in der Tech-Underground-Szene und in Forschungskreisen immer wieder dieselbe Frage: Ist es OpenAI Bereiten Sie sich auf eine neue Version von Jukebox vor – OpenAI Jukebox 2.0? Dabei handelt es sich um das experimentelle Modell künstlicher Intelligenz, das vor Jahren bewiesen hat, dass es ein Lied komponieren, den Text singen und sogar Elton John, Nirvana oder jeden anderen, der jemals bei MTV aufgetreten ist, stilvoll imitieren kann – und das alles ohne eine einzige menschliche Note. Zumindest nicht die Art, die von den eigentlichen Stimmbändern kommen würde.

Nun deuten einige Hinweise – in Form von wissenschaftlichen Veröffentlichungen, stillschweigend aktualisierten GitHub-Seiten und „versehentlich“ gelikten Tweets – darauf hin, dass möglicherweise eine neue Version dieses musikalischen Wunders entsteht. Vielleicht bald. Vielleicht Ende April. Vielleicht nur im Sommer. Wie in der Musikbranche – die Veröffentlichung steht noch aus, aber das Publikum wartet schon mit Kopfhörern auf den Ohren.

OpenAi Jukebox: Eine KI, die mehr kann, als nur C-Dur wiederholen

Als OpenAI Jukebox erstmals vorstellte, sorgten die Kritiker zu Recht für hochgezogene Augenbrauen. Ein Modell, das Musik von Grund auf neu generiert, einschließlich Gesang, klingt wie ein futuristisches Szenario, auf das ein Musikproduzent mit zu viel Zeit und zu wenigen Künstlern kommen würde. Aber die Jukebox funktionierte. Durch die Analyse von über einer Million Songs – einschließlich Texten, Genres, Künstlern und sogar dem Erscheinungsjahr – schuf er eine neue Form der musikalischen Komposition: eine, die nicht auf Instrumenten, sondern auf Daten basiert.

Das Modell erzeugte keine Noten, sondern Geräusche. Und das direkt im Audioformat, in Studioaufnahmequalität. Sie haben ein Lied gehört, das es nie gab, das aber leicht mit einem verlorenen Radiohead-Demo aus dem Jahr 1998 verwechselt werden könnte.

Foto: Jan Macarol / OpenAi

Wie entsteht ein künstliches Gedicht? Langsam, geduldig und mit mehreren Schichten von Transformatoren

Technisch gesehen funktioniert Jukebox, indem zunächst Rohtöne in eine komprimierte, symbolische Sprache kodiert werden – eine Annäherung an die musikalische DNA. Diese kodierte Aufnahme wird dann von drei Ebenen neuronaler Netzwerke verarbeitet, die jeweils auf ihre eigene Weise zur Melodie, zum Rhythmus, zum Gesang und zur Klangstruktur beitragen. Der letzte Schritt ist die umgekehrte Dekodierung – dabei faltet die KI die Schallwelle buchstäblich zurück und erzeugt etwas, das ein Mensch hören kann, das die KI aber nur „vorhersagt“.

Das Ganze funktioniert wie eine Art digitales Studio, in dem der Produzent nie eine Pause braucht, der Sänger nie stottert und die Inspiration des Autors nicht vom Wetter abhängig ist. Das einzige Problem: In der aktuellen Form dauert das Erstellen eines Songs für eine einzige Minute Audio fast neun Stunden. Das bedeutet, dass Jukebox heute eher ein Komponist von Zeitlupensymphonien ist als ein Hersteller von Soforthits.

Was lassen die Gerüchte zur neuen Version vermuten?

In den letzten Wochen kam es unter den Entwicklern der Audioabteilung von OpenAI zu verstärkter Aktivität. Auf GitHub sind Commit-Protokolle aufgetaucht, in denen Modelloptimierungen erwähnt werden. Mehrere Forscher haben in Podcasts (und noch mehr in informellen Gesprächen auf X/Twitter) angedeutet, dass derzeit daran gearbeitet wird, neue Architektur, was eine schnellere Generierung, eine bessere Stimmartikulation, Unterstützung mehrerer Sprachen und – was besonders interessant ist – ein besseres Verständnis der Songstruktur ermöglichen soll.

Dies bedeutet, dass die neue Version zum ersten Mal Songs mit klar definierten Refrains, Intros, Bridges und Endungen generieren konnte – etwas, das man in einem echten Song hört, nicht in einer digitalen Skizze.

Hinzu kommen Gerüchte über eine zugänglichere Benutzeroberfläche und die Integration mit anderen Kreativtools (wie etwa APIs für Inhaltsersteller), und es wird klar: da kocht was, und es ist nicht weit entfernt.

OpenAI Jukebox
Foto: Jan Macarol / OpenAi

KI in der Musik: Assistent oder Konkurrenz?

Die neue Version von Jukebox wirft erneut die klassische Frage auf: Ersetzt künstliche Intelligenz die Kreativität oder erweitert sie sie? Kritiker werden sagen, es handele sich um eine technologische Dekontextualisierung der Kunst – ein Gedicht ohne Seele, eine Emotion ohne Erfahrung. Doch Befürworter werden begeistert sein, denn Jukebox bietet etwas völlig Neues: die Möglichkeit, Musik als Idee und nicht als Ausführung zu schaffen.

Stellen Sie sich einen unabhängigen Künstler vor, der ohne Studiobudget einen professionell klingenden Song im Stil von Massive Attack kreiert. Oder ein Indie-Entwickler, der mit ein paar Textzeilen einen Soundtrack für sein Videoprojekt generiert. Oder ein Student, der ein Lied über seine große Liebe schreibt und es im Stil der Arctic Monkeys hört.

Das ist keine Science-Fiction mehr – das ist Jukebox. Oder genauer: Jukebox, eine Version, die es noch nicht gibt. Aber wir alle wissen, dass es kommt.


Fazit: Manchmal entsteht der beste Sound aus der Stille vor der Premiere

Offiziell bestätigt ist noch nichts. OpenAI ist still, aber seine Stille ist verdächtig laut. Unter den Forschern herrscht eine ähnliche Stimmung wie bei den Alben von Kanye West – niemand weiß, wann sie erscheinen, aber alle schreiben bereits Rezensionen. Wenn Jukebox 2.0 tatsächlich das ist, was die Gerüchte vorhersagen, könnten wir bald Lieder hören, die nicht mehr auf der Inspiration eines Einzelnen basieren, sondern auf dem kollektiven Gedächtnis von Millionen von Liedern. Und das mit einer Stimme, die wir noch nie zuvor gehört haben, die uns aber überraschend vertraut vorkommt.


Mit anderen Worten: Wenn Sie das Gefühl haben, dass es in der Musik heutzutage nichts Neues gibt, haben Sie einfach noch ein wenig Geduld. Vielleicht wird der nächste Hit bereits generiert. Leise, langsam, in der Wolke. Und wenn es vorbei ist, wird es niemand singen – aber Sie werden trotzdem mitsingen.

Seit 2004 bei Ihnen

Ab 2004 Wir recherchieren urbane Trends und informieren unsere Follower-Community täglich über das Neueste aus den Bereichen Lifestyle, Reisen, Style und Produkte, die mit Leidenschaft begeistern. Ab 2023 bieten wir Inhalte in den wichtigsten Weltsprachen an.