fbpx

OpenAI Jukebox 2.0 : l'intelligence artificielle aura-t-elle enfin sa propre carrière musicale ?

Si ChatGPT écrit des essais et que DALL-E dessine des images, qui a dit que l'IA ne pouvait pas chanter aussi ?

Photo : Jan Macarol / Ai art

L’intelligence artificielle nous a déjà appris à rédiger correctement un CV, à écrire des e-mails, à dessiner des chats à la manière de Picasso et à résoudre des problèmes mathématiques complexes avec une facilité enfantine. Tout va bien. Mais OpenAI essaie désormais quelque chose qui va au-delà des feuilles de calcul Excel et des mèmes esthétiques : utiliser OpenAI Jukebox pour créer une chanson que les gens voudraient réellement entendre plus d'une fois.

Bien qu'il n'y ait pas de date de sortie officielle, la même question circule dans les cercles underground et de recherche technologique : Est-ce que c'est OpenAI vous préparez une nouvelle version de Jukebox – OpenAI Jukebox 2.0 ? Il s'agit du modèle expérimental d'intelligence artificielle qui a prouvé il y a des années qu'il pouvait composer une chanson, chanter les paroles et même imiter avec style Elton John, Nirvana ou quiconque s'est déjà produit sur MTV - le tout sans une seule note humaine. Eh bien, du moins pas le genre qui proviendrait des cordes vocales réelles.

Aujourd’hui, quelques indices – sous la forme de publications universitaires, de pages GitHub discrètement mises à jour et de tweets « accidentellement » aimés – suggèrent qu’une nouvelle version de cette merveille musicale pourrait être en train de se produire. Peut-être bientôt. Peut-être fin avril. Peut-être seulement en été. Tout comme dans l'industrie musicale, la sortie est « TBA », mais le public attend déjà avec ses écouteurs sur les oreilles.

OpenAi Jukebox : une IA qui peut faire plus que simplement répéter le do majeur

Lorsque OpenAI a présenté Jukebox pour la première fois, les critiques ont à juste titre levé les sourcils. Un modèle qui génère de la musique à partir de zéro, y compris les voix, ressemble à un scénario futuriste qu'un producteur de musique avec trop de temps et trop peu d'artistes pourrait imaginer. Mais le Jukebox a fonctionné. En analysant plus d’un million de chansons – y compris les paroles, les genres, les artistes et même l’année de sortie – il a créé une nouvelle forme de composition musicale : une forme qui ne repose pas sur des instruments, mais sur des données.

Le modèle n'a pas créé de notes, mais du son. Et cela directement au format audio, en qualité d'enregistrement studio. Vous avez écouté une chanson qui n'a jamais existé, mais quelqu'un pourrait facilement la confondre avec une démo perdue de Radiohead de 1998.

Photo : Jan Macarol / OpenAi

Comment naît un poème artificiel ? Lentement, patiemment et avec plusieurs couches de transformateurs

Techniquement parlant, Jukebox fonctionne en codant d’abord le son brut dans un langage symbolique compressé – une approximation de l’ADN musical. Cet enregistrement codé est ensuite traité par trois niveaux de réseaux neuronaux, chacun contribuant à sa manière à la mélodie, au rythme, au chant et à la texture sonore. L'étape finale est le décodage inverse – où l'IA replie littéralement l'onde sonore et crée quelque chose qu'un humain peut entendre, mais l'IA se contente de « prédire ».

L'ensemble fonctionne comme une sorte de studio numérique, où le producteur n'a jamais besoin de pause, le chanteur ne bégaie jamais et l'inspiration de l'auteur ne dépend pas de la météo. Le seul problème : générer une chanson dans sa forme actuelle prend près de neuf heures pour une seule minute d’audio. Ce qui signifie que Jukebox est désormais davantage un compositeur de symphonies au ralenti qu'un créateur de tubes instantanés.

Que suggèrent les rumeurs sur la nouvelle version ?

Ces dernières semaines, l'activité des développeurs associés à la division audio d'OpenAI s'est accrue. Des journaux de validation sont apparus sur GitHub mentionnant des optimisations de modèles. Plusieurs chercheurs ont laissé entendre dans des podcasts (et encore plus dans des conversations informelles sur X/Twitter) que des travaux sont en cours sur nouvelle architecture, qui est censé permettre une génération plus rapide, une meilleure articulation vocale, la prise en charge de plusieurs langues et – ce qui est particulièrement intéressant – une meilleure compréhension de la structure des chansons.

Cela signifie que la nouvelle version pourrait, pour la première fois, générer des chansons avec des refrains, des intros, des ponts et des fins clairement définis – quelque chose que vous entendez dans une vraie chanson, pas dans un croquis numérique.

Ajoutez à cela les rumeurs d’une interface utilisateur plus accessible et d’une intégration avec d’autres outils créatifs (tels que les API pour les créateurs de contenu), et cela devient clair : quelque chose mijote, et ce n'est pas loin.

Jukebox OpenAI
Photo : Jan Macarol / OpenAi

L'IA dans la musique : assistante ou concurrente ?

La nouvelle version de Jukebox relance la question classique : l'intelligence artificielle remplace-t-elle la créativité ou l'étend-elle ? Les critiques diront qu’il s’agit d’une décontextualisation technologique de l’art – un poème sans âme, une émotion sans expérience. Mais les défenseurs seront ravis, car Jukebox offre quelque chose de complètement nouveau : la possibilité de créer de la musique comme une idée, et non comme une exécution.

Imaginez un artiste indépendant créant une chanson de style Massive Attack au son professionnel sans budget studio. Ou un développeur indépendant qui génère une bande sonore pour son projet vidéo avec quelques lignes de texte. Ou un étudiant qui écrit une chanson sur son béguin et l'écoute dans le style d'Arctic Monkeys.

Ce n’est plus de la science-fiction, c’est du Jukebox. Ou plus précisément : Jukebox, une version qui n'existe pas encore. Mais nous savons tous que cela arrive.


Conclusion : Parfois, le meilleur son vient du silence avant la première

Rien n'a encore été officiellement confirmé. OpenAI est silencieux, mais son silence est étrangement fort. L'atmosphère parmi les chercheurs est similaire à celle des albums de Kanye West - personne ne sait quand il sortira, mais tout le monde écrit déjà des critiques. Si Jukebox 2.0 est bien ce que les rumeurs prédisent, nous pourrions bientôt entendre des chansons qui ne sont plus basées sur l’inspiration d’un seul individu, mais plutôt sur la mémoire collective de millions de chansons. Et cela avec une voix que nous n'avons jamais entendue auparavant, mais qui semble étonnamment familière.


En d'autres termes : si vous avez l'impression qu'il n'y a rien de nouveau dans la musique ces jours-ci, soyez encore un peu patient. Peut-être que le prochain hit est déjà en train d’être généré. Tranquillement, lentement, dans le nuage. Et quand ce sera fini, personne ne le chantera, mais vous continuerez à chanter.

Avec vous depuis 2004

De l'année 2004 nous recherchons les tendances urbaines et informons quotidiennement notre communauté d'adeptes des dernières nouveautés en matière de style de vie, de voyage, de style et de produits qui inspirent avec passion. À partir de 2023, nous proposons du contenu dans les principales langues mondiales.