FBピクセル

OpenAI Jukebox 2.0: 人工知能はついに独自の音楽キャリアを獲得するのか?

ChatGPT がエッセイを書き、DALL-E が絵を描くのなら、AI は歌えないなんて誰が言えるでしょうか?

写真: ジャン・マカロル / Ai art

人工知能はすでに私たちに、履歴書を適切に作成する方法、電子メールを書く方法、ピカソ風に猫を描く方法、複雑な数学の問題を子供のように簡単に解く方法などを教えてくれています。すべて順調です。しかし、OpenAI は現在、Excel スプレッドシートや見た目に美しいミームの先を行くことを試みています。OpenAI Jukebox を使用して、人々が実際に何度も聴きたくなる曲を作成することです。

正式なリリース日はまだ発表されていないものの、テクノロジーアンダーグラウンドや研究界では同じ疑問が飛び交っている。 それは OpenAI Jukebox の新バージョン、OpenAI Jukebox 2.0 の準備はできていますか? これは、何年も前に、人間の音符を一切使わずに、曲を作曲し、歌詞を歌い、さらにはエルトン・ジョンやニルヴァーナ、あるいは MTV でパフォーマンスしたことがある誰かをスタイリッシュに模倣できることが証明された実験的な人工知能モデルです。まあ、少なくとも実際の声帯から発せられる種類の音ではありません。

現在、学術論文、ひっそりと更新された GitHub ページ、そして「偶然に」いいねされたツイートといった形で現れたいくつかのヒントから、この音楽の驚異の新たなバージョンが生まれつつあるかもしれないことが示唆されている。たぶんもうすぐ。たぶん4月末。たぶん夏だけでしょう。音楽業界と同じように、リリースは「未定」ですが、観客はすでにヘッドフォンをつけて待っています。

OpenAi Jukebox: ハ長調を繰り返す以上のことができるAI

OpenAI が初めて Jukebox を導入したとき、批評家たちは当然ながら眉をひそめた。ボーカルも含めて音楽をゼロから生成するモデルは、時間が有り余っていてアーティストが少なすぎる音楽プロデューサーが思いつくような未来的なシナリオのように聞こえます。しかし、ジュークボックスは動作しました。歌詞、ジャンル、アーティスト、リリース年まで含めて100万曲以上の楽曲を分析することで、楽器ではなくデータに基づいた新しい形式の音楽作曲を生み出しました。

モデルは音符ではなく音を作成しました。そして、これはスタジオ録音品質で直接オーディオ形式で提供されます。これまで存在しなかった曲を聴きましたが、誰かがそれを 1998 年に失われたレディオヘッドのデモと簡単に間違える可能性があります。

写真: ジャン・マカロル / OpenAi

人工詩はどうやって生まれるのか?ゆっくりと、辛抱強く、そして多層の変圧器で

技術的に言えば、Jukebox はまず生のサウンドを圧縮された記号言語 (音楽の DNA の近似値) にエンコードすることによって機能します。このエンコードされた録音は、3 つのレベルのニューラル ネットワークによって処理され、それぞれが独自の方法でメロディー、リズム、ボーカル、サウンド テクスチャに貢献します。最後のステップは逆デコードです。AI は文字通り音波を折り返して人間が聞き取れる音を作成しますが、AI は単に「予測」するだけです。

全体としては、一種のデジタルスタジオのように機能し、プロデューサーは休憩を必要とせず、歌手はどもることがなく、作者のインスピレーションは天候に左右されません。唯一の問題は、現在の形式では 1 分間のオーディオを生成するのに 9 時間近くかかることです。つまり、今やジュークボックスは、瞬く間にヒット曲を生み出すアーティストというよりは、スローモーション交響曲の作曲家ということになる。

新しいバージョンについての噂は何を示唆しているのでしょうか?

ここ数週間、OpenAI のオーディオ部門に関連する開発者の間で活動が活発化しています。モデルの最適化について言及したコミット ログが GitHub に表示されました。何人かの研究者がポッドキャスト(さらにはX/Twitterでの非公式な会話)で、研究が進行中であることを示唆している。 新しい建築これにより、生成速度が速くなり、ボーカルの表現力が向上し、複数の言語がサポートされ、特に興味深いのは、曲の構造をよりよく理解できるようになるということです。

つまり、新バージョンでは初めて、明確に定義されたコーラス、イントロ、ブリッジ、エンディングを備えた曲を生成できるようになったということです。これは、デジタルスケッチではなく、実際の曲で聞くことができるものです。

これに、よりアクセスしやすいユーザー インターフェースと他のクリエイティブ ツール (コンテンツ クリエイター向けの API など) との統合に関する噂を加えると、次のことが明らかになります。 何かが調理されている、それほど遠くありません。

OpenAI ジュークボックス
写真: ジャン・マカロル / OpenAi

音楽における AI: アシスタントか競争相手か?

Jukebox の新バージョンでは、「人工知能は創造性に取って代わるのか、それとも創造性を拡張するのか」という古典的な疑問が再び浮上します。批評家たちは、これは芸術の技術的な脱文脈化であり、魂のない詩であり、経験のない感情だと言うだろう。しかし、支持者たちは大喜びするだろう。なぜなら、ジュークボックスは、実行としてではなく、アイデアとして音楽を作り出す能力という、まったく新しいものを提供するからだ。

スタジオ予算なしで、プロフェッショナルなサウンドのマッシヴ・アタック風の曲を作成する独立系アーティストを想像してみてください。あるいは、数行のテキストでビデオ プロジェクト用のサウンド トラックを生成するインディー デベロッパーもいます。あるいは、好きな人について歌を書いて、アークティック・モンキーズのスタイルで聴く生徒もいます。

これはもうSFではありません。これはジュークボックスです。あるいはもっと正確に言えば: ジュークボックス、まだ存在しないバージョン。しかし、私たちは皆、それが来ることを知っています。


結論:最高の音は、初演前の静寂から生まれることもある

まだ公式には何も確認されていません。 OpenAIは沈黙しているが、その沈黙は疑わしいほどに大きい。研究者の間の雰囲気はカニエ・ウェストのアルバムの雰囲気に似ています。いつリリースされるかは誰も知りませんが、すでに全員がレビューを書いています。もしジュークボックス 2.0 が本当に噂通りのものならば、私たちはもうすぐ、一人の個人のインスピレーションではなく、何百万もの曲の集合的記憶に基づいた曲を聴くことになるかもしれない。これは私たちがこれまで聞いたことのない声ですが、驚くほど聞き覚えのある声です。


言い換えれば、最近の音楽には何も新しいものがないと感じるなら、もう少しだけ辛抱してください。もしかしたら、次のヒット作がすでに生まれているかもしれません。静かに、ゆっくりと、雲の中で。そして、それが終わっても、誰も歌わないでしょうが、あなたはまだ一緒に歌うでしょう。

2004 年からあなたとともに

年から 2004 私たちは都市のトレンドをリサーチし、情熱を刺激するライフスタイル、旅行、スタイル、製品の最新情報をフォロワーのコミュニティに毎日お知らせします。 2023 年からは、世界の主要言語でコンテンツを提供します。