fbpx

OpenAI Jukebox 2.0: A inteligência artificial finalmente terá sua própria carreira musical?

Se ChatGPT escreve ensaios e DALL-E desenha, quem disse que a IA também não sabe cantar?

Foto: Jan Macarol / Ai art

A inteligência artificial já nos ensinou como redigir um currículo corretamente, escrever e-mails, desenhar gatos no estilo de Picasso e resolver problemas matemáticos complexos com facilidade infantil. Tudo muito bem. Mas a OpenAI agora está tentando algo que vai além de planilhas do Excel e memes esteticamente agradáveis: usar o OpenAI Jukebox para criar uma música que as pessoas realmente queiram ouvir mais de uma vez.

Embora não haja uma data oficial de lançamento, a mesma pergunta está circulando nos círculos de pesquisa e no submundo da tecnologia: É isso OpenAI preparando para uma nova versão do Jukebox – OpenAI Jukebox 2.0? Este é o modelo experimental de inteligência artificial que anos atrás provou ser capaz de compor uma música, cantar a letra e até mesmo imitar com estilo Elton John, Nirvana ou qualquer um que já tenha se apresentado na MTV — tudo isso sem uma única nota humana. Bem, pelo menos não do tipo que viria das próprias cordas vocais.

Agora, algumas dicas — na forma de publicações acadêmicas, páginas do GitHub atualizadas discretamente e tuítes curtidos "acidentalmente" — sugerem que uma nova versão dessa maravilha musical pode estar acontecendo. Talvez em breve. Talvez no final de abril. Talvez somente no verão. Assim como na indústria musical, o lançamento ainda está "a confirmar", mas o público já está esperando com seus fones de ouvido.

OpenAi Jukebox: uma IA que pode fazer mais do que apenas repetir dó maior

Quando a OpenAI apresentou o Jukebox pela primeira vez, os críticos, com razão, levantaram sobrancelhas. Um modelo que gera música do zero, incluindo vocais, parece um cenário futurista que um produtor musical com muito tempo e poucos artistas imaginaria. Mas a Jukebox funcionou. Ao analisar mais de um milhão de músicas — incluindo letras, gêneros, artistas e até mesmo o ano de lançamento — ele criou uma nova forma de composição musical: uma que não se baseia em instrumentos, mas em dados.

O modelo não criou notas, mas som. E isso diretamente em formato de áudio, com qualidade de gravação de estúdio. Você ouviu uma música que nunca existiu, mas alguém poderia facilmente confundi-la com uma demo perdida do Radiohead de 1998.

Foto: Jan Macarol / OpenAi

Como nasce um poema artificial? Lentamente, pacientemente e com múltiplas camadas de transformadores

Tecnicamente falando, o Jukebox funciona primeiro codificando o som bruto em uma linguagem simbólica comprimida – uma aproximação do DNA musical. Essa gravação codificada é então processada por três níveis de redes neurais, cada uma contribuindo à sua maneira para a melodia, o ritmo, os vocais e a textura sonora. A etapa final é a decodificação reversa – onde a IA literalmente dobra a onda sonora de volta e cria algo que um humano pode ouvir, mas a IA apenas “prevê”.

Tudo funciona como uma espécie de estúdio digital, onde o produtor nunca precisa de uma pausa, o cantor nunca gagueja e a inspiração do autor não depende do clima. O único problema: gerar uma música em seu formato atual leva quase nove horas para um único minuto de áudio. O que significa que agora Jukebox é mais um compositor de sinfonias em câmera lenta do que um criador de sucessos instantâneos.

O que os rumores sobre a nova versão sugerem?

Nas últimas semanas, houve um aumento na atividade entre os desenvolvedores associados à divisão de áudio da OpenAI. Registros de confirmação apareceram no GitHub mencionando otimizações de modelo. Vários pesquisadores sugeriram em podcasts (e ainda mais em conversas informais no X/Twitter) que o trabalho está em andamento nova arquitetura, que supostamente permite geração mais rápida, melhor articulação vocal, suporte para vários idiomas e – o que é especialmente interessante – melhor compreensão da estrutura da música.

Isso significa que a nova versão pode, pela primeira vez, gerar músicas com refrãos, introduções, pontes e finais claramente definidos — algo que você ouve em uma música real, não em um esboço digital.

Adicione a isso os rumores de uma interface de usuário mais acessível e integração com outras ferramentas criativas (como APIs para criadores de conteúdo), e fica claro: alguma coisa está cozinhando, e não fica longe.

OpenAI Jukebox
Foto: Jan Macarol / OpenAi

IA na música: assistente ou concorrente?

A nova versão do Jukebox reabrirá a clássica questão: a inteligência artificial substitui a criatividade ou a expande? Os críticos dirão que é uma descontextualização tecnológica da arte – um poema sem alma, uma emoção sem experiência. Mas os defensores ficarão entusiasmados, porque o Jukebox oferece algo completamente novo: a capacidade de criar música como uma ideia, não como uma execução.

Imagine um artista independente criando uma música profissional no estilo Massive Attack sem orçamento de estúdio. Ou um desenvolvedor independente que gera uma trilha sonora para seu projeto de vídeo com algumas linhas de texto. Ou um aluno que escreve uma música sobre sua paixão e a ouve no estilo do Arctic Monkeys.

Isto não é mais ficção científica – isto é Jukebox. Ou mais precisamente: Jukebox, uma versão que ainda não existe. Mas todos nós sabemos que isso vai acontecer.


Conclusão: Às vezes, o melhor som vem do silêncio antes da estreia

Nada foi confirmado oficialmente ainda. O OpenAI é silencioso, mas seu silêncio é suspeitamente alto. O clima entre os pesquisadores é parecido com o dos álbuns de Kanye West: ninguém sabe quando será lançado, mas todo mundo já está escrevendo resenhas. Se o Jukebox 2.0 for realmente o que os rumores preveem, em breve poderemos ouvir músicas que não serão mais baseadas na inspiração de um único indivíduo, mas sim na memória coletiva de milhões de músicas. E isso com uma voz que nunca ouvimos antes, mas que soa surpreendentemente familiar.


Em outras palavras: se você acha que não há nada de novo na música atualmente, tenha mais um pouco de paciência. Talvez o próximo sucesso já esteja sendo gerado. Silenciosamente, lentamente, na nuvem. E quando terminar, ninguém vai cantar, mas você ainda vai cantar junto.

Com você desde 2004

A partir do ano 2004 pesquisamos tendências urbanas e informamos diariamente nossa comunidade de seguidores sobre as últimas novidades em estilo de vida, viagens, estilo e produtos que inspiram com paixão. A partir de 2023, oferecemos conteúdo nos principais idiomas globais.