O ritmo de desenvolvimento das tecnologias de inteligência artificial está passando por uma aceleração incomparável com o que já presenciamos no passado próximo, desde a popularização do ChatGPT, criado pela OpenAI, e inicialmente disponibilizado ao mercado em novembro do ano passado. Ainda há dúvidas entre os especialistas do ramo se a tecnologia irá vingar no futuro e se é aconselhável para a humanidade como um todo continuar seguindo nesse caminho, mas as invenções e possibilidades curiosas que a IA generativa proporciona são inegáveis. Recentemente, a Meta também entrou na corrida pelo aperfeiçoamento das inteligências artificiais e vêm mostrando resultados palpáveis.
Os diferenciais do novo produto
A companhia de Mark Zuckerberg lançou na quarta-feira (2) uma ferramenta de inteligência artificial que dá ao usuário a capacidade de criar músicas e sons do zero, baseando-se inteiramente em prompts por texto. A ferramenta foi batizada de AudioCraft e está disponível para ser usada por todos os usuários do Facebook. Com a divulgação da funcionalidade, a Meta principalmente convidou pesquisadores e profissionais de música para testar a novidade.
De acordo com informações divulgadas pela Meta, a ferramenta é um amálgama de três modelos de IA generativa diferentes: MusicGen, que consegue receber prompts de texto para criar músicas e melodias; AudioGen, que tem a mesma funcionalidade, mas com o diferencial de ser focado em sons mais generalizados, como o barulho de cães latindo, pássaros piando ou até mesmo o som de passos; e, por fim, a EnCodec, que foi implementada para ajudar a melhorar a qualidade dos sons gerados pelos outros dois modelos.
Today we're sharing details on AudioCraft, a new family of generative AI models built for generating high-quality, realistic audio & music from text. AudioCraft is a single code base that works for music, sound, compression & generation — all in the same place.
More details ⬇️
O twitter oficial do braço de IA da Meta divulgou o novo produto na quarta-feira (2), com algumas explicações a respeito de seu funcionamento
Para garantir a autenticidade e tornar as produções mais variadas, o MusicGen foi treinado usando mais de 20 mil horas de música licenciada de propriedade da Meta, enquanto o AudioGen foi treinado usando databases de efeitos sonoros públicos. Já o EnCodec está em circulação desde outubro de 2022, quando a Meta apresentou a proposta de uma ferramenta de inteligência artificial capaz de compactar e descompactar arquivos de áudio sem ocasionar na perda de qualidade, permitindo o compartilhamento fácil e rápido de arquivos. A ideia original do projeto era auxiliar em chamadas de voz, principalmente quando realizadas em uma situação de conexão fraca.
Com os avanços na tecnologia recente, os três modelos evoluíram e hoje são colocados em conjunto no novo produto da Meta, que auxiliará na criação de sons sintéticos e músicas que parecem reais.
A reação mista dos artistas
Claro, como tudo no campo de IA generativa, essa ferramenta surgiu acompanhada de uma nova rodada de críticas, já que apesar de alguns artistas terem a enxergado de maneira positiva, outros não estão tão felizes. O famoso rapper Drake, por exemplo, expressou sua insatisfação ao ter sua voz imitada através de um deepfake feito por inteligência artificial em um clipe viral do tiktok. Já outros, como Paul McCartney, mostraram-se entusiasmados com as possibilidades apresentadas por essa ferramenta — McCartney, inclusive, afirmou que pretende recriar uma das muitas icônicas músicas dos Beatles de 1969 com a ajuda de IA, usando até mesmo a voz finado do John Lennon.
Foto destaque: Logo da empresa Meta junto de alguns de seus produtos, como o Facebook e o Instagram. Reprodução/Meta