Tech

Spotify e OpenAI lançam recurso de tradução de voz para podcasts

O Spotify, em parceria com a OpenAI, lançou hoje (26) recurso inovador de tradução de voz com IA para podcasts. Tecnologia visa democratizar o acesso às narrativas, mantendo autenticidade da voz do criador

Por Vinicius G. Melo

26 set, 2023

Líder global em streaming de música e podcasts, Spotify, une forças com a OpenAI e lança recurso de tradução de voz com IA que promete revolucionar mundo dos podcasts. Utilizando o Whisper, tecnologia de reconhecimento e geração de voz da OpenAI, novo recurso permite que os usuários ouçam episódios de podcasts traduzidos para seu idioma, sem necessidade de legendas.

_{Lex Fridman, um dos criadores que fizeram parte do piloto da tradução de voz do Spotify, brincou no X/Twitter: “Esse sou eu falando espanhol“. (Foto: Reprodução/X/@lexfridman)}

Parceria para superar barreiras linguísticas

Spotify lançou nesta terça-feira (26) recurso de tradução de voz, para tornar podcasts mais acessíveis a um público global. Ziad Sultan, vice-presidente de personalização do Spotify, publicou:

“O lançamento da tradução por voz hoje tem um significado especial para mim. Cresci entre três continentes e culturas, lidando de perto com as barreiras linguísticas. Agora você pode ouvir ideias e debates inspiradores de podcasters do mundo todo falando o seu idioma, com a sua própria voz. Tecnologia de ponta aplicada a um objetivo atemporal: a conexão humana.”

Sultan é VP de personalização do Spotify e lidera uma equipe de mais de 500 profissionais responsáveis por tornar a experiência do Spotify única para cada usuário. A equipe de personalização usa aprendizado de máquina e outras tecnologias para fornecer recomendações para os usuários e ajudar criadores a desenvolver uma base de fãs.

Sultan cresceu entre três continentes e culturas: Líbano, França e Estados Unidos. Ele é graduado pelo Massachusetts Institute of Technology (MIT) e, antes de ingressar no Spotify, trabalhou como líder de produto na Google, com o Google News.

“Acreditamos que uma abordagem cuidadosa da IA pode ajudar a construir conexões mais profundas entre ouvintes e criadores“, afirmou Sultan no comunicado de lançamento do Spotify.

Como a IA pode mudar a forma como ouvimos podcasts

A OpenAI, conhecida por suas inovações em IA, como o ChatGPT, é desenvolvedora do Whisper, modelo de reconhecimento automático de fala (ASR) gratuito e de código aberto, para reconhecimento de fala, tradução e transcrição. O Whisper foi lançado pela Openai em setembro do ano passado, sendo treinado com 680.000 horas de dados multilíngues e multitarefa.

Whisper, modelo para reconhecimento de voz, transcrição e tradução, foi lançado pela OpenAI em setembro de 2022

_{Whisper, modelo open-source para reconhecimento de voz, tradução e transcrição foi lançado em setembro do ano passado pela OpenAI. (Foto: Reprodução/openai.com)}

O modelo integra o novo recurso de tradução de voz do Spotify — ele é um modelo de aprendizado de máquina, podendo ser usado no desenvolvimento de outros aplicativos de reconhecimento de fala.

A tradução de voz com IA é uma alternativa mais rápida e barata à dublagem, mas pode não ser tão natural ou precisa. No entanto, a tradução de voz com IA está se tornando cada vez mais precisa e acessível, e pode ser uma opção viável para tornar o conteúdo audiovisual mais acessível a um público global.

A principal diferença entre as duas é que a dublagem é feita por um humano, enquanto a tradução de voz com IA é feita por uma máquina.

Recurso foi lançado hoje (26) para usuários Premium e gratuitos

_{Episódios de podcasts de Dax Shepard, Bill Simmons e Steven Bartlet foram disponibilizados pelo Spotify. (Foto: Reprodução/spotify.com)}

Novo recurso foi testado com um grupo de criadores, como Dax Shepard, Monica Padman, Lex Fridman, Bill Simmons e Steven Bartlet, e será disponibilizado para usuários Premium e gratuitos do Spotify.

“Hoje é apenas o começo. Estamos animados em capacitar criadores a levarem suas histórias para mais ouvintes no mundo todo. O feedback dos criadores e do público do piloto fornecerá insights importantes para futuras expansões (…) Na medida que o número de pessoas (mais de 100 milhões) que ouvem podcasts no Spotify continua a crescer, continuaremos explorando novas maneiras de superar as barreiras narrativas”, afirma o comunicado do Spotify.

Episódios traduzidos para espanhol, francês e alemão serão lançados ao longo das próximas semanas.

Foto Destaque: Spotify lançou hoje (26) recurso de tradução de voz com IA para podcasts. Reprodução/spotify.com