Líder global em streaming de música e podcasts, Spotify, une forças com a OpenAI e lança recurso de tradução de voz com IA que promete revolucionar mundo dos podcasts. Utilizando o Whisper, tecnologia de reconhecimento e geração de voz da OpenAI, novo recurso permite que os usuários ouçam episódios de podcasts traduzidos para seu idioma, sem necessidade de legendas.
Lex Fridman, um dos criadores que fizeram parte do piloto da tradução de voz do Spotify, brincou no X/Twitter: "Esse sou eu falando espanhol". (Foto: Reprodução/X/@lexfridman)
Parceria para superar barreiras linguísticas
Spotify lançou nesta terça-feira (26) recurso de tradução de voz, para tornar podcasts mais acessíveis a um público global. Ziad Sultan, vice-presidente de personalização do Spotify, publicou:
“O lançamento da tradução por voz hoje tem um significado especial para mim. Cresci entre três continentes e culturas, lidando de perto com as barreiras linguísticas. Agora você pode ouvir ideias e debates inspiradores de podcasters do mundo todo falando o seu idioma, com a sua própria voz. Tecnologia de ponta aplicada a um objetivo atemporal: a conexão humana.”
Sultan é VP de personalização do Spotify e lidera uma equipe de mais de 500 profissionais responsáveis por tornar a experiência do Spotify única para cada usuário. A equipe de personalização usa aprendizado de máquina e outras tecnologias para fornecer recomendações para os usuários e ajudar criadores a desenvolver uma base de fãs.
Sultan cresceu entre três continentes e culturas: Líbano, França e Estados Unidos. Ele é graduado pelo Massachusetts Institute of Technology (MIT) e, antes de ingressar no Spotify, trabalhou como líder de produto na Google, com o Google News.
"Acreditamos que uma abordagem cuidadosa da IA pode ajudar a construir conexões mais profundas entre ouvintes e criadores", afirmou Sultan no comunicado de lançamento do Spotify.
Como a IA pode mudar a forma como ouvimos podcasts
A OpenAI, conhecida por suas inovações em IA, como o ChatGPT, é desenvolvedora do Whisper, modelo de reconhecimento automático de fala (ASR) gratuito e de código aberto, para reconhecimento de fala, tradução e transcrição. O Whisper foi lançado pela Openai em setembro do ano passado, sendo treinado com 680.000 horas de dados multilíngues e multitarefa.
Whisper, modelo open-source para reconhecimento de voz, tradução e transcrição foi lançado em setembro do ano passado pela OpenAI. (Foto: Reprodução/openai.com)
O modelo integra o novo recurso de tradução de voz do Spotify — ele é um modelo de aprendizado de máquina, podendo ser usado no desenvolvimento de outros aplicativos de reconhecimento de fala.
A tradução de voz com IA é uma alternativa mais rápida e barata à dublagem, mas pode não ser tão natural ou precisa. No entanto, a tradução de voz com IA está se tornando cada vez mais precisa e acessível, e pode ser uma opção viável para tornar o conteúdo audiovisual mais acessível a um público global.
A principal diferença entre as duas é que a dublagem é feita por um humano, enquanto a tradução de voz com IA é feita por uma máquina.
Recurso foi lançado hoje (26) para usuários Premium e gratuitos
Episódios de podcasts de Dax Shepard, Bill Simmons e Steven Bartlet foram disponibilizados pelo Spotify. (Foto: Reprodução/spotify.com)
Novo recurso foi testado com um grupo de criadores, como Dax Shepard, Monica Padman, Lex Fridman, Bill Simmons e Steven Bartlet, e será disponibilizado para usuários Premium e gratuitos do Spotify.
“Hoje é apenas o começo. Estamos animados em capacitar criadores a levarem suas histórias para mais ouvintes no mundo todo. O feedback dos criadores e do público do piloto fornecerá insights importantes para futuras expansões (…) Na medida que o número de pessoas (mais de 100 milhões) que ouvem podcasts no Spotify continua a crescer, continuaremos explorando novas maneiras de superar as barreiras narrativas”, afirma o comunicado do Spotify.
Episódios traduzidos para espanhol, francês e alemão serão lançados ao longo das próximas semanas.
Foto Destaque: Spotify lançou hoje (26) recurso de tradução de voz com IA para podcasts. Reprodução/spotify.com