A corrida pela inovação no campo da inteligência artificial continua, desta vez com um novo competidor: Gemini, o mais novo modelo de linguagem multimodal (LLM) anunciado pelo Google, prometendo chegar com grande diferencial e até mesmo revolucionar o campo da GenAI.
A respeito do Gemini
Há meses tentando se juntar ao mercado já expansivo de inteligência artificial, o Google desenvolveu a Gemini justamente para competir com o GPT-4, que é o modelo de linguagem criado pela OpenAI e o responsável pela “febre das IAs” que estamos vivenciando agora, com o lançamento do ChatGPT.
O novo modelo promete ser mais promissor que a primeira tentativa da empresa em se juntar ao mercado, com o Bard. De acordo com o Google, esse sucessor espiritual tem a capacidade de organizar, compreender e processar informações diversas, conseguindo captar comandos não apenas de maneira textual ou por voz, como também através de imagens ou de linguagens de programação, como C# ou Python.
Gemini em funcionamento através do site do Bard, o LLM anterior desenvolvido pelo Google (Foto: reprodução/Google/Techtudo/Carolina Torres)
Demis Hassabis, CEO e cofundador da Google DeepMind, afirma que o Gemini pode ser categorizado como modelo de linguagem mais competente já desenvolvido até o momento, com a possibilidade de vir a se tornar o carro-chefe da empresa no futuro. Ou seja, o Google pretende basear uma gama diversa de produtos e serviços nessa inteligência artificial.
Gemini PRO
Além disso, foi anunciado nesta quarta-feira (13) o lançamento da versão Pro do modelo de linguagem, que está focada em auxiliar desenvolvedores e empresas, oferecendo três melhorias principais em relação à IA normal.
- Os desenvolvedores que tiverem interesse no Gemini Pro podem usufruir da LLM através de uma nova API pelo AI Studio, que é uma ferramenta gratuita do Google Workspace. Além disso, o código da IA está disponível para ser transferido para o Vertex AI, um aplicativo mais avançado com maior personalização e que oferece uso do Google Cloud.
- Através do uso do Gemini Pro, a equipe de desenvolvedores da LLM conseguiu aprimorar a funcionalidade de text-to-speech da inteligência artificial pelo Vertex AI, permitindo que ela consiga até mesmo gerar logos, emblemas e imagens abstratas.
- Acesso ao Duet AI, uma ferramenta de assistência para desenvolvedores feita pelo Google, com a capacidade de auxiliar os usuários a desenvolver aplicativos e escrever linhas de código com suporte integrado ao Gemini.
O Gemini Pro já está disponível em 180 países e 38 idiomas, com o Brasil incluso. E seguindo o anúncio inicial de lançamento da LLM, o Google informou que sua equipe de desenvolvedores já está trabalhando em uma versão ainda mais avançada, que deve ser anunciada ainda em 2024.
Foto destaque: foto do website oficial do Gemini visto em uma tela de iPhone (Reprodução/Shutterstock/Koshiro K/ItForum)