Durante a Google I/0, evento de tecnologia que aconteceu na Califórnia, na última terça-feira, dia 14, a empresa divulgou ao mundo o “Projeto Astra”. Astra é um assistente virtual que interage com usuários em tempo real, como a Alexa, da Amazon. Porém a grande novidade do projeto do Google é a capacidade da IA de interagir com imagens do seu celular.
O Gemini vai “ver”?
Em uma demonstração durante o evento, é possível ver como o Astra funciona, através das imagens disponibilizadas pelo usuário ele identifica objetos e interpreta informações a partir do que “vê”. Através do seu código de programação avançado, o Gemini vai conseguir reconhecer diversos objetos e lugares do dia-a-dia das pessoas.
A tecnologia é bem similar ao assistente virtual proposto pela OpenAI na segunda-feira, um dia antes da apresentação do Google. Nos dois casos, o objetivo é de ter IA’s que se comunicam da mesma maneira que humanos, através de áudio, imagens e vídeos.
Sundar Pichai, CEO da Google disse que "A multimodalidade expande radicalmente as perguntas que podemos fazer e as respostas que receberemos". Confira o vídeo abaixo sobre a explicação de como o Astra funciona:
Vídeo explicativo da Google sobre o Projeto Astra (Reprodução/Youtube/Google)
Gerador de imagens e vídeos
Outra ferramenta que tem se desenvolvido nos últimos anos é a criação de conteúdo sintético através da Inteligência artificial. Com isso, a Google e a OpenAI estão avançando na geração de vídeos ultrarrealistas com 1080p de resolução e de mais de um minuto de duração. O novo modelo de inteligência artificial de vídeos do Google chama-se Veo, enquanto o OpenAI é chamado de Sora.
Nos dois casos, a criação de cenas detalhadas acontece por meio de comandos de texto. O Google irá disponibilizar o Veo a criadores selecionados nas próximas semanas e planeja incluir o recurso para a ferramenta Shorts, do Youtube.
Os anúncios foram feitos por Demis Hassabis, CEO do Google DeepMind, braço do Google dedicado a desenvolver sistemas de inteligência artificial. O gestor destacou o compromisso da empresa para a melhora dos assistentes virtuais se comunicam e entendem o contexto. Hassabis ainda ressaltou que a velocidade e latência das funcionalidades tem sido o maior desafio que o Gemini vem tentando superar.
Foto destaque: OpenAI com o chatGPT e a Google com Gemini (Reprodução/Pymnts)