O Bard, chatbot da Google lançado em março, foi inicialmente alimentado pelo LaMDA e posteriormente pelo PaLM, modelos de linguagem que trouxeram aprimoramentos significativos na capacidade de diálogo e compreensão. Lançada na última quarta-feira (6), a implementação do modelo Gemini Pro no Bard, concorrente da Google para o ChatGPT, expande suas capacidades para além do processamento de texto e aumenta a sofisticação das respostas.
Conversação fluida com o LaMDA e multilinguismo com o PaLM
O Bard foi inicialmente alimentado pelo LaMDA (“Modelo de Linguagem para Aplicações de Diálogo”), anunciado em 18 de maio de 2021 e integrado ao chatbot no seu lançamento em março deste ano. O modelo LaMDA foi pioneiro ao permitir conversas fluidas e amplas, graças à sua arquitetura Transformer, desenvolvida pela Google em 2017. LaMDA destacou-se pela sua habilidade em gerar respostas contextualizadas e sensíveis, alinhadas aos princípios éticos da IA da Google, como interessância, factualidade e minimização de viés e desinformação.
Após a fase inicial com LaMDA, o Bard recebeu um upgrade significativo com a integração do PaLM 2 em maio. O PaLM ("Modelo de Linguagem Pathways") representou um avanço considerável nas famílias de modelos de linguagem da Google, com ênfase em multilinguismo, raciocínio lógico e habilidades de codificação. O PaLM 2 foi treinado em mais de 100 idiomas, abrangendo uma vasta gama de textos e demonstrando competência em resolver problemas complexos, inclusive matemáticos.
Chatbot da Google ganha capacidades multimodais com o Gemini
A mais recente atualização do Bard ocorreu com a integração do Gemini, um modelo de linguagem multimodal avançado, lançado na última quarta-feira. O Gemini chega em três versões: Ultra, Pro e Nano, cada uma otimizada para diferentes escalas de tarefas. A versão Pro foi implementada no Bard, melhorando significativamente suas capacidades em compreensão, síntese, raciocínio, escrita e planejamento.
O Gemini Pro combina e processa diferentes tipos de informações, incluindo texto, imagens, áudio, vídeo e código, abrangendo uma variedade de tópicos complexos e técnicos, além de se destacar na geração de código Python e na resolução de desafios de programação.
Modelo Gemini integrado ao Bard analisa a resposta de um aluno para um problema de física (Foto: reprodução/Google Deepmind)
A integração do Gemini Pro transforma o Bard em uma ferramenta de IA mais robusta e versátil, apta a lidar com uma gama diversificada de tarefas e informações. O Gemini Ultra, previsto para 2024, promete elevar ainda mais o padrão do Bard.
Foto Destaque: anúncio do modelo Gemini da Google (Reprodução/Google Deepmind)