O Google revelou um novo modelo de inteligência artificia (IA), chamado Gemini 2.0 Flash Thinking, que promete responder a perguntas complexas enquanto detalha os passos que utiliza para chegar às soluções. Segundo o TechCrunch, esse modelo experimental, ainda em desenvolvimento, deve competir diretamente com o modelo de raciocínio o1 da OpenAI.
Jeff Dean, cientista-chefe da Google DeepMind, compartilhou no X (antigo Twitter) que o Gemini 2.0 Flash Thinking é “treinado para usar pensamentos para fortalecer seu raciocínio”. Além disso, ele se beneficia da velocidade da versão aprimorada do modelo Gemini Flash 2.0. Um dos exemplos mostrados por Dean é uma demonstração na qual o modelo resolve um problema de física. Durante o processo, o modelo “pensa” de forma estruturada, dividindo a tarefa em várias etapas antes de apresentar a solução.
Leia também: Após biênio de crescimento, Grupo Kakau quer internacionalização para os EUA e América Latina
Embora essa abordagem não reproduza o raciocínio humano exatamente como ele ocorre, a capacidade do modelo de decompor problemas complexos em subtarefas menores representa um avanço significativo. Essa técnica de “dividir para conquistar” pode gerar respostas mais precisas e bem elaboradas.
Outro exemplo foi publicado por Logan Kilpatrick, líder de produto do Google, mostrando como o Gemini 2.0 Flash Thinking aborda um problema que combina elementos visuais e textuais. Nesse caso, o modelo demonstrou capacidade de analisar e integrar informações de diferentes formatos para alcançar a resposta correta. “Este é apenas o primeiro passo em nossa jornada de raciocínio”, afirmou Kilpatrick.
Os interessados podem experimentar o Gemini 2.0 Flash Thinking no Google AI Studio, plataforma onde o modelo está disponível para testes.
Avanço do Gemini 2.0 e corrida pela IA “agentic”
O Gemini 2.0 Flash Thinking é parte de uma atualização mais ampla no modelo Gemini 2.0, anunciada pelo Google no início deste mês. Essas atualizações refletem o foco da empresa no desenvolvimento de uma IA “agentic”, ou seja, capaz de agir com maior autonomia e iniciativa. A introdução do Flash Thinking demonstra a busca do Google por criar sistemas de IA que não apenas respondam a perguntas, mas que também expliquem e justifiquem como chegaram às respostas.
Essa abordagem de “raciocínio explícito” está se tornando uma área de intensa competição no campo da IA. Recentemente, a OpenAI disponibilizou a versão completa do modelo de raciocínio o1 para assinantes do ChatGPT, oferecendo capacidades similares de análise estruturada. O Gemini 2.0 Flash Thinking, portanto, surge como uma resposta do Google para manter sua relevância em um setor que avança rapidamente.
O que diferencia o Gemini 2.0 Flash Thinking
Uma das características do novo modelo do Google é sua capacidade de integrar informações complexas provenientes de diferentes formatos, como texto e imagens. Essa habilidade, demonstrada nos exemplos divulgados, sugere que o modelo pode ser utilizado em uma ampla gama de aplicações práticas, desde resolver problemas acadêmicos até apoiar análises complexas em áreas como saúde, engenharia e finanças.
Além disso, a capacidade do Gemini 2.0 Flash Thinking de mostrar “seus pensamentos” pode melhorar a transparência e a confiabilidade dos sistemas de IA. Para muitas empresas e usuários, a explicação detalhada das decisões tomadas por um modelo é essencial, especialmente em aplicações críticas em que erros podem ter grandes consequências.
Siga o IT Forum no LinkedIn e fique por dentro de todas as notícias!