O Google lançou a própria inteligência capaz de raciocinar, o Gemini 2.0 Flash Thinking Experimental. O novo modelo está disponível no AI Studio, plataforma de prototipagem de IA da empresa.
A nova IA é “a melhor opção para compreensão multimodal, raciocínio e programação”, segundo o Google. A empresa menciona que a ferramenta consegue “solucionar a maioria dos problemas mais complexos” em diferentes disciplinas, como programação, matemática e física.
“Ainda é uma versão inicial, mas podemos ver como o modelo lida com um puzzle complexo que envolve pistas visuais e textuais”, disse Logan Kilpatrick, líder de produto do AI Studio no Google. Abaixo, veja a demonstração compartilhada no X:
It’s still an early version, but check out how the model handles a challenging puzzle involving both visual and textual clues: (2/3) pic.twitter.com/JltHeK7Fo7
— Logan Kilpatrick (@OfficialLoganK) December 19, 2024
Atualmente, o Gemini 2.0 Flash Thinking Experimental está disponível para implementação em ferramentas de terceiros através do AI Studio. “Esse é apenas o primeiro passo na nossa jornada de IAs racionais”, pontuou Kilpatrcik em um post.
Segundo ele, o Gemini 2.0 Flash Thinking Experimental foi treinado para usar os próprios “pensamentos” para fortalecer sua capacidade de racionalização. “Vemos resultados promissores quando aumentamos o cálculo de tempo de inferência”, disse o cientista chefe do Google DeepMind.
Introducing Gemini 2.0 Flash Thinking, an experimental model that explicitly shows its thoughts.
Built on 2.0 Flash’s speed and performance, this model is trained to use thoughts to strengthen its reasoning.
And we see promising results when we increase inference time…
— Jeff Dean (@JeffDean) December 19, 2024
O novo modelo de IA do Google segue a mesma proposta do o1, da OpenAI — outro modelo capaz de “raciocinar”.
Diferente de modelos de linguagem tradicionais, esses modelos “racionais” são capazes de refletir sobre as próprias respostas. Teoricamente, o método torna as saídas mais precisas e confiáveis, reduzindo as chances de alucinações, mas aumenta significativamente o tempo de processamento e a demanda computacional.
Ainda é imperfeito
Embora seja capaz de revisar as próprias respostas, o Gemini 2.0 Flash Thinking Experimental continua limitado pela natureza probabilística de modelos de linguagem tradicionais.
Em um experimento simples, o site TechCrunch perguntou ao modelo quantas letras “R” existem na palavra “Strawberry” (“Morango”, em inglês). Erroneamente, o modelo respondeu: 2.
Portanto, a utilidade, a precisão e a confiabilidade desses modelos “racionais” variam, e pode não ser um salto tão significativo frente aos grandes modelo de linguagem tradicionais. A diferença, porém, é que a IA descreve exatamente o raciocínio que fez até chegar à conclusão.