A OpenAI anunciou o lançamento dos modelos o1 e o1-mini, suas primeiras inteligências artificiais com habilidades avançadas de raciocínio. Utilizando a tecnologia internamente conhecida como Strawberry, esses modelos foram desenvolvidos para enfrentar tarefas complexas em áreas como ciência, matemática e programação.
Os novos modelos estarão disponíveis nas versões pagas do ChatGPT, com uma versão mini do o1 sendo incluída na versão gratuita em breve.
Os testes realizados pela companhia demonstraram um desempenho comparável ao de estudantes de doutorado em tarefas desafiadoras nas áreas de física, química e biologia. O modelo também se destacou em matemática e programação: em um exame de qualificação para a Olimpíada Internacional de Matemática (IMO), o GPT-4o acertou apenas 13% dos problemas, enquanto o modelo de raciocínio obteve 83%.
Dona do ChatGPT
O o1 foi lançado em modo de pré-visualização, o que significa que ainda não possui todas as funcionalidades integradas no ChatGPT, como o processamento de imagens e a busca de informações na web. A equipe da OpenAI acredita que este modelo representa um avanço significativo em termos de capacidades, justificando seu nome.
A OpenAI divulgou vídeos que mostram o novo modelo resolvendo problemas complexos e respondendo a perguntas simples que outros modelos não conseguiram.
A OpenAI afirmou que o o1 foi treinado com um conjunto de dados personalizado e um novo algoritmo de otimização. Diferente do GPT-4o e de modelos anteriores, o o1 não apenas replica padrões de formação, mas utiliza o aprendizado por reforço para resolver problemas de forma independente.
A empresa também destacou que o o1 é muito menos vulnerável a tentativas de contorno das suas salvaguardas, conhecido como jailbreaking. Em um teste rigoroso, o GPT-4o obteve 22 pontos em uma escala de 0 a 100, enquanto o modelo o1-preview alcançou 84 pontos.
Versão
O o1-mini é uma versão compacta e até 80% mais econômica do o1, com um desempenho particularmente notável em tarefas de programação. O tempo de resposta para uma simples resposta de texto pelo o1-mini é de 9 segundos, enquanto o o1 leva 32 segundos. Esse tempo adicional reflete o processo de pensamento e raciocínio mais aprofundado da nova IA.
Os assinantes do ChatGPT Plus e Team já podem acessar o o1 e o1-mini através do menu de seleção de modelos. Na próxima semana, os usuários dos planos Enterprise e Edu também terão acesso. A versão gratuita do ChatGPT incluirá o o1-mini, embora ainda não haja uma data definida para isso.