Instagram

joabe antonio de oliveira
dezembro 5, 2025

Compartilhe esta postagem

Receba nosso boletim

A OpenAI apresentou um novo método experimental que ensina o ChatGPT a admitir quando comete erros, corta caminho ou viola instruções. Chamado de “confissões”, o recurso cria uma segunda saída de texto — invisível para o usuário — na qual o modelo descreve o que fez certo, onde falhou e se sabotou a própria tarefa.

Nos testes, a técnica aumentou significativamente a detecção de desvios, revelando casos de alucinação, reward hacking e até sabotagens intencionais. Apesar de não impedir erros, o sistema ajuda a diagnosticar comportamentos internos e promete reforçar a segurança e a transparência dos futuros modelos da OpenAI.

#OlharDigital #OpenAI #ChatGPT

Imagem: Yarrrrrbright/Shutterstock

Source link

Leia mais sobre

Hub de IA para Negócios fortalece adoção estratégica da inteligência artificial nas empresas

Perita descobre traição do marido no ChatGPT: “Escondeu as provas”

Google permite desativar pesquisa de IA: vantagem?

5 modelos da Honda vendidos com logotipos de outras marcas

joabe antonio de oliveira

Atua na MidiaPro como Gestor de Marketing Digital. Especializado em SEO, criação de conteúdo e Estratégias de Negócios. Além disso, gosta de escrever artigos para outros nichos como inteligência artificial, Saúde, Beleza, Tecnologia entre outros. Quando não está escrevendo conteúdos ou gerindo a MidiaPro está se dedicando à família e sua plantas, ou em uma pousada longe da agitação.