A OpenAI revelou recentemente uma nova família de modelos de inteligência artificial, a série o3, que promete avanços significativos em relação aos modelos anteriores, incluindo o o1. De acordo com a empresa, estas melhorias resultam de um aumento na capacidade computacional em tempo de teste e de uma nova abordagem de segurança no treino dos modelos da série o.
Uma das principais inovações na série o3 é o uso de “alinhamento deliberativo”, uma técnica que visa alinhar os modelos com os valores definidos pelos seus criadores. Esta metodologia permitiu ao o1 e ao o3 “refletir” sobre as políticas de segurança da OpenAI durante o processo de inferência, ou seja, enquanto geram respostas após o utilizador introduzir um pedido. O alinhamento reduziu significativamente a probabilidade de respostas “não seguras” e aumentou a capacidade de os modelos responderem, descreve a OpenAI num relatório citado pelo TechCrunch.
Os novos modelos da série o, incluindo o o3, usam um processo chamado “cadeia de pensamento” para resolver problemas complexos. Basicamente, os modelos dividem uma questão em passos menores e seguem as suas próprias diretrizes de segurança para garantir que as respostas sejam consistentes com os valores da OpenAI.
Apesar dos avanços, as medidas de segurança implementadas pela OpenAI continuam a gerar controvérsia. Personalidades como Elon Musk e Marc Andreessen questionaram se algumas destas práticas não se assemelham a censura, sublinhando a subjetividade envolvida em decidir o que é “seguro” ou “não seguro”, aponta a imprensa internacional.
GPT-5: atrasos e expectativas frustradas
Mas se a OpenAI celebra os progressos com o o3, enfrenta desafios no desenvolvimento do GPT-5, cujo codinome é Orion. Segundo o The Wall Street Journal, a evolução do GPT-5 tem sido mais lenta do que o esperado e os resultados ainda não justificam os elevados custos associados.
Após 18 meses de desenvolvimento e várias rondas de treino intensivo, o GPT-5 apresenta melhorias em relação aos seus antecessores, mas ainda não representa um salto significativo, como foi o caso de versões anteriores.
Além disso, o processo de treino revelou-se demorado e dispendioso, levando a OpenAI a recorrer a novas estratégias, como a geração de dados sintéticos com o modelo o1.