A OpenAI liberou a inteligência artificial Sora para usuários assinantes do ChatGPT Plus ou Pro. Ela é capaz de gerar vídeos a partir de pedidos, instruções e descrições em texto, como já acontece com modelos de imagens estáticas, como o Dall-E.
A Sora terá uma interface própria, independente de outros produtos da OpenAI. O início é com um pedido em texto, mas há opções para definir proporções da imagem, resolução, duração e variações geradas. Depois de selecionar uma das criações, é possível usar ferramentas para recortar, remixar ou até mesmo fazer alterações no prompt.
Neste primeiro momento, a Sora poderá criar vídeos de até 20 segundos em resolução 1080p. No entanto, haverá limitações, de acordo com o plano do usuário, por meio de um sistema de créditos.
Assinantes do ChatGPT Plus poderão gerar até 50 vídeos por mês na resolução 480p. Para criar peças em 720p, a duração e a quantidade de vídeos será reduzida. Já o plano Pro dará acesso a um uso dez vezes maior, com vídeos mais longos e resoluções maiores.
Segundo a OpenAI, a Sora estará disponível nos Estados Unidos e na maioria dos países em que o ChatGPT está disponível. Usuários europeus, porém, terão que esperar um pouco mais. Além de liberar o modelo, a OpenAI publicou um site dedicado à ferramenta. Por lá, os usuários poderão mostrar o que criaram e qual foi o prompt usado.
Sora ainda não está pronta e terá restrições
A Sora foi anunciada em fevereiro de 2024, mas só agora o público geral terá acesso ao modelo. Até então, apenas artistas convidados e equipes de testes de segurança puderam usar a ferramenta. Em novembro, alguns destes artistas vazaram um acesso ao gerador, como forma de protesto contra o tratamento recebido da OpenAI.
A companhia impôs algumas limitações para impedir usos nocivos da Sora, como bloqueios a conteúdos envolvendo abuso infantil e deepfakes sexuais. Além disso, os vídeos gerados contarão com uma marca d’água visível e metadados para identificação.
A empresa reconhece que a IA ainda tem limitações. Segundo o texto de lançamento, o modelo “frequentemente gera [situações com] física irrealista e tem dificuldade com ações complexas em longas durações”.
O youtuber Marques Brownlee, por exemplo, testou a Sora e considera que ela é excelente para criar paisagens e conteúdo estilizado, mas falha em pontos básicos de física, como permanência do objeto.
Com informações: OpenAI, Ars Technica, Engadget, Axios