Sora: o que é e como funciona o gerador de vídeos com IA

sora

Compartilhe esta postagem

Índice do Conteúdo

Receba nosso boletim

Novos contatos

nossa newsletter

Na última quinta, dia 15 de Fevereiro, o mundo das inteligências artificiais novamente mudou com o novo anúncio da OpenAI.

Em seu Twitter, Sam Altman, o CEO da OpenAI anunciou seu mais novo projeto, o Sora, que deve transformar por completo tudo o que conhecemos sobre criação audiovisual.

Técnicas de pesquisa

Sora é um modelo de difusão, que gera um vídeo começando com um que se parece com ruído estático e gradualmente o transforma, removendo o ruído ao longo de várias etapas.

Sora é capaz de gerar vídeos inteiros de uma só vez ou estender os vídeos gerados para torná-los mais longos. Ao fornecer ao modelo a previsão de muitos quadros ao mesmo tempo, resolvemos um problema desafiador de garantir que um objeto permaneça o mesmo quando sai temporariamente de vista.

Semelhante aos modelos GPT, Sora usa uma arquitetura de transformador, desbloqueando desempenho de escalabilidade superior.

Representamos vídeos e imagens como coleções de unidades menores de dados chamadas patches, cada uma delas semelhante a um token no GPT. Ao unificar a forma como representamos os dados, poderá treinar transformadores de difusão em uma gama mais ampla de dados visuais do que era possível antes, abrangendo diferentes durações, resoluções e proporções de aspecto.

Sora baseia-se em pesquisas anteriores em modelos DALL·E e GPT. Utiliza a técnica de recaptação do DALL·E 3, que envolve a geração de legendas altamente descritivas para os dados de treinamento visual. Como resultado, o modelo é capaz de seguir com mais fidelidade as instruções de texto do usuário no vídeo gerado.

Além de poder, gerar um vídeo apenas a partir de instruções de texto, o modelo é capaz de pegar uma imagem estática existente e gerar um vídeo a partir dela, animando o conteúdo da imagem com precisão e atenção aos pequenos detalhes. O modelo também pode pegar um vídeo existente e estendê-lo ou preencher os quadros ausentes. Saiba mais no relatório técnico da openai.

Sora serve de base para modelos que podem compreender e simular o mundo real, uma capacidade que acreditamos que será um marco importante para alcançar a AGI.

Em um primeiro momento, essa ferramenta pode parecer comum, já que seu objetivo é gerar vídeos a partir de texto, assim como o Pika Labs, que já falamos em outras news.

A diferença entre elas, é a qualidade dos vídeos.

Sora: o que é e como funciona o gerador de vídeos com IA
Sora: o que é e como funciona o gerador de vídeos com IA

O Sora não é apenas uma melhoria na criação de vídeos, é uma revolução.

Com o foco em ajudar as pessoas a resolver problemas que exigem interação no mundo real, a IA foi e está sendo treinada para compreender e simular o mundo físico em movimento.

Além disso, a ferramenta é capaz de gerar vídeos de até um minuto, com cenas complexas de vários personagens, tipos específicos de movimento e detalhes precisos.

O modelo tenta entender não apenas o que o usuário pediu no prompt, mas também como essas coisas existem no mundo físico, como podemos ver no exemplo abaixo:

Sora: o que é e como funciona o gerador de vídeos com IA

Pelo fato de só conseguir gerar três segundos, a Pika não conseguiu fazer metade do prompt, além de não ter levado em conta que o capacete precisa ser de lã, e não a roupa…

Outro ponto é a textura do personagem, que não parece realista.

Fizemos outro comparativo com o seguinte prompt divulgado pela OpenAI: “Um close extremo de um homem de cabelos grisalhos e barba na casa dos 60 anos, […]”

Sora: o que é e como funciona o gerador de vídeos com IA
Sora: o que é e como funciona o gerador de vídeos com IA

Como você pode ver, o Sora é MUITO superior.

Um ano atrás, uma IA de vídeo fazia isso:

Sora: o que é e como funciona o gerador de vídeos com IA

Hoje, ela faz produções sensacionais e realistas, como essas que você viu.

E apesar dos seus resultados impressionantes, precisamos ter em mente uma coisa: essa é só a primeira versão dela.

Assim como o Midjourney evoluiu de forma impressionante, esse novo modelo deve ir no mesmo ritmo, trazendo resultados cada vez mais realistas.

Estamos empolgados para o lançamento dessa tecnologia, que, atualmente, está disponível somente a um grupo seleto de artistas visuais, designers e cineastas – e a tendência é que só fique disponível para o público após as eleições americanas, para evitar fake news.

Sora: o que é e como funciona o gerador de vídeos com IA

Gemini Google: O futuro da inteligência artificial ao seu alcance(Abre numa nova aba do navegador)

Inteligência artificial: como funciona e como usar essa inovação de forma estratégica(Abre numa nova aba do navegador)

O que é marketing de IA? (Além disso, como qualquer empresa pode usá-lo)(Abre numa nova aba do navegador)

Como a inteligência artificial ajuda você a aumentar as vendas(Abre numa nova aba do navegador)

O que é o perfil comercial do Google? Guia do iniciante para GMB em 2023

Quando você faz parceria conosco para nossos serviços de marketing digital, ajudaremos você a aumentar suas classificações de pesquisa, tráfego do site, vendas e muito mais. Interessado em trabalhar com MidiaPro? Basta ligar para 21 97322-1936 ou entrar em contato on-line hoje mesmo!

assinatura jaobe antonio de oliveira e junior vargas

Assine a nossa newsletter

Receba atualizações e aprenda com os melhores

explore mais conteúdo

Top 10 KPIs de vendas para atingir metas em 2025
Estratégias de marketing

aprenda mais com vídeos

você que impulsionar seu negócio?

entre em contato conosco e saiba como

contatos midiapro
small_c_popup.png

Saiba como ajudamos mais de 100 das principais marcas a obter sucesso

Vamos bater um papo sem compromisso!