DeepSeek mostra que futuro da IA ainda não tem dono

joabe antonio de oliveira
fevereiro 1, 2025

Compartilhe esta postagem

Receba nosso boletim

Camila de Lira

9 minutos de leitura

Quando gigantes como OpenAI, Meta e Google pareciam ter escrito o roteiro da corrida pela inteligência artificial, uma startup chinesa entrou em cena para reescrever essa narrativa. Com um sistema em código aberto, a DeepSeek mostra que o futuro da IA não tem dono.

A startup chinesa lançou seus próprios grandes modelos de linguagem (LLM), o V-3 e o R1, com resultados comparáveis aos do Gemini, do Google e do Chat GPT-4, da Open AI. Longe de ser uma big tech, a DeepSeek usou 27 vezes menos recursos computacionais do que a companhia de Sam Altman. E até 35 vezes menos recursos do que o Google.

O R1 também é um modelo de pensamento, no qual o algoritmo é capaz de gerar raciocínio. Apenas OpenAI e Google tinham este tipo de LLM. O sistema chinês foi arquitetado para operar em chips três vezes menos potentes do que os utilizados pelas grandes companhias de tecnologia norte-americanas. Até então, acreditava-se que hardwares de “médio porte” não tinham capacidade para treinar grandes modelos de IA.

Em outras palavras, diferentemente do que as grandes empresas de tecnologia pregavam, não são necessários bilhões de dólares e acesso aos chips mais recentes (e caros) da NVIDIA para inovar. Na verdade, o campo está aberto para a competição. E o futuro da IA está longe de ser definido.

“É a prova para aqueles que achavam que a OpenAI já tinha ganho a corrida. A corrida nem começou ainda”, diz o brasileiro Marcellus Amadeus, cientista da Universidade de Stanford e empreendedor de startups de inteligência artificial.

Amadeus é chefe de tecnologia da Amadeus AI e especialista em desenvolvimento de LLMs. O pesquisador explica que a DeepSeek não foi um “momento Sputnik”, já que a empresa usou técnicas conhecidas pela comunidade de IA.

O sistema foi lançado em licença “open-weight”, a versão “código aberto” da IA. A companhia não compartilha os dados de treinamento do algoritmo, mas divide como o algoritmo “raciocina” e como é treinado. Duas informações essenciais que empresas do setor costumam deixar trancadas.

A falta dos dados de treinamento abriu espaço para a OpenAI acusar a DeepSeek de roubo de propriedade intelectual. Segundo a companhia de Sam Altman, o V3 usou informações do ChatGPT-4 e infringiu os direitos autorais da companhia.

“Ironicamente, a OpenAI responde por vários processos com a mesma acusação”, lembra Amadeus.

FUTURO DA IA: DE ONDE VEM A INOVAÇÃO

De acordo com o paper da companhia, o custo final para testar o modelo de IA foi de US$ 5,6 milhões. O valor não leva em conta os gastos com infraestrutura, mão de obra e geração de dados sintéticos. De qualquer forma, ele contrasta com os recentes US$ 191 mihões gastos pelo Google para treinar o novo Gemini, por exemplo.

Há menos de uma semana, o governo norte-americano e a OpenAI lançaram o projeto Stargate, com planos de investir US$ 500 bilhões em infraestrutura para IA. Para o cientista-chefe da TDS , Silvio Meira, o anúncio de Trump “deixou de fazer sentido”.

Meira é um dos fundadores do Porto Digital e um dos principais pesquisadores brasileiros de inteligência artificial. Para ele, um dos pontos mais importantes da inovação da DeepSeek é o sistema de “destilamento”, que reduz a quantidade de dados que o algoritmo precisa receber para aprender.

o sucesso da DeepSeek é a prova de que países emergentes podem competir no mercado de IA.

Além disso, a DeepSeek criou um sistema menos complexo de aprendizado de reforço para o algoritmo. O sistema aprende com reforços positivos, em vez de receber todos os dados para aprender. Assim, ele não só usa menos dados, como também aprende a aprender. O que os próprios pesquisadores da startup chinesa chamaram de “aha moment”.

A empresa olhou para a escassez que enfrentava e arquitetou a tecnologia a partir disso. A IA da DeepSeek foi pensada para usar o máximo do processamento dos chips, como também usar menos dados. “Inovar é fazer o que funciona bem com o recurso que a gente tem”, diz Meira.

Por ser de código aberto, é uma tecnologia que pode ser aplicada e replicada. E tem um poder exponencial: quanto mais pessoas usam, mais o modelo “re-aprende”.

Na visão de Meira, a inteligência artificial saiu da fase do desenvolvimento e está no momento de ganho de escala. Para atingir mais usuários, os custos precisam cair. As mudanças da DeepSeek fizeram o custo para a saída de um milhão de tokens – ou seja, a quantidade de informação que a IA retorna – cair de US$ 60 para US$ 2.

Com isso, a expectativa é de que, nos próximos meses, novas “DeepSeeks” aconteçam. “O modelo provou que, no futuro próximo, poderemos criar modelos de IA em um laptop e a um custo muito mais possível”, diz o pesquisador.

Isso tudo levou à perda de valor de mercado de US$ 1 trilhão das companhias de tecnologia norte-americanas, principalmente da Nvidia, em apenas um dia. Muitos estão recalculando os valores e as projeções de receita. Parte do valor das empresas foi recuperado ao longo da semana.

A OpenAI foi avaliada em US$ 340 bilhões nesta sexta-feira (dia 31), depois de conversas sobre uma nova rodada de investimentos.

FUTURO DA IA: E O BRASIL?

A IA “mais barata” tem impactos diretos em mercados como o brasileiro, que dependem de infraestrutura de gigantes da tecnologia para criar seus modelos. Em comunicado à imprensa, a ministra de ciência, tecnologia e informação, Luciana Santos, afirmou que o sucesso da DeepSeek é a prova que “países emergentes podem competir no mercado de IA”.

“O aspecto mais importante dessa nova tecnologia é mostrar que o volume de recursos necessário para competir em IA não é inalcançável para países como o nosso”, disse Luciana, em comunicado. O ministério anunciou, no ano passado, o Plano Brasileiro de IA (PBIA), que prevê a criação de um supercomputador brasileiro.

A iniciativa da DeepSeek é um convite para especular futuros possíveis a partir de outras perspectivas além da do Norte Global.

Na visão de Silvio Meira, o PBIA é consistente, mas o Brasil pode aprender ainda mais com o esforço chinês. “O que eles conseguiram não é mágica, é pesquisa”.

A China investiu em formação de profissionais da área de ciências, matemática e tecnologia. De 2018 até 2024, o país criou mais de dois mil programas de graduação e pós-graduação em IA, a maioria deles nas suas universidades de elite.

De acordo com a Organização Mundial de Propriedade Intelectual, mais de 38 mil patentes de IA foram registradas na China de 2014 a 2023. O segundo lugar do ranking é dos Estados Unidos, com pouco mais de seis mil registros. De 2019 a 2022, a China deixou de ter 29% para ser o lugar de formação de 47% dos principais pesquisadores de IA.

“A DeepSeek foi ação da iniciativa privada, especificamente de um hedge fund [empresa de investimento em ativos de risco]. Por que os bancos, que têm lucros gigantescos no Brasil, não estão investindo em desenvolver IA?”, provoca Meira.

DEEPSEEK: PERGUNTAS SEM RESPOSTAS

O modelo chinês tem limitações nada desprezíveis. Assim como todo grande modelo de linguagem, o da DeepSeek tem um viés, já que a IA aprende a partir de dados históricos.

“No caso da DeepSeek, percebemos ainda uma camada de censura, ou controle de narrativas, que adequa respostas ao posicionamento do governo chinês”, explica a especialista em sustentabilidade e inteligência artificial Gabriella Seiler.

Quando perguntado sobre o massacre na Praça da Paz Celestial, por exemplo, o modelo sugere “falar de outro assunto”. Se a questão é sobre Taiwan ou o Tibete, a resposta que a IA dá é que eles fazem parte da China.

Gabriella está construindo um novo Centro de Ciência e Política para Ecologia Tropical com o Instituto Serrapilheira e atuando como consultora de IA e segurança digital do Instituto Igarapé e do Instituto Tecnologia e Sociedade. Para ela, o aspecto frágil do modelo da DeepSeek pode ser revertido por conta do código aberto.

Tanto usuários podem usar o código para criar seus LLMs “sem censuras”, como também podem usar a transparência do código aberto para acompanhar melhor o posicionamento e o controle de discurso do regime chinês.

Há questões ainda sobre a privacidade e uso dos dados. Os termos e as condições de uso da IA indicam que algumas informações, como os prompts de entrada e até os padrões e ritmos de escrita, são coletadas pela DeepSeek. Tais ações fizeram o sistema ser proibido na Itália.

A DeepSeek mostra que o volume de recursos para competir em IA não é inalcançável para países como o Brasil.

Do ponto positivo da transparência, há a própria arquitetura do sistema, que demonstra a racionalidade e a “cadeia de pensamentos” da IA para o usuário.

A brasileira Aline Sordilli usa o sistema há um mês. Ela é mentora, professora e pesquisadora de inteligência artificial. Com 30 anos de experiência no mercado de comunicação, a executiva atua como consultora de aplicação de IA para empresas.

Na sua visão, ver o caminho que o sistema usa para chegar nas respostas dá chances para o usuário entender e, inclusive, discordar dos resultados. No ano passado, Aline passou um mês na China, em uma imersão do setor de tecnologia do país. “O mundo ainda não está vendo nada”, afirma.

UMA LUZ NO FIM DO ALGORITMO

Em tempos de Donald Trump e da “broligarquia”, desafiar as big techs tem também um peso geopolítico. Não foram poucas as pessoas que usaram o termo “momento Sputnik da IA”, comparando o lançamento da DeepSeek com o da espaçonave russa em órbita, na época da Guerra Fria.

Para a pesquisadora em direito digital e inteligência artificial Horrara Moreira, a questão levantada pela DeepSeek é mais profunda do que apenas política. “Acendeu uma chama de esperança, um convite para especular futuros possíveis a partir de outras perspectivas além da do Norte Global”, diz.

Horrara foi coordenadora da campanha “Tire Meu Rosto da Sua Mira”, que ganhou o Prêmio Internacional de Defensor da Privacidade EPIC em 2024. Ela diz que a startup chinesa lança um grande “e se…” para o mercado.

“E se a IA for mais acessível? E se houver soluções de código aberto? E se existirem mais arranjos para experimentar? E se a tecnologia não precisar das big techs?”, reflete. E se?

SOBRE A AUTORA

Camila de Lira é jornalista formada pela ECA-USP, early adopter de tecnologias (e curiosa nata) e especializada em storytelling para n… saiba mais

Source link