DeepSeek: como os chineses deram a volta nas Big Techs na corrida da AI

DeepSeek: como os chineses deram a volta nas Big Techs na corrida da AI

Compartilhe esta postagem

Índice do Conteúdo

Receba nosso boletim

Novos contatos

nossa newsletter

Tão bom quanto o ChatGPT, requer muito menos capacidade de computação, tem código aberto e é totalmente de graça.

É o DeepSeek R1, o sistema de inteligência artificial da startup chinesa DeepSeek que está causando furor – impressionando os cientistas de computação e sendo usado nos EUA como munição nos ataques contra a OpenAI, a criadora do ChatGPT.

“O DeepSeek é um dos avanços mais impressionantes que eu vi em toda minha vida – e é open source, uma enorme dádiva para o mundo,” tuitou Marc Andreessen, o engenheiro de software que fundou a firma de venture capital Andreessen Horowitz (hoje az16) e é aliado de Elon Musk nos embates contra Sam Altman, o CEO da OpenAI.

Andreessen já havia postado o comentário do cientista de dados Jim Fan, pesquisador da Nvidia, dizendo que “estamos vivendo em um período no qual uma empresa de fora dos EUA está mantendo viva a missão original da OpenAI – uma pesquisa de ponta e verdadeira aberta, que dê capacidade a todos.”

À parte a briga envolvendo Altman e seus detratores, a DeepSeek parece representar um desafio e tanto para a estratégia dos EUA e seu complexo de Big Techs – entre outros motivos, porque a startup chinesa conseguiu o feito apesar das restrições impostas pelo governo americano às exportações para a China dos chips mais sofisticados da Nvidia.

Os chineses dizem que o desenvolvimento do modelo custou US$ 6 milhões em capacidade computacional, menos de um décimo do gasto pela Meta na elaboração de seu mais recente sistema de AI, o Llama 3.2.

Enquanto Altman e outros empreendedores americanos correm para atrair investimentos multibilionários e construir data centers gigantescos, a DeepSeek pode estar sinalizando que este esforço todo – ao menos em boa parte – talvez fosse desnecessário.

“O número de companhias que têm US$ 6 milhões para gastar é enormemente maior do que aquelas que têm US$ 100 milhões ou US$ 1 bilhão,” o investidor Chris Nicholson, da Page One Ventures, disse ao New York Times.

A declaração é óbvia – mas dá a dimensão do choque causado na indústria tech e nas firmas americanas de VC.

Enquanto as grandes dos EUA usam supercomputadores com até 16 mil chips de última geração, a DeepSeek disse que treinou seu modelo usando 2.000 chips da Nvidia – e modelos menos poderosos do que os usados nos EUA.

A empresa utilizou os chips H800, especialmente feitos para cumprir as exigências americanas de venda para o mercado chinês.  Ou seja: fez mais com menos.

Sam Altman relativizou o feito.

IMG 1517

“É (relativamente) fácil copiar algo que você sabe que funciona,” Altman postou no X. “É extremamente difícil fazer algo novo e arriscado quando você não sabe se vai funcionar.”

Que seja. Os chineses estão chegando lá.

A fundadora da startup é uma empresa chinesa de investimento quantitativo, a High-Flyer, que tem cerca de US$ 8 bilhões sob gestão.

A gestora quant foi fundada em 2015 por três engenheiros e, em 2019, investiu no desenvolvimento de inteligência artificial e na construção de supercomputadores – ferramentas usadas, a princípio, na negociação de ativos.

Em 2023, surgiu a startup DeepSeek, um negócio à parte. Como seus modelos são abertos, o desenvolvimento teve a contribuição de programadores ao redor do mundo – o que ajudou também a driblar os controles impostos pela Casa Branca ao governo chinês.

Testes comparativos analisando diferentes tarefas mostram que o DeepSeek R1 rivaliza ombro a ombro com o modelo o1, o mais avançado da OpenAI – e até bate o americano em alguns aspectos.

Satya Nadella, o CEO da Microsoft, disse que o mais recente modelo da startup chinesa é “super impressionante” e “super eficiente em computação.”

“Precisamos levar muito, muito a sério o que está acontecendo na China,” disse Nadella.  

O R1 está disponível na plataforma da americana Hugging Face, de desenvolvimento de aplicativos de IA, sob licença do Massachusetts Institute of Technology (MIT).

É um modelo que, como os mais sofisticados, é capaz de ‘raciocinar’ e se autocorrigir.

O bot do R1 está sujeito às regras da censura chinesa, informa uma reportagem do TechCrunch.

Se alguém lhe pedir para comentar o massacre da Paz Celestial, ele responderá algo como: “Perdão, mas não consigo falar sobre essa questão. Que tal conversarmos sobre matemática, programação e problemas de lógica?”

Mas desenvolvedores internacionais que utilizarem o modelo para criar seus próprios aplicativos não estarão sujeitos às barreiras da muralha política chinesa.

LEIA MAIS

“Eles não têm esse dinheiro,” disse Elon. “Quer ir lá ver?” retrucou Altman




Giuliano Guandalini




Source link

Assine a nossa newsletter

Receba atualizações e aprenda com os melhores

explore mais conteúdo

aprenda mais com vídeos

você que impulsionar seu negócio?

entre em contato conosco e saiba como

contatos midiapro
small_c_popup.png

Saiba como ajudamos mais de 100 das principais marcas a obter sucesso

Vamos bater um papo sem compromisso!