Entenda se a chinesa DeepSeek ameaça a liderança do ChatGPT

joabe antonio de oliveira
fevereiro 24, 2025

Compartilhe esta postagem

Receba nosso boletim

Por

Redação Rádio Pampa

| 23 de fevereiro de 2025

Entenda se a chinesa DeepSeek ameaça a liderança do ChatGPT

O mercado de tecnologia foi abalado com a notícia de que um modelo algorítmico desenvolvido pela Deepseek, uma companhia chinesa, superou o ChatGPT em alguns testes de eficiência. O DeepSeek-R1, modelo de inteligência artificial generativa, atinge desempenho comparável ao GPT-4 o1, segundo divulgado. Bateu recorde em número de downloads, superando o ChatGPT na App Store (loja de aplicativos da Apple) e na Google Play (da Google).

A notícia ameaçou a confiança na liderança dos EUA no disputadíssimo nicho da inteligência artificial e fez cair as ações das empresas estadunidenses de tecnologia nas bolsas de valores. Em um dia, as empresas norte-americanas de tecnologia perderam US$ 1,2 trilhão em valor de mercado. Só a Nvidia perdeu US$ 589 bilhões.

O que causou todo esse alvoroço foi a divulgação de que o DeepSeek-R1 foi desenvolvido a um custo cerca 20 vezes menor que os outros modelos das “big techs” americanas, tendo consumido dez vezes menos tempo de treinamento e empregado uma equipe técnica estimada em torno de um terço do número de funcionários das empresas rivais. Divulgou-se que o custo de treinamento do DeepSeek foi de apenas 5,58 milhões de dólares, enquanto os modelos das empresas norte-americanas são treinados em regra a um custo entre 40 a 100 milhões de dólares.

Somente grandes empresas de tecnologia, com muitos recursos computacionais e grandes somas de capital para investimento, têm condições de desenvolver e lançar no mercado os chamados LLMs. Os grandes modelos de linguagem (large language models — LLMs), a exemplo do ChatGPT, são modelos treinados em grandes quantidades de dados para realizar diversas tarefas, incluindo algumas para as quais não foram especificamente desenvolvidos e treinados.

Desenvolver e treinar um modelo de LLM requer quantidade substancial de dados, poder computacional, equipe de técnicos e engenheiros de alto nível e, evidentemente, recursos financeiros. A OpenAI, em parceria com a Microsoft, a Google através de sua subsidiária Deep Mind, a Meta e a Anthropic possuem significante poder e recursos para exercer influência nesse ecossistema. Era basicamente esse pequeno número de empresas norte-americanas que vinha desenvolvendo os modelos mais sofisticados de IA Generativa.

Quebra de paradigma

A divulgação da performance do DeepSeek R1 parece quebrar esse paradigma, mas o mercado de IA dificilmente será aberto para pequenas e médias empresas. O domínio permanecerá nas mãos de um pequeno leque de empresas, as chamadas “big techs”. Não é só desenvolver e colocar no mercado de consumo um modelo fundacional para uma empresa ser alçada ao clube da elite da tecnologia de IA. Especialmente em se tratando de modelos de IA de grande capacidade (highly capable AI models), a exemplo dos LLMs, o provedor em regra continua com a hospedagem e alimentação do modelo.

O provedor é quem tem recursos para hospedagem em nuvem, centralização dos dados e poder computacional para funcionamento do modelo, atribuições difíceis de serem terceirizadas. O fato novo da divulgada performance do DeepSeek R1 revela apenas que as empresas norte-americanas podem perder o domínio do mercado de IA para as empresas chinesas ou que, pelo menos, estão tendo sua liderança muito ameaçada. E é nisso que reside a explicação para a queda brutal das ações das big techs norte-americanas.

A boa nova é que possivelmente o acesso a ferramentas de IA fique mais barato. Ultimamente, todas as novas versões de modelos de IA generativa das empresas norte-americanas tiveram seus preços aumentados para o usuário final. A assinatura mensal da versão Pro do modelo ChatGPT o1, anunciada no início de dezembro do ano passado, já está custando US$ 200 (cerca de R$ 1,2 mil). O modelo DeepSeek-R1 é de 20 a 50 vezes mais barato de usar. A empresa chinesa tem preços mais baixos em razão do menor custo de produção dos seus modelos. Isso certamente vai pressionar as big techs americanas a reverem suas estratégias de preços.

Novo propósito de IA

O DeepSeek-R1, assim como o modelo GPT da empresa estadunidense OpenAI, a par de ter capacidades generativas, é um exemplo de IA de propósito geral (que vem do termo em inglês general-purpose artificial intelligence ou simplesmente GPAI). Aliás, os grandes modelos de linguagem (Large Language Models — LLMs) enquadram-se nessa acepção da tecnologia GPAI. São modelos treinados em grandes quantidades de dados para realizar diversas tarefas. O que a empresa DeepSeek fez foi criar métodos mais eficientes para treinar seus modelos, tornando-os mais econômicos ao exigir menos recursos de computação para o treinamento. O modelo mais recente da DeepSeek é tão eficiente que exigiu um décimo do poder de computação utilizado para treinar o modelo Llama 3.1 da Meta. As informações são do portal Consultor Jurídico.

Source link