A rápida popularidade do chatbot chinês de inteligência artificial (IA), DeepSeek, promete fazer com que o “novato” do setor dispute espaço com grandes concorrentes, como o ChatGPT, da OpenAI e o Gemini, do Google – e no Brasil, a IA já está conquistando usuários que se acostumaram com o uso da ferramenta no dia a dia.
O uso da DeepSeek por aqui faz bastante sentido: desde 2022, quando a OpenAI lançou o ChatGPT, usuários brasileiros não demoraram para experimentar a ajuda do chatbot nas mais diversas tarefas. Isso tornou o País como um dos que ultrapassaram a média global de uso de IA no mundo. Segundo uma pesquisa realizada pelo Google, 54% dos brasileiros afirmam ter usado a tecnologia em 2024, enquanto a média global é de 48%.
Além da IA de Sam Altman, o usuário brasileiro se acostumou, também, a ter opções como o Gemini, do Google, o Claude, da Anthropic e outras versões da tecnologia a um clique de distância. Entretanto, a chegada do chatbot da DeepSeek parece estar causando sombra na hegemonia de outras empresas e usuários já dizem migrar para a tecnologia chinesa. O aplicativo se tornou, na última segunda-feira, 27, o mais baixado e mais bem avaliado da App Store dos EUA, ocupando o então espaço do chatbot de Sam Altman e preocupando a indústria de tecnologia americana.
Camila Lanes, 28, é publicitária e uma das adeptas dos chatbots desde que eles chegaram no Brasil. Ela costuma usar ferramentas de IA como até para coisas básicas do dia a dia, como organizar a semana e desenvolver textos.
A publicitária explica que usava o ChatGPT mas, agora, prefere a IA da DeepSeek. “Antes da DeepSeek, eu usava o ChatGPT de forma paga. Mesmo que fornecesse algumas informações, várias vezes ele esquecia ou alterava a linha de raciocínio, emendando alguns dados desnecessários. Com a DeepSeek não acontece isso. Além disso, o ChatGPT é limitado em algumas informações pelo banco de dados não ser tão atualizado”.
Henrique Sanches, 38, produtor de audiovisual, concorda com Camila. Ele utiliza ferramentas de IA para o trabalho e afirmou que considera a DeepSeek mais completa em relação aos concorrentes. “Comparando com o ChatGPT, a DeepSeek me trouxe uma análise bem mais precisa, me entregou comparativos de obras que eram as que me inspiraram no roteiro. Até agora, eu achei melhor do que as outras IAs”.
Os dois usuários conseguiram criar uma conta já no início da onda da fama do DeepSeek. No momento, após um ataque cibernético que aconteceu na última segunda-feira, a empresa não está permitindo que novos usuários se cadastrem na plataforma.
“Devido a ataques maliciosos em larga escala aos serviços da DeepSeek, estamos limitando temporariamente os registros para garantir a continuidade do serviço. Os usuários existentes podem fazer o login normalmente. Obrigado por sua compreensão e apoio”, avisou a empresa em seu site.
Como a tecnologia da DeepSeek funciona?
Ao contrário dos LLMs tradicionais, que dependem de ajuste fino supervisionado (SFT) com o uso de dados rotulados, a DeepSeek adotou uma abordagem puramente de aprendizado por reforço (RL), realizando o seu treinamento por meio de interações com o ambiente e uma otimização baseada em diferentes graus de recompensas.
Isso permitiu que o algoritmo desenvolvesse capacidades autônomas de raciocínio em cadeia (CoT), auto-verificação e reflexão. Isso facilita o encadeamento lógico de raciocínios e o ajuste contínuo das respostas, melhorando a sua resolução de problemas complexos sem a necessidade de uma supervisão direta como é feita pelas outras LLMs.
“A DeepSeek me deu a opção para entender a linha do raciocínio e eu pude debater com ele de forma clara sobre outras possibilidades, além de ser mais criativo. Ontem eu passei uma hora enviando mensagens para o ChatGPT e para o DeepSeek. As respostas foram diferentes, sendo que o DeepSeek coletou mais informações que eu enviei e conseguiu construir alternativas interessantes”, disse Camila.
A corrida pelo desenvolvimento de IAs
Outro ponto que faz com que a DeepSeek saia na frente na corrida pelo desenvolvimento de IA é o seu custo. Para efeito de comparação, o último modelo de IA produzido pela Meta custou cerca de US$ 70 milhões. Já a tecnologia da OpenAI ultrapassou a casa dos US$ 100 milhões. Enquanto isso, a DeepSeek conseguiu gastar apenas US$ 6 milhões para o seu desenvolvimento.
A DeepSeek-R1 foi treinada usando duas mil GPUs NVIDIA A100, uma fração do hardware necessário para modelos como o GPT-3, que exigiu dez mil GPUs, ou o GPT-4, estimado em vinte e cinco a trinta mil GPUs.
Por isso, a empresa chinesa consegue entregar um produto de mais qualidade, de forma mais acessível, o que preocupa as big techs americanas que, na última segunda-feira, perderam cerca de US$ 1 trilhão de valor de mercado. Além da qualidade das informações, a gratuidade do seu chatbot também chama atenção dos usuários.
Pietro Magaldi, 20, estudante, que também costuma usar IA em seu dia a dia, considera a DeepSeek melhor que a versão mais cara do chatbot da OpenAI, o ChatGPT Pro, que custa US$ 200 por mês. “É muito bom, eu estava usando e é realmente muito mais rápido do que a versão mais cara do ChatGPT”, disse.
Empresas chinesesas como o Alibaba, Tencent e Baidu vêm investindo muito na produção de serviços em nuvem e disputam a atenção dos desenvolvedores de IA no país, em uma corrida tecnológica interna.
O grupo de chinês de comércio eletrônico, Alibaba, dono do Aliexpress, lançou uma nova versão do seu modelo de inteligência artificial. Segundo publicado pela empresa, a IA Qwen 2.5 é capaz de superar a própria DeepSeek e outros concorrentes do setor, como a Llama, da Meta.
Liang Wenfeng, fundador da DeepSeek, disse em entrevista ao meio de comunicação chinês Waves, em julho, que a empresa “não se importava” com guerras de preços e que alcançar a inteligência geral artificial (AGI) era seu principal objetivo.
*Mariana Cury é estagiária sob supervisão do editor Bruno Romani