DeepSeek e Google: reviravolta na corrida das IAs?

DeepSeek e Google: reviravolta na corrida das IAs?

Compartilhe esta postagem

Índice do Conteúdo

Receba nosso boletim

Novos contatos

nossa newsletter

Por Guilherme Pereira, Diretor de Inovação da Alura Para Empresas
Nas últimas semanas, testemunhamos o desdobramento de uma nova fase na maratona de Inteligência Artificial Generativa. O cenário da IA está passando por uma transformação notável, impulsionada por avanços revolucionários tanto de gigantes tecnológicos consolidados quanto de novos competidores. Essa evolução vai além da inovação tecnológica: representa uma mudança fundamental na forma como abordamos o aprendizado de máquina e a inteligência computacional.

O Google lançou a arquitetura Titans, que promete ser uma evolução dos Transformers – tecnologia que deu origem à IA generativa. Logo em seguida, a Open AI apresentou o Operator, uma funcionalidade para competir diretamente com com o modelo ‘Claude 3.5 Sonnet’, da Anthropic, intensificando a corrida pelo domínio dos Agentes de Uso de Computador (CUA). E por fim, surpreendendo o setor, a DeepSeek emergiu como um novo competidor, alcançando o pelotão de elite e sacudindo o mercado.

Vamos, então, explorar cada um desses desdobramentos em detalhes.

Logo do Google, desfocado, ao fundo; à frente, letra G da empresa estilizada em um smartphone
Empresa trouxe várias novidades com IA recentemente (Imagem: One Artist/Shutterstock)

O surgimento de novas arquiteturas: Titans, do Google

No início de 2025, o Google lançou o Titans, uma arquitetura revolucionária baseada no artigo “Attention is All You Need”, publicado em 2017. Enquanto a arquitetura original do Transformer revolucionou a modelagem de sequências com mecanismos de autoatenção, o Titans dá um passo além, redefinindo como os sistemas de IA processam e armazenam informações.

A principal inovação do Titans está na sua estrutura de memória em três níveis, inspirada nos processos cognitivos humanos:

  • Memória de curto prazo: funciona como o centro de processamento imediato, lidando com tarefas em tempo real com precisão e agilidade, semelhante à memória de trabalho do cérebro humano, mantendo informações prontamente acessíveis para processamento rápido sem armazenamento a longo prazo.
  • Memória de longo prazo: um repositório extensivo de conhecimento, que permite ao modelo armazenar e recuperar dados históricos, essencial para tarefas que exigem compreensão contextual profunda e reconhecimento de padrões.
  • Memória persistente: integra conhecimentos específicos diretamente à arquitetura do modelo, garantindo que padrões e estruturas aprendidas se tornem parte integral da operação do sistema, melhorando sua capacidade de aplicar aprendizados anteriores a novas situações.

A inovação da aprendizagem baseada em surpresa

Talvez a característica mais intrigante do Titans seja sua capacidade de aprendizagem baseada em surpresa. Este mecanismo reflete a psicologia humana: eventos inesperados tendem a criar impressões de memória mais duradouras. O sistema quantifica a surpresa por meio de gradientes de função de perda, ajustando seus parâmetros para dar prioridade à retenção de informações inesperadas e relevantes.

Ao detectar dados que se desviam significativamente de suas previsões, o Titans os classifica como “surpreendentes”, otimizando o uso da memória e garantindo que insights cruciais sejam armazenados e utilizados de forma eficaz.

Tela inicial do DeepSeek em um smartphone
DeepSeek “chegou chegando” à corrida de IAs (Imagem: Poetra.RH/Shutterstock)

Agentes de uso de computador: a próxima evolução na automação por IA

À medida que o cenário da IA evolui, os Agentes de Uso de Computador (CUAs) estão emergindo como uma revolução na automação de sistemas. Esses agentes superam as ferramentas tradicionais, ao interagir com sistemas computacionais de maneiras que se assemelham muito aos usuários humanos.

Os CUAs são capazes de navegar por interfaces gráficas, executar tarefas complexas de entrada de dados e tomar decisões contextuais sem necessidade de integração extensiva de API ou programação específica do sistema. Essa versatilidade os torna particularmente valiosos para organizações que buscam otimizar operações digitais sem perder adaptabilidade.

Além da automação, possuem um sistema de aprendizado contínuo e se adaptam às novas interfaces e fluxos de trabalho, em tempo real. Essa capacidade de evolução os torna ainda mais valiosos em ambientes empresariais dinâmicos, onde softwares e processos estão em constante transformação.

DeepSeek: um novo competidor emerge

O surgimento do DeepSeek no cenário da IA representa mais do que apenas um novo concorrente. Ele simboliza a globalização do desenvolvimento da IA e a influência crescente das iniciativas de código aberto no avanço da tecnologia.

O DeepSeek se destaca por sua arquitetura eficiente, que combina Aprendizado por Reforço e Atenção Latente Multi-Cabeça, proporcionando desempenho excepcional com até 20 vezes menos uso de memória em comparação com métodos tradicionais.

Esse avanço demonstra como a otimização e a inovação arquitetônica podem impulsionar melhorias significativas de desempenho sem a necessidade de recursos computacionais excessivos.

O Impacto do Código Aberto

A natureza de código aberto do DeepSeek acelerou sua adoção na comunidade global de desenvolvedores, refletida na sua crescente popularidade em plataformas como o Hugging Face. Essa trajetória se assemelha ao sucesso de iniciativas anteriores, como os modelos LLaMA da Meta, evidenciando a importância do compartilhamento de conhecimento para o avanço da IA.

Olhando para o futuro

O desenvolvimento da IA está entrando em uma nova fase, onde a inovação não se limita apenas a novas tecnologias, mas também a novas abordagens para tecnologias já existentes. O ritmo de evolução da IA se diferencia de outras revoluções tecnológicas: avanços que antes levavam anos agora ocorrem em semanas ou até dias.

O maior desafio à frente não está em um único competidor ou tecnologia específica, mas na capacidade de gerenciar e direcionar essa evolução acelerada. O sucesso da IA no futuro dependerá da habilidade das organizações em equilibrar inovação com aplicação prática, garantindo a integração eficiente dessas novas tecnologias nos sistemas existentes.

Esta nova fase da IA não se resume a modelos mais poderosos ou arquiteturas mais eficientes. Trata-se de reimaginar como a inteligência artificial pode potencializar as capacidades humanas e garantir que seus avanços sejam acessíveis e benéficos para toda a sociedade.


Source link

Assine a nossa newsletter

Receba atualizações e aprenda com os melhores

explore mais conteúdo

aprenda mais com vídeos

você que impulsionar seu negócio?

entre em contato conosco e saiba como

contatos midiapro
small_c_popup.png

Saiba como ajudamos mais de 100 das principais marcas a obter sucesso

Vamos bater um papo sem compromisso!