O Google revelou recentemente o Projeto Mariner, agente de IA (Inteligência Artificial) desenvolvido pela divisão DeepMind, que simula ações humanas ao navegar na web. Este protótipo, baseado na tecnologia Gemini, marca um novo passo na interação entre os bots e navegadores, aponta o Época Negócios.
Com o Projeto Mariner, é possível controlar o navegador Chrome, movendo o cursor, clicando em botões e preenchendo formulários. Essa funcionalidade permite que ele acesse sites e execute tarefas de forma semelhante a um usuário humano.
Inicialmente, o Google, que vem fazendo fortes investimentos em IA, está disponibilizando o agente para um grupo limitado de testadores selecionados, enquanto continua explorando novas maneiras de aplicar o Gemini para leitura, resumo e uso de páginas da web.
De acordo com um executivo da empresa, o projeto representa uma “mudança de paradigma”, reduzindo a necessidade de interação direta do usuário com sites e permitindo que o sistema de IA gerencie essas ações.
Como funciona
Após instalar uma extensão no Chrome, uma janela de bate-papo é exibida no lado direito do navegador, permitindo que o usuário dê comandos ao agente. Um exemplo prático é criar um carrinho de compras em um supermercado online com base em uma lista fornecida pelo usuário.
O agente navega até o site, encontra os itens e os adiciona ao carrinho virtual. Apesar da novidade, o sistema apresenta lentidão em seus movimentos e frequentemente pausa para consultar o usuário sobre itens no carrinho. É importante destacar que o agente não pode concluir compras, já que não preenche informações de pagamento ou aceita cookies e termos de serviço. Essas limitações, segundo o Google, foram implementadas para dar maior controle aos usuários.
No entanto, o sistema captura imagens da tela do navegador e as envia para processamento na nuvem Gemini, algo que exige a aceitação dos termos de serviço da ferramenta. Além de compras, o Projeto Mariner pode realizar outras tarefas, como buscar voos, encontrar receitas e localizar hotéis. Contudo, o recurso só funciona na aba ativa do Chrome, obrigando o usuário a acompanhar suas ações. Segundo Koray Kavukcuoglu, diretor de Tecnologia do Google DeepMind, isso foi intencional para garantir que o usuário saiba exatamente o que a ferramenta está fazendo.
Outros projetos
Além do Projeto Mariner, o Google anunciou outros agentes de IA com aplicações específicas:
Deep Research: focado em explorar tópicos complexos, cria planos de pesquisa em várias etapas. Embora ainda não resolva problemas de lógica, matemática ou análise de dados, o agente está disponível no Gemini Advanced e será incorporado ao Gemini em 2025.
Jules: desenvolvido para auxiliar programadores em tarefas de codificação, integrando-se diretamente ao GitHub. Atualmente em fase de testes beta, ele será lançado no final de 2025.
Agente para videogames: protótipo em desenvolvimento para ajudar jogadores a navegar. A ferramenta está sendo testada em parceria com diversas empresas
Com essas novidades, o Google avança na criação de ferramentas que prometem transformar a interação entre usuários e tecnologia, consolidando o papel da IA como aliada em tarefas cotidianas e profissionais.
(*) Crédito da foto: Divulgação/Google