O Google está realocando recursos de sua equipe de agentes do navegador Project Mariner, sinalizando uma mudança mais ampla da indústria da automação baseada na web para sistemas de IA mais poderosos e orientados por código. A mudança ocorre no momento em que concorrentes como OpenAI e Anthropic ganham força com agentes capazes de manipular diretamente sistemas de computador, em vez de depender de interações humanas simuladas em navegadores da web.
A ascensão dos agentes de linha de comando
Durante meses, a equipe do Google Labs que trabalha no Projeto Mariner foi realocada para projetos de maior prioridade, incluindo o desenvolvimento do Agente Gemini. A mudança reflete uma mudança na compreensão do Vale do Silício sobre o que constitui um assistente prático de IA. Ferramentas como o OpenClaw, que operam por meio de interfaces de linha de comando, são agora vistas como mais eficientes e confiáveis do que agentes de navegador que simulam cliques humanos e rolagem. O CEO da Nvidia, Jensen Huang, descreveu recentemente o OpenClaw como um potencial “novo sistema operacional” para computação agente.
Agentes de navegador lutam para ganhar força
O entusiasmo inicial pelos agentes de navegador – ferramentas como o Comet da Perplexity e o ChatGPT Agent da OpenAI – diminuiu. No final de 2025, o Comet tinha apenas 2,8 milhões de usuários ativos semanais, enquanto o ChatGPT Agent supostamente caiu para menos de 1 milhão. Esses números são insignificantes em comparação com a base geral de usuários do ChatGPT, indicando que a automação baseada em navegador ainda não repercutiu no grande público.
Por que a mudança? Eficiência Computacional
Os especialistas citam as limitações computacionais como um fator-chave no declínio dos agentes de navegador. Esses sistemas dependem do processamento de dados visuais (capturas de tela) para compreender as páginas da web, o que é lento e sujeito a erros. Por outro lado, os agentes de linha de comando trabalham com interfaces baseadas em texto, alinhando-se melhor com os pontos fortes dos grandes modelos de linguagem (LLMs). De acordo com Kian Katanforoosh, CEO da Workera, os agentes de linha de comando levam “10 a 100 vezes menos etapas para chegar aos mesmos resultados”.
Novas Abordagens: Vídeo e Sistemas Híbridos
Algumas empresas, como a Standard Intelligence, estão tentando superar essas limitações treinando modelos em dados de vídeo em vez de capturas de tela. Eles afirmam ganhos de eficiência de 50X, demonstrando até mesmo um sistema capaz de dirigir um carro de forma autônoma por breves momentos. No entanto, até mesmo os proponentes reconhecem que as interfaces gráficas de usuário (GUIs) continuam essenciais para tarefas que não possuem interfaces programáticas, como navegar em software legado ou sites de saúde.
O futuro: agentes de codificação assumem a liderança
A indústria de IA está agora apostando fortemente em agentes de codificação – sistemas que podem escrever e executar código para automatizar tarefas. O Codex da OpenAI e Claude Cowork da Anthropic são exemplos dessa tendência. Esses agentes podem manipular arquivos, criar software personalizado e integrar-se a outros aplicativos, tornando-os mais versáteis do que ferramentas baseadas em navegador. Por exemplo, um agente de codificação poderia analisar extratos bancários e criar um painel financeiro personalizado.
Apesar desses avanços, a adoção em massa permanece incerta. As preocupações com a precisão e a confiabilidade podem impedir os consumidores de automatizar tarefas confidenciais, como compras de supermercado ou reservas. No entanto, o consenso da indústria é claro: o futuro dos agentes de IA está no código, não nos cliques.


















