Google está reasignando recursos de su equipo de agentes de navegador Project Mariner, lo que indica un giro más amplio de la industria que se aleja de la automatización basada en la web hacia sistemas de inteligencia artificial más potentes y basados en códigos. La medida se produce cuando competidores como OpenAI y Anthropic ganan terreno con agentes capaces de manipular directamente sistemas informáticos, en lugar de depender de interacciones humanas simuladas dentro de los navegadores web.
El auge de los agentes de línea de comandos
Durante meses, el personal de Google Labs que trabaja en el Proyecto Mariner ha sido reasignado a proyectos de mayor prioridad, incluido el desarrollo de Gemini Agent. El cambio refleja un cambio en la comprensión que tiene Silicon Valley de lo que constituye un asistente práctico de IA. Herramientas como OpenClaw, que operan a través de interfaces de línea de comandos, ahora se consideran más eficientes y confiables que los agentes de navegador que simulan clics y desplazamientos humanos. El director ejecutivo de Nvidia, Jensen Huang, describió recientemente OpenClaw como un potencial “nuevo sistema operativo” para la computación agente.
Los agentes de navegador luchan por ganar terreno
El entusiasmo inicial por los agentes de navegador (herramientas como Comet de Perplexity y ChatGPT Agent de OpenAI) ha disminuido. A finales de 2025, Comet tenía solo 2,8 millones de usuarios activos semanales, mientras que, según se informa, ChatGPT Agent cayó por debajo de 1 millón. Estos números palidecen en comparación con la base general de usuarios de ChatGPT, lo que indica que la automatización basada en navegador aún no ha resonado entre el público general.
¿Por qué el cambio? Eficiencia computacional
Los expertos citan las limitaciones computacionales como un factor clave en el declive de los agentes de navegador. Estos sistemas se basan en el procesamiento de datos visuales (capturas de pantalla) para comprender las páginas web, lo cual es lento y propenso a errores. Por el contrario, los agentes de línea de comandos trabajan con interfaces basadas en texto, alineándose mejor con las fortalezas de los modelos de lenguaje grandes (LLM). Según Kian Katanforoosh, director ejecutivo de Workera, los agentes de línea de comando requieren “entre 10 y 100 veces menos pasos para llegar a los mismos resultados”.
Nuevos enfoques: vídeo y sistemas híbridos
Algunas empresas, como Standard Intelligence, están intentando superar estas limitaciones entrenando modelos con datos de vídeo en lugar de capturas de pantalla. Afirman obtener ganancias de eficiencia 50 veces mayores, incluso demostrando un sistema capaz de conducir brevemente un automóvil de forma autónoma. Sin embargo, incluso sus defensores reconocen que las interfaces gráficas de usuario (GUI) siguen siendo esenciales para tareas que carecen de interfaces programáticas, como navegar por software heredado o sitios web de atención médica.
El futuro: los agentes codificadores toman la iniciativa
La industria de la IA ahora está apostando fuertemente por los agentes de codificación : sistemas que pueden escribir y ejecutar código para automatizar tareas. Codex de OpenAI y Claude Cowork de Anthropic son ejemplos de esta tendencia. Estos agentes pueden manipular archivos, crear software personalizado e integrarse con otras aplicaciones, lo que los hace más versátiles que las herramientas basadas en navegador. Por ejemplo, un agente codificador podría analizar extractos bancarios y crear un panel financiero personalizado.
A pesar de estos avances, la adopción masiva sigue siendo incierta. Las preocupaciones sobre la precisión y la confiabilidad pueden impedir que los consumidores automaticen tareas delicadas como comprar comestibles o hacer reservas. Sin embargo, el consenso de la industria es claro: el futuro de los agentes de IA está en el código, no en los clics.
