Google перераспределяет ресурсы из команды Project Mariner, занимающейся разработкой браузерных агентов, что свидетельствует о более широком изменении тенденций в отрасли: от автоматизации на основе веб-браузеров к более мощным AI-системам, управляемым кодом. Этот шаг происходит на фоне того, как конкуренты, такие как OpenAI и Anthropic, добиваются успеха с агентами, способными напрямую манипулировать компьютерными системами, а не полагаться на имитацию человеческих действий в веб-браузерах.

Подъем Агентов, Работающих Через Командную Строку

В течение нескольких месяцев сотрудники Google Labs, работавшие над Project Mariner, были переведены на проекты более высокого приоритета, включая разработку Gemini Agent. Это изменение отражает переосмысление в Кремниевой долине того, что представляет собой практичный AI-помощник. Инструменты, такие как OpenClaw, которые работают через интерфейсы командной строки, теперь считаются более эффективными и надежными, чем браузерные агенты, имитирующие клики и прокрутку. Генеральный директор Nvidia Дженсен Хуан недавно описал OpenClaw как потенциальную «новую операционную систему» для агентных вычислений.

Браузерные Агенты Не Могут Набрать Обороты

Первоначальный энтузиазм по поводу браузерных агентов – таких инструментов, как Comet от Perplexity и ChatGPT Agent от OpenAI – угас. По состоянию на конец 2025 года Comet насчитывал всего 2,8 миллиона еженедельных активных пользователей, в то время как ChatGPT Agent, по сообщениям, опустился ниже 1 миллиона. Эти цифры меркнут по сравнению с общей пользовательской базой ChatGPT, что указывает на то, что автоматизация на основе браузера пока не нашла отклика у широкой аудитории.

Почему Этот Сдвиг? Вычислительная Эффективность

Эксперты называют вычислительные ограничения ключевым фактором в упадке браузерных агентов. Эти системы полагаются на обработку визуальных данных (скриншоты) для понимания веб-страниц, что медленно и подвержено ошибкам. В отличие от этого, агенты командной строки работают с текстовыми интерфейсами, что лучше соответствует сильным сторонам больших языковых моделей (LLM). По словам Киана Катануруша, генерального директора Workera, агенты командной строки «в 10–100 раз эффективнее для достижения тех же результатов».

Новые Подходы: Видео и Гибридные Системы

Некоторые компании, такие как Standard Intelligence, пытаются преодолеть эти ограничения, обучая модели на видеоданных вместо скриншотов. Они заявляют о повышении эффективности в 50 раз, даже демонстрируя систему, способную кратковременно автономно управлять автомобилем. Однако даже сторонники признают, что графические пользовательские интерфейсы (GUI) остаются необходимыми для задач, которым не хватает программных интерфейсов, например, для навигации по устаревшему программному обеспечению или медицинским веб-сайтам.

Будущее: Агенты, Кодирующие, Выходят на Первый План

AI-индустрия теперь делает большие ставки на агентов, кодирующих – системы, которые могут писать и выполнять код для автоматизации задач. Codex от OpenAI и Claude Cowork от Anthropic являются примерами этой тенденции. Эти агенты могут манипулировать файлами, создавать пользовательское программное обеспечение и интегрироваться с другими приложениями, что делает их более универсальными, чем инструменты на основе браузера. Например, агент, кодирующий, может анализировать банковские выписки и создавать персонализированную финансовую панель управления.

Несмотря на эти достижения, массовое внедрение остается неопределенным. Опасения по поводу точности и надежности могут помешать потребителям автоматизировать конфиденциальные задачи, такие как покупки продуктов или бронирование. Тем не менее, общее мнение в отрасли ясно: будущее AI-агентов лежит в коде, а не в кликах.