Додому Nejnovější zprávy a články Google omezuje vývojový tým Browser Agent ve prospěch AI zaměřené na kódování

Google omezuje vývojový tým Browser Agent ve prospěch AI zaměřené na kódování

Google omezuje vývojový tým Browser Agent ve prospěch AI zaměřené na kódování

Google přerozděluje zdroje od týmu Project Mariner, který vyvíjí agenty založené na prohlížečích, což signalizuje širší posun v průmyslových trendech od automatizace založené na webových prohlížečích k výkonnějším systémům umělé inteligence řízených kódem. Tento krok přichází v době, kdy soupeři jako OpenAI a Anthropic dosahují pokroku s agenty, kteří mohou přímo manipulovat s počítačovými systémy, místo aby se spoléhali na napodobování lidských akcí ve webových prohlížečích.

Vzestup agentů příkazového řádku

Během několika měsíců byli zaměstnanci Google Labs pracující na Project Mariner převedeni do projektů s vyšší prioritou, včetně vývoje Gemini Agent. Tato změna odráží redefinici Silicon Valley toho, co představuje praktického asistenta AI. Nástroje jako OpenClaw, které fungují prostřednictvím rozhraní příkazového řádku, jsou nyní považovány za efektivnější a spolehlivější než agenti kliknutí a posouvání v prohlížeči. Generální ředitel Nvidie Jensen Huang nedávno popsal OpenClaw jako potenciální „nový operační systém“ pro výpočetní agenty.

Agenti prohlížeče nemohou získat dynamiku

Počáteční nadšení pro agenty založené na prohlížečích – nástroje jako Perplexity’s Comet a ChatGPT Agent od OpenAI- vyprchalo. Na konci roku 2025 měla Comet pouze 2,8 milionu aktivních uživatelů týdně, zatímco ChatGPT Agent údajně klesl pod 1 milion. Tato čísla jsou bledá ve srovnání s celkovou uživatelskou základnou ChatGPT, což naznačuje, že automatizace založená na prohlížeči dosud nerezonovala u širšího publika.

Proč tento posun? Výpočetní efektivita

Odborníci poukazují na výpočetní omezení jako na klíčový faktor zániku agentů založených na prohlížeči. Tyto systémy spoléhají na zpracování vizuálních dat (snímků obrazovky), aby porozuměly webovým stránkám, což je pomalé a náchylné k chybám. Naproti tomu agenti příkazového řádku pracují na textových rozhraních, která lépe vyhovují silným stránkám velkých jazykových modelů (LLM). Agenti příkazového řádku jsou „10 až 100krát efektivnější při dosahování stejných výsledků,“ říká Kian Katanurusha, generální ředitel společnosti Workera.

Nové přístupy: Video a hybridní systémy

Některé společnosti, jako je Standard Intelligence, se snaží překonat tato omezení trénováním modelů na video datech namísto snímků obrazovky. Tvrdí 50násobné zvýšení účinnosti, dokonce předvádějí systém schopný krátkodobého autonomního řízení. Nicméně i zastánci uznávají, že grafická uživatelská rozhraní (GUI) zůstávají nezbytná pro úkoly, které postrádají softwarová rozhraní, jako je navigace staršího softwaru nebo lékařských webových stránek.

Budoucnost: Kódování agentů se dostává do popředí

Průmysl umělé inteligence nyní ve velké míře sází na kódovací agenty – systémy, které mohou psát a spouštět kód pro automatizaci úloh. Příkladem tohoto trendu jsou Codex společnosti OpenAI a Claude Cowork společnosti Anthropic. Tito agenti mohou manipulovat se soubory, vytvářet vlastní software a integrovat se s jinými aplikacemi, díky čemuž jsou všestrannější než nástroje založené na prohlížeči. Kódovací agent může například analyzovat bankovní výpisy a vytvořit personalizovaný finanční dashboard.

Navzdory těmto pokrokům zůstává masové přijetí nejisté. Obavy o přesnost a spolehlivost mohou spotřebitelům bránit v automatizaci citlivých úkolů, jako je nakupování potravin nebo provádění rezervací. Obecná shoda v oboru je však jasná: budoucnost agentů umělé inteligence spočívá v kódu, nikoli v kliknutích.

Exit mobile version