Google ordnet die Ressourcen seines Browser-Agenten-Teams Project Mariner neu zu und signalisiert damit einen breiteren Branchenschwenk weg von der webbasierten Automatisierung hin zu leistungsfähigeren, codegesteuerten KI-Systemen. Der Schritt erfolgt, da Konkurrenten wie OpenAI und Anthropic mit Agenten an Bedeutung gewinnen, die in der Lage sind, Computersysteme direkt zu manipulieren, anstatt sich auf simulierte menschliche Interaktionen in Webbrowsern zu verlassen.
Der Aufstieg der Befehlszeilenagenten
Seit Monaten werden die Mitarbeiter von Google Labs, die an Project Mariner arbeiten, Projekten mit höherer Priorität zugewiesen, darunter der Entwicklung von Gemini Agent. Die Änderung spiegelt einen Wandel im Verständnis des Silicon Valley darüber wider, was einen praktischen KI-Assistenten ausmacht. Tools wie OpenClaw, die über Befehlszeilenschnittstellen arbeiten, gelten heute als effizienter und zuverlässiger als Browser-Agenten, die menschliche Klicks und Scrollvorgänge simulieren. Jensen Huang, CEO von Nvidia, bezeichnete OpenClaw kürzlich als potenzielles „neues Betriebssystem“ für Agentic Computing.
Browser-Agenten haben Mühe, Fuß zu fassen
Die anfängliche Begeisterung für Browser-Agenten – Tools wie Comet von Perplexity und ChatGPT Agent von OpenAI – hat nachgelassen. Ende 2025 hatte Comet nur 2,8 Millionen wöchentlich aktive Nutzer, während ChatGPT Agent Berichten zufolge unter 1 Million fiel. Diese Zahlen verblassen im Vergleich zur Gesamtnutzerbasis von ChatGPT, was darauf hindeutet, dass die browserbasierte Automatisierung beim Mainstream-Publikum noch keinen Anklang gefunden hat.
Warum der Wandel? Recheneffizienz
Experten nennen Recheneinschränkungen als einen Schlüsselfaktor für den Rückgang von Browser-Agenten. Diese Systeme basieren auf der Verarbeitung visueller Daten (Screenshots), um Webseiten zu verstehen, was langsam und fehleranfällig ist. Im Gegensatz dazu arbeiten Befehlszeilenagenten mit textbasierten Schnittstellen und sind so besser auf die Stärken großer Sprachmodelle (LLMs) abgestimmt. Laut Kian Katanforoosh, CEO von Workera, erfordern Befehlszeilenagenten „10 bis 100 Mal weniger Schritte, um die gleichen Ergebnisse zu erzielen“.
Neue Ansätze: Video- und Hybridsysteme
Einige Unternehmen wie Standard Intelligence versuchen, diese Einschränkungen zu überwinden, indem sie Modelle anhand von Videodaten statt anhand von Screenshots trainieren. Sie versprechen eine 50-fache Effizienzsteigerung und demonstrieren sogar ein System, das in der Lage ist, ein Auto kurzzeitig autonom zu fahren. Allerdings erkennen selbst Befürworter an, dass grafische Benutzeroberflächen (GUIs) nach wie vor für Aufgaben unerlässlich sind, bei denen es an programmatischen Schnittstellen mangelt, etwa beim Navigieren in veralteter Software oder auf Websites im Gesundheitswesen.
Die Zukunft: Codierungsagenten übernehmen die Führung
Die KI-Branche setzt jetzt stark auf Coding Agents – Systeme, die Code schreiben und ausführen können, um Aufgaben zu automatisieren. Beispiele für diesen Trend sind Codex von OpenAI und Claude Cowork von Anthropic. Diese Agenten können Dateien manipulieren, benutzerdefinierte Software erstellen und in andere Anwendungen integrieren, wodurch sie vielseitiger sind als browserbasierte Tools. Beispielsweise könnte ein Kodierungsagent Kontoauszüge analysieren und ein personalisiertes Finanz-Dashboard erstellen.
Trotz dieser Fortschritte bleibt die Masseneinführung ungewiss. Bedenken hinsichtlich der Genauigkeit und Zuverlässigkeit können Verbraucher davon abhalten, sensible Aufgaben wie Lebensmitteleinkäufe oder Reservierungen zu automatisieren. Dennoch ist der Branchenkonsens klar: Die Zukunft von KI-Agenten liegt im Code, nicht in Klicks.



















