Google melakukan realokasi sumber daya dari tim agen browser Project Mariner, yang menandakan adanya peralihan industri yang lebih luas dari otomatisasi berbasis web menuju sistem AI yang lebih canggih dan berbasis kode. Langkah ini dilakukan ketika pesaing seperti OpenAI dan Anthropic mendapatkan daya tarik dengan agen yang mampu memanipulasi sistem komputer secara langsung, daripada mengandalkan simulasi interaksi manusia dalam browser web.
Bangkitnya Agen Baris Perintah
Selama berbulan-bulan, staf Google Labs yang mengerjakan Project Mariner telah ditugaskan kembali ke proyek dengan prioritas lebih tinggi, termasuk pengembangan Agen Gemini. Perubahan ini mencerminkan pergeseran pemahaman Silicon Valley tentang apa yang dimaksud dengan asisten AI praktis. Alat seperti OpenClaw, yang beroperasi melalui antarmuka baris perintah, kini dipandang lebih efisien dan andal dibandingkan agen browser yang menyimulasikan klik dan pengguliran manusia. CEO Nvidia Jensen Huang baru-baru ini menggambarkan OpenClaw sebagai “sistem operasi baru” yang potensial untuk komputasi agen.
Agen Browser Berjuang untuk Mendapatkan Daya Tarik
Antusiasme awal terhadap agen browser – alat seperti Perplexity’s Comet dan OpenAI’s ChatGPT Agent – telah berkurang. Pada akhir tahun 2025, Comet hanya memiliki 2,8 juta pengguna aktif mingguan, sementara Agen ChatGPT dilaporkan turun di bawah 1 juta. Angka-angka ini tidak seberapa jika dibandingkan dengan basis pengguna ChatGPT secara keseluruhan, yang menunjukkan bahwa otomatisasi berbasis browser belum diterima oleh khalayak umum.
Mengapa Terjadi Pergeseran? Efisiensi Komputasi
Para ahli menyebutkan keterbatasan komputasi sebagai faktor kunci penurunan agen browser. Sistem ini mengandalkan pemrosesan data visual (tangkapan layar) untuk memahami halaman web, yang lambat dan rentan terhadap kesalahan. Sebaliknya, agen baris perintah bekerja dengan antarmuka berbasis teks, lebih selaras dengan kekuatan model bahasa besar (LLM). Menurut Kian Katanforoosh, CEO Workera, agen baris perintah membutuhkan “10 hingga 100X langkah lebih sedikit untuk mencapai hasil yang sama.”
Pendekatan Baru: Sistem Video dan Hibrid
Beberapa perusahaan, seperti Standard Intelligence, berupaya mengatasi keterbatasan ini dengan melatih model menggunakan data video, bukan tangkapan layar. Mereka mengklaim peningkatan efisiensi 50X lipat, bahkan mendemonstrasikan sistem yang mampu mengemudikan mobil secara mandiri dalam waktu singkat. Namun, bahkan para pendukungnya mengakui bahwa antarmuka pengguna grafis (GUI) tetap penting untuk tugas-tugas yang tidak memiliki antarmuka terprogram, seperti menavigasi perangkat lunak lama atau situs web layanan kesehatan.
Masa Depan: Agen Pengkode Memimpin
Industri AI kini sangat bergantung pada agen pengkodean – sistem yang dapat menulis dan mengeksekusi kode untuk mengotomatiskan tugas. Codex OpenAI dan Claude Cowork dari Anthropic adalah contoh dari tren ini. Agen ini dapat memanipulasi file, membuat perangkat lunak khusus, dan berintegrasi dengan aplikasi lain, menjadikannya lebih serbaguna dibandingkan alat berbasis browser. Misalnya, agen pengkodean dapat menganalisis laporan bank dan membuat dasbor keuangan yang dipersonalisasi.
Meskipun ada kemajuan, adopsi massal masih belum pasti. Kekhawatiran tentang keakuratan dan keandalan dapat menghalangi konsumen untuk mengotomatiskan tugas-tugas sensitif seperti belanja bahan makanan atau reservasi pemesanan. Meski demikian, konsensus industri sudah jelas: masa depan agen AI terletak pada kode, bukan klik.



















