Додому Dernières nouvelles et articles Google réduit l’équipe d’agents de navigateur alors que l’IA se concentre sur...

Google réduit l’équipe d’agents de navigateur alors que l’IA se concentre sur le codage

Google réduit l’équipe d’agents de navigateur alors que l’IA se concentre sur le codage

Google réaffecte les ressources de son équipe d’agents de navigateur Project Mariner, signalant un changement plus large de l’industrie, passant de l’automatisation basée sur le Web à des systèmes d’IA plus puissants et pilotés par le code. Cette décision intervient alors que des concurrents comme OpenAI et Anthropic gagnent du terrain avec des agents capables de manipuler directement les systèmes informatiques, plutôt que de s’appuyer sur des interactions humaines simulées dans les navigateurs Web.

L’essor des agents de ligne de commande

Depuis des mois, le personnel de Google Labs travaillant sur le projet Mariner a été réaffecté à des projets plus prioritaires, notamment le développement de Gemini Agent. Ce changement reflète un changement dans la compréhension de la Silicon Valley de ce qui constitue un assistant pratique en IA. Des outils comme OpenClaw, qui fonctionnent via des interfaces de ligne de commande, sont désormais considérés comme plus efficaces et plus fiables que les agents de navigateur qui simulent les clics et le défilement humains. Le PDG de Nvidia, Jensen Huang, a récemment décrit OpenClaw comme un « nouveau système d’exploitation » potentiel pour l’informatique agentique.

Les agents de navigation luttent pour gagner du terrain

L’enthousiasme initial pour les agents de navigation – des outils comme Comet de Perplexity et ChatGPT Agent d’OpenAI – a diminué. Fin 2025, Comet ne comptait que 2,8 millions d’utilisateurs actifs hebdomadaires, tandis que ChatGPT Agent serait tombé en dessous d’un million. Ces chiffres sont dérisoires par rapport à la base globale d’utilisateurs de ChatGPT, ce qui indique que l’automatisation basée sur le navigateur n’a pas encore trouvé un écho auprès du grand public.

Pourquoi ce changement ? Efficacité informatique

Les experts citent les limitations informatiques comme facteur clé du déclin des agents de navigation. Ces systèmes s’appuient sur le traitement de données visuelles (captures d’écran) pour comprendre les pages Web, ce qui est lent et sujet aux erreurs. En revanche, les agents de ligne de commande fonctionnent avec des interfaces textuelles, s’alignant mieux sur les points forts des grands modèles de langage (LLM). Selon Kian Katanforoosh, PDG de Workera, les agents en ligne de commande nécessitent « 10 à 100 fois moins d’étapes pour arriver aux mêmes résultats ».

Nouvelles approches : systèmes vidéo et hybrides

Certaines entreprises, comme Standard Intelligence, tentent de surmonter ces limitations en formant des modèles sur des données vidéo plutôt que sur des captures d’écran. Ils revendiquent des gains d’efficacité 50 fois supérieurs, démontrant même un système capable de conduire brièvement une voiture de manière autonome. Cependant, même les partisans reconnaissent que les interfaces utilisateur graphiques (GUI) restent essentielles pour les tâches dépourvues d’interfaces de programmation, comme la navigation dans des logiciels existants ou des sites Web de soins de santé.

L’avenir : les agents de codage prennent les devants

L’industrie de l’IA mise désormais beaucoup sur les agents de codage – des systèmes capables d’écrire et d’exécuter du code pour automatiser les tâches. Le Codex d’OpenAI et Claude Cowork d’Anthropic sont des exemples de cette tendance. Ces agents peuvent manipuler des fichiers, créer des logiciels personnalisés et s’intégrer à d’autres applications, ce qui les rend plus polyvalents que les outils basés sur un navigateur. Par exemple, un agent de codage pourrait analyser les relevés bancaires et créer un tableau de bord financier personnalisé.

Malgré ces avancées, l’adoption massive reste incertaine. Les préoccupations concernant l’exactitude et la fiabilité peuvent empêcher les consommateurs d’automatiser des tâches sensibles comme faire les courses ou faire des réservations. Néanmoins, le consensus du secteur est clair : l’avenir des agents d’IA réside dans le code, pas dans les clics.

Exit mobile version