
Bienvenue dans Eye on AI. Dans cette édition… Le président Trump vise les réglementations nationales sur l’IA avec un nouveau décret… OpenAI dévoile un nouvel imageur pour rattraper le Nano Banana de Google… Google DeepMind forme des agents plus performants pour les mondes virtuels… et un rapport sur les évaluations de sécurité de l’IA n’apporte pas beaucoup de réconfort.
Bonjour. 2025 était censée être l’année des agents IA. Mais alors que l’année touche à sa fin, il est clair que les prévisions des fournisseurs de technologies étaient trop optimistes. Oui, certaines entreprises ont commencé à utiliser des agents IA. Mais la plupart ne le font pas encore, en particulier dans les déploiements à l’échelle de l’entreprise. Une enquête McKinsey « State of AI » du mois dernier a révélé que la plupart des entreprises n’avaient pas encore commencé à utiliser des agents d’IA, tandis que 40 % d’entre elles ont déclaré qu’elles étaient en train d’expérimenter. Moins d’un quart ont déclaré avoir déployé des agents d’IA à grande échelle dans au moins un cas d’utilisation ; Et lorsque le cabinet de conseil a demandé aux gens s’ils utilisaient l’IA dans des fonctions spécifiques, comme le marketing et les ventes ou les ressources humaines, les résultats ont été encore pires. Pas plus de 10 % des personnes interrogées ont déclaré qu’elles disposaient d’agents d’IA « entièrement mis à l’échelle » ou qu’ils étaient « en train de les mettre à l’échelle » dans l’un de ces domaines. La fonction qui utilise le plus d’agents remontés est l’informatique (où les agents sont souvent utilisés pour résoudre automatiquement les tickets de service ou installer des logiciels pour les employés), et même ici, seulement 2 % ont déclaré avoir des agents « à grande échelle », et 8 % supplémentaires ont déclaré qu’ils étaient en « escalade ».
Une grande partie du problème réside dans la difficulté de concevoir des flux de travail pour les agents IA qui leur permettent de produire des résultats fiables. Même les modèles d’IA les plus performants d’aujourd’hui se trouvent à une étrange limite : capables d’effectuer certaines tâches dans un flux de travail aussi bien que les humains, mais incapables d’en effectuer d’autres. Les tâches complexes qui impliquent la collecte de données provenant de sources multiples et l’utilisation d’outils logiciels en plusieurs étapes représentent un défi particulier. Plus le flux de travail est long, plus le risque qu’une erreur dans l’une des premières étapes d’un processus s’aggrave et entraîne un échec du résultat est grand. De plus, des modèles d’IA plus performants peuvent être coûteux à utiliser à grande échelle, surtout si le flux de travail implique que l’agent doive faire beaucoup de planification et de raisonnement. De nombreuses entreprises ont tenté de résoudre ces problèmes en concevant des « workflows multi-agents », dans lesquels différents agents sont activés et chacun se voit attribuer une seule étape distincte dans le workflow, incluant parfois l’utilisation d’un agent pour vérifier le travail d’un autre agent. Cela peut améliorer les performances, mais cela peut aussi s’avérer coûteux, parfois trop coûteux pour que cela vaille la peine d’automatiser le flux de travail.
Deux agents IA valent-ils toujours mieux qu’un ?
Aujourd’hui, une équipe de Google a mené des recherches visant à donner aux entreprises une bonne rubrique pour décider quand il est préférable d’utiliser un seul agent, plutôt que de créer un flux de travail multi-agents, et quel type de flux de travail multi-agents pourrait être le meilleur pour une tâche particulière.
Les chercheurs ont mené 180 expériences contrôlées en utilisant des modèles d’intelligence artificielle de Google, OpenAI et Anthropic. Il les a testés par rapport à quatre références différentes d’IA d’agents couvrant un ensemble diversifié d’objectifs : récupérer des informations sur plusieurs sites Web ; planification dans un environnement de jeu Minecraft ; planifier et utiliser des outils pour effectuer des tâches commerciales courantes, telles que répondre aux e-mails, planifier des réunions et utiliser un logiciel de gestion de projet ; et un point de référence de l’agent financier. Ce test financier oblige les agents à récupérer des informations à partir des documents déposés auprès de la SEC et à effectuer des analyses de base, telles que comparer les résultats réels aux prévisions de la direction du trimestre précédent, déterminer l’évolution des revenus dérivés d’un segment de produit spécifique au fil du temps ou déterminer le montant de liquidités dont une entreprise pourrait disposer pour les activités de fusion et d’acquisition.
L’année dernière, le consensus était que les flux de travail multi-agents produisaient des résultats plus fiables. (J’ai déjà écrit sur ce point de vue, qui a été soutenu par l’expérience de certaines entreprises, comme Prosus, ici chez Eye on AI.) Mais les chercheurs de Google ont plutôt découvert que la tenue ou non des idées reçues dépendait en grande partie de la nature exacte de la tâche.
Les agents individuels fonctionnent mieux dans les étapes séquentielles, moins bien dans les étapes parallèles
Si la tâche était séquentielle, comme c’était le cas pour de nombreuses tâches de référence de Minecraft, il s’est avéré que tant qu’un seul agent d’IA pouvait effectuer la tâche avec précision au moins 45 % du temps (ce qui est une barre assez basse, à mon avis), alors il était préférable de déployer un seul agent. L’utilisation de plusieurs agents, dans n’importe quelle configuration, réduisait considérablement les performances globales de 39 à 70 %. La raison, selon les chercheurs, est que si une entreprise disposait d’un budget symbolique limité pour accomplir l’ensemble de la tâche, les demandes de plusieurs agents essayant de comprendre comment utiliser différents outils dépasseraient rapidement le budget.
Mais si une tâche impliquait des étapes pouvant être exécutées en parallèle, comme c’était le cas pour de nombreuses tâches d’analyse financière, alors les systèmes multi-agents présentaient de grands avantages. De plus, les chercheurs ont découvert que la manière exacte dont les agents sont configurés pour travailler les uns avec les autres fait également une grande différence. Pour les tâches d’analyse financière, un système multi-agents centralisé, dans lequel un seul agent de coordination dirige et supervise l’activité de plusieurs sous-agents et tous les flux de communication vers et depuis le coordinateur, a produit le meilleur résultat. Ce système a fonctionné 80 % mieux qu’un agent unique. Pendant ce temps, un système multi-agent indépendant, dans lequel il n’y a pas de coordinateur et où chaque agent se voit simplement attribuer un rôle limité qu’il remplit en parallèle, n’était que 57 % meilleur qu’un seul agent.
Des recherches comme celle-ci devraient aider les entreprises à trouver les meilleurs moyens de configurer des agents d’IA et permettre à la technologie de commencer enfin à tenir les promesses de l’année dernière. Pour ceux qui vendent la technologie des agents IA, mieux vaut tard que jamais. Pour les personnes qui travaillent dans des entreprises qui utilisent des agents IA, il faudra voir quel impact ces agents ont sur le marché du travail. C’est une histoire que nous surveillerons de près à mesure que nous nous rapprochons de 2026.
Cela dit, voici plus d’actualités sur l’IA.
Jeremy Kahnjeremy.kahn@fortune.com@jeremyakahn
Cette histoire a été initialement publiée sur Fortune.com



