Une étude et une méthode
La performance des systèmes multi-agents ne dépend pas du nombre d’agents, mais de l’alignement précis entre la structure de la tâche, la capacité du modèle et la forme de coordination.
On voit beaucoup d’articles et d’infos sur les agents, mais j’ai lu recemment cette étude (lien en bas) qui apporte une vraie valeur-ajoutée, pour ceux qui les conçoivent et les utilisent:
=> Passer d’une intuition empirique à une ingénierie des agents fondée sur des principes mesurables, pour estimer quand et pourquoi ajouter plusieurs agents améliore-t-il réellement les performances ?
Cet article propose l’un des premiers cadres quantitatifs pour répondre à cette question, en dépassant le slogan simpliste du “plus d’agents = mieux”.
Les auteurs évaluent 180 configurations, par une méthodologie contrôlée et systématique, combinant :
agents uniques vs multi-agents,
différentes topologies (indépendante, centralisée, décentralisée, hybride),
plusieurs familles de modèles (OpenAI, Google, Anthropic),
quatre benchmarks agentiques représentatifs (finance, navigation web, planification, tâches professionnelles).
Tout est contrôlé (outils, prompts, budgets de calcul) afin d’isoler l’effet réel de la coordination
4 résultats majeurs:
le modèle prédit la meilleure architecture dans 87 % des cas testés
La coordination a un coût structurel
Sur des tâches riches en outils ou très séquentielles, la coordination entre agents introduit un surcoût (communication, synchronisation) qui peut annuler, voire inverser les gains attendus.Effet de saturation des capacités
Lorsque les performances d’un agent unique dépassent environ 45 %, ajouter des agents tend à produire des rendements décroissants, voire négatifs. Autrement dit, plus le modèle de base est fort, moins la collaboration est utile.Les architectures multi-agents ne se valent pas :
les agents indépendants amplifient fortement les erreurs,
les architectures centralisées les contiennent mieux grâce à des points de validation,
les architectures décentralisées sont efficaces pour l’exploration parallèle (ex. navigation web), mais fragiles sur le raisonnement séquentiel.
pour les tâches de planification, toutes les variantes multi-agents testées dégradent les performances par rapport à un agent unique.
En conclusion: La performance des systèmes multi-agents ne dépend pas du nombre d’agents, mais de l’alignement précis entre la structure de la tâche, la capacité du modèle et la forme de coordination.
Vous voulez en savoir plus , et lire d’article original: [2512.08296v1] Towards a Science of Scaling Agent Systems

