論文の概要: Evolutionary Generation of Multi-Agent Systems
- arxiv url: http://arxiv.org/abs/2602.06511v1
- Date: Fri, 06 Feb 2026 09:01:35 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-09 22:18:26.307457
- Title: Evolutionary Generation of Multi-Agent Systems
- Title(参考訳): マルチエージェントシステムの進化的生成
- Authors: Yuntong Hu, Matthew Trager, Yuting Zhang, Yi Zhang, Shuo Yang, Wei Xia, Stefano Soatto,
- Abstract要約: 大規模言語モデル (LLM) ベースのマルチエージェントシステム (MAS) は複雑な推論、計画、ツール拡張タスクを強く約束する。
EvoMASは構造化構成生成としてMAS生成を定式化する。
EvoMASは、人間の設計したMASと以前の自動MAS生成方法の両方でタスク性能を一貫して改善する。
- 参考スコア(独自算出の注目度): 49.47969796873096
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Large language model (LLM)-based multi-agent systems (MAS) show strong promise for complex reasoning, planning, and tool-augmented tasks, but designing effective MAS architectures remains labor-intensive, brittle, and hard to generalize. Existing automatic MAS generation methods either rely on code generation, which often leads to executability and robustness failures, or impose rigid architectural templates that limit expressiveness and adaptability. We propose Evolutionary Generation of Multi-Agent Systems (EvoMAS), which formulates MAS generation as structured configuration generation. EvoMAS performs evolutionary generation in configuration space. Specifically, EvoMAS selects initial configurations from a pool, applies feedback-conditioned mutation and crossover guided by execution traces, and iteratively refines both the candidate pool and an experience memory. We evaluate EvoMAS on diverse benchmarks, including BBEH, SWE-Bench, and WorkBench, covering reasoning, software engineering, and tool-use tasks. EvoMAS consistently improves task performance over both human-designed MAS and prior automatic MAS generation methods, while producing generated systems with higher executability and runtime robustness. EvoMAS outperforms the agent evolution method EvoAgent by +10.5 points on BBEH reasoning and +7.1 points on WorkBench. With Claude-4.5-Sonnet, EvoMAS also reaches 79.1% on SWE-Bench-Verified, matching the top of the leaderboard.
- Abstract(参考訳): 大規模言語モデル (LLM) ベースのマルチエージェントシステム (MAS) は、複雑な推論、計画、ツール拡張タスクに対して強い期待を示すが、効果的なMASアーキテクチャの設計は、労働集約的で不安定で、一般化が難しいままである。
既存のMAS生成メソッドはコード生成に依存しており、実行可能性や堅牢性障害につながることが多い。
構造化構成生成としてMASを生成するマルチエージェントシステム(EvoMAS)の進化的生成を提案する。
EvoMASは構成空間で進化生成を行う。
具体的には、EvoMASは、プールから初期設定を選択し、フィードバック条件付き突然変異と実行トレースによってガイドされるクロスオーバーを適用し、候補プールとエクスペリエンスメモリの両方を反復的に洗練する。
我々は、BBEH、SWE-Bench、WorkBenchなど様々なベンチマークでEvoMASを評価し、推論、ソフトウェア工学、ツール利用タスクについて検討した。
EvoMASは、人間によって設計されたMASと以前の自動MAS生成方法の両方に対してタスク性能を一貫して改善し、高い実行可能性と実行時の堅牢性を持つ生成システムを生成する。
EvoMASはBBEH推論では+10.5点、WorkBenchでは+7.1点でエージェント進化法であるEvoAgentより優れている。
Claude-4.5-Sonnetでは、EvoMASはSWE-Bench-Verifiedでも79.1%に達し、リーダーボードのトップと一致している。
関連論文リスト
- Towards AGI A Pragmatic Approach Towards Self Evolving Agent [0.0]
大規模言語モデル(LLM)ベースのエージェントは、デプロイ後、強力だが基本的に静的である。
本研究では,Base LLM,運用SLMエージェント,Code-Generation LLM,Teacher-LLMを統合した階層的自己進化型マルチエージェントフレームワークを提案する。
論文 参考訳(メタデータ) (2026-01-15T20:43:44Z) - ThinkGen: Generalized Thinking for Visual Generation [97.19923474851987]
ThinkGenは、さまざまな世代のシナリオでChain-of-Thought(CoT)推論を明示的に活用する、思考駆動のビジュアル生成フレームワークである。
本稿では,MLLMとDiTモジュール間の強化学習を交互に行う,分離可能なGRPOベースのトレーニングパラダイムを提案する。
実験の結果、ThinkGenは複数の世代ベンチマークで堅牢で最先端のパフォーマンスを実現している。
論文 参考訳(メタデータ) (2025-12-29T16:08:50Z) - EvoAgentX: An Automated Framework for Evolving Agentic Workflows [21.464686605154792]
本稿では,マルチエージェントシステムの生成,実行,進化的最適化を自動化するオープンソースプラットフォームであるEvoAgentXを紹介する。
我々は,HotPotQA,MBPP,MATH上のEvoAgentXをマルチホップ推論,コード生成,数学的問題解決のためにそれぞれ評価し,GAIAを用いて実世界のタスクで評価する。
論文 参考訳(メタデータ) (2025-07-04T14:43:10Z) - MAS-ZERO: Designing Multi-Agent Systems with Zero Supervision [76.42361936804313]
自動MAS設計のための自己進化型推論時間フレームワークMAS-ZEROを紹介する。
MAS-ZEROはメタレベルの設計を採用し、各問題インスタンスに適したMAS構成を反復的に生成し、評価し、洗練する。
論文 参考訳(メタデータ) (2025-05-21T00:56:09Z) - EvoAgent: Towards Automatic Multi-Agent Generation via Evolutionary Algorithms [55.77492625524141]
EvoAgentは、特殊エージェントをマルチエージェントシステムに自動的に拡張するジェネリックメソッドである。
EvoAgent は LLM エージェントのタスク解決能力を大幅に向上させることができることを示す。
論文 参考訳(メタデータ) (2024-06-20T11:49:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。