論文の概要: ABSTRAL: Automatic Design of Multi-Agent Systems Through Iterative Refinement and Topology Optimization
- arxiv url: http://arxiv.org/abs/2603.22791v1
- Date: Tue, 24 Mar 2026 04:28:07 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-25 19:53:37.306361
- Title: ABSTRAL: Automatic Design of Multi-Agent Systems Through Iterative Refinement and Topology Optimization
- Title(参考訳): ABSTRAL:反復リファインメントとトポロジー最適化によるマルチエージェントシステムの自動設計
- Authors: Weijia Song, Jiashu Yue, Zhe Pang,
- Abstract要約: 本稿では,MASアーキテクチャを自然言語文書として扱うフレームワークであるABSTRALを紹介する。
固定的なターン予算の下では、アンサンブルは26%のターン効率しか達成せず、66%のタスクが限界を乗り越えている。
対照的なトレース分析は 初期設計に欠如している 専門的な役割を発見します
- 参考スコア(独自算出の注目度): 0.033246582398800045
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: How should multi-agent systems be designed, and can that design knowledge be captured in a form that is inspectable, revisable, and transferable? We introduce ABSTRAL, a framework that treats MAS architecture as an evolving natural-language document, an artifact refined through contrastive trace analysis. Three findings emerge. First, we provide a precise measurement of the multi-agent coordination tax: under fixed turn budgets, ensembles achieve only 26% turn efficiency, with 66% of tasks exhausting the limit, yet still improve over single-agent baselines by discovering parallelizable task decompositions. Second, design knowledge encoded in documents transfers: topology reasoning and role templates learned on one domain provide a head start on new domains, with transferred seeds matching coldstart iteration 3 performance in a single iteration. Third, contrastive trace analysis discovers specialist roles absent from any initial design, a capability no prior system demonstrates. On SOPBench (134 bank tasks, deterministic oracle), ABSTRAL reaches 70% validation / 65.96% test pass rate with a GPT-4o backbone. We release the converged documents as inspectable design rationale.
- Abstract(参考訳): マルチエージェントシステムをどのように設計し、その設計知識を検査可能で、修正可能で、転送可能な形でキャプチャすることができるか?
我々は,MASアーキテクチャを自然言語文書として扱うフレームワークであるABSTRALを紹介した。
3つの発見がある。
まず、固定的なターン予算の下では、アンサンブルは26%のターン効率しか達成せず、その66%のタスクは制限を省きながら、並列化可能なタスク分解を発見することで、単一エージェントのベースラインよりも改善されている。
第2に、文書転送に符号化された設計知識: トポロジ推論とロールテンプレート あるドメインで学んだことは、新しいドメインでヘッドスタートを提供する。
第三に、対照的なトレース分析は、初期設計に欠けている専門的な役割を発見する。
SOPBench (134バンクタスク、決定論的オラクル)では、ABSTRALはGPT-4oバックボーンで70%の検証/65.96%のテストパスレートに達した。
収束した文書を検査可能な設計根拠として公開する。
関連論文リスト
- DOVA: Deliberation-First Multi-Agent Orchestration for Autonomous Research Automation [0.0]
大規模言語モデル(LLM)エージェントは、ツールの使用、推論、コード生成において顕著な能力を示した。
3つの重要なイノベーションを取り入れたマルチエージェントプラットフォームであるDOVA(Deep Orchestrated Versatile Agent)を紹介する。
コアアルゴリズムを形式化し、7つのシステム構成にまたがるアーキテクチャアブレーション調査を行い、信頼性、ソースカバレッジ、トークン効率に答えるために各コンポーネントの貢献を分析する。
論文 参考訳(メタデータ) (2026-03-04T20:58:40Z) - Towards a Science of Scaling Agent Systems [79.64446272302287]
エージェント評価の定義を定式化し,エージェント量,コーディネーション構造,モデル,タスク特性の相互作用として,スケーリング法則を特徴付ける。
協調指標を用いて予測モデルを導出し,R2=0をクロスバリデーションし,未知のタスク領域の予測を可能にする。
ツールコーディネーショントレードオフ: 固定的な計算予算の下では, ツールヘビータスクはマルチエージェントのオーバーヘッドから不均衡に悩まされ, 2) 能力飽和: 調整が減少または負のリターンを, 単一エージェントのベースラインが45%を超えると達成できる。
論文 参考訳(メタデータ) (2025-12-09T06:52:21Z) - Multi-Agent Systems for Dataset Adaptation in Software Engineering: Capabilities, Limitations, and Future Directions [8.97512410819274]
本稿では,データセット適応タスクにおいて,最先端のマルチエージェントシステムがどのように機能するかについて,最初の実証的研究を行う。
我々は、GitHub Copilotを評価し、ROCODEやLogHub2.0といったベンチマークリポジトリからSE研究成果物を適用する。
その結果、現在のシステムはキーファイルを識別し、部分的な適応を生成することができるが、正しい実装を生成することは滅多にない。
論文 参考訳(メタデータ) (2025-11-26T13:26:11Z) - Traceability and Accountability in Role-Specialized Multi-Agent LLM Pipelines [9.340611077939828]
我々は、トレーサブルで説明可能なパイプライン、つまり明確な役割、構造化されたハンドオフ、保存されたレコードを持つシステムについて研究する。
3つのベンチマークで3つの最先端LCMの8つの構成を評価し、エラーの発生点、展開方法、修正方法について分析する。
論文 参考訳(メタデータ) (2025-10-08T23:26:44Z) - MCP-Orchestrated Multi-Agent System for Automated Disinformation Detection [84.75972919995398]
本稿では,関係抽出を用いてニュース記事の偽情報を検出するマルチエージェントシステムを提案する。
提案したエージェントAIシステムは、(i)機械学習エージェント(ロジスティック回帰)、(ii)Wikipedia知識チェックエージェント、(iv)Webスクラッドデータアナライザの4つのエージェントを組み合わせる。
その結果、マルチエージェントアンサンブルはF1スコア0.964で95.3%の精度を達成し、個々のエージェントや従来のアプローチよりも大幅に優れていた。
論文 参考訳(メタデータ) (2025-08-13T19:14:48Z) - Visual Document Understanding and Question Answering: A Multi-Agent Collaboration Framework with Test-Time Scaling [83.78874399606379]
テスト時間スケーリングを備えたマルチエージェント協調フレームワークであるMACTを提案する。
4つの異なる小規模エージェントから構成され、明確に定義された役割と効果的なコラボレーションがある。
一般および数学的タスクの能力を犠牲にすることなく、より小さなパラメータスケールで優れた性能を示す。
論文 参考訳(メタデータ) (2025-08-05T12:52:09Z) - MMESGBench: Pioneering Multimodal Understanding and Complex Reasoning Benchmark for ESG Tasks [56.350173737493215]
環境・社会・ガバナンス(ESG)報告は、持続可能性の実践の評価、規制コンプライアンスの確保、財務透明性の促進に不可欠である。
MMESGBenchは、マルチモーダル理解と複雑な推論を、構造的に多種多様なマルチソースESG文書間で評価するための、最初のベンチマークデータセットである。
MMESGBenchは、45のESG文書から得られた933の検証済みQAペアで構成され、7つの異なるドキュメントタイプと3つの主要なESGソースカテゴリにまたがる。
論文 参考訳(メタデータ) (2025-07-25T03:58:07Z) - CodeAgents: A Token-Efficient Framework for Codified Multi-Agent Reasoning in LLMs [16.234259194402163]
マルチエージェント推論を符号化し、マルチエージェントシステムにおける構造化されたトークン効率の計画を可能にするプロンプトフレームワークであるCodeAgentsを紹介する。
その結果, 計画性能は一貫した改善がみられ, 基本となる自然言語よりも3~36ポイントの絶対的な向上が見られた。
論文 参考訳(メタデータ) (2025-07-04T02:20:19Z) - AgentSwift: Efficient LLM Agent Design via Value-guided Hierarchical Search [58.98450205734779]
大規模言語モデル(LLM)エージェントは、多様なドメインにまたがる強力な機能を示している。
既存のエージェントサーチ手法には3つの大きな制限がある。
これらの課題に対処するための包括的なフレームワークを導入します。
論文 参考訳(メタデータ) (2025-06-06T12:07:23Z) - Collaboration Dynamics and Reliability Challenges of Multi-Agent LLM Systems in Finite Element Analysis [3.437656066916039]
インターエイジェントダイナミクスが推論の品質と信頼性にどのように影響するかは、まだ不明である。
線形弾性有限要素解析(FEA)のためのAutoGenベースのマルチエージェントフレームワークを用いたこれらのメカニズムについて検討する。
1,120のコントロールされたトライアルから、コラボレーションの有効性は、チームのサイズよりも機能的な相補性に依存することが分かりました。
論文 参考訳(メタデータ) (2024-08-23T23:11:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。