論文の概要: Decentralized Multi-Agent Systems with Shared Context
- arxiv url: http://arxiv.org/abs/2606.10662v1
- Date: Tue, 09 Jun 2026 10:13:07 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-10 15:40:58.438349
- Title: Decentralized Multi-Agent Systems with Shared Context
- Title(参考訳): 共有コンテキストを持つ分散マルチエージェントシステム
- Authors: Yuzhen Mao, Azalia Mirhoseini,
- Abstract要約: 分散言語モデル(DeLM)は、並列エージェント、共有検証コンテキスト、タスクキューを通じて協調を分散化するフレームワークである。
SWE-bench Verifiedでは、DLMはAvg.@1、Pass@2、Pass@4で最高のパフォーマンスを達成し、最強のベースラインよりも最大10.5ポイント向上した。
LongBench-v2 Multi-Doc QAでは、DeLMは4つのフロンティアモデルファミリーで最高平均精度を達成し、最強のベースラインを最大5.7%改善した。
- 参考スコア(独自算出の注目度): 5.1297249052932115
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Multi-agent systems (MAS) can scale large language model reasoning at test time by decomposing complex problems into parallel subtasks. However, most existing MAS rely on centralized orchestration, where a main agent assigns work, collects outputs, and merges results. As the number of subtasks grows, this controller becomes a communication and integration bottleneck. We propose Decentralized Language Models (DeLM), a MAS framework that decentralizes coordination through parallel agents, a shared verified context, and a task queue. Agents asynchronously claim subtasks, read accumulated progress, perform local reasoning, and write back compact verified updates. The shared context acts as a common communication substrate, enabling agents to build on one another's verified progress without routing every update through a central controller. Empirically, DeLM improves both software-engineering test-time scaling and long-context reasoning. On SWE-bench Verified, DeLM achieves the best performance across Avg.@1, Pass@2, and Pass@4, with gains of up to 10.5 percentage points over the strongest baseline, while reducing cost per task by roughly 50%. On LongBench-v2 Multi-Doc QA, DeLM achieves the highest average accuracy across four frontier model families, improving over the strongest baseline by up to 5.7 percentage points. The code is available on our project website at https://yuzhenmao.github.io/DeLM/.
- Abstract(参考訳): マルチエージェントシステム(MAS)は、複雑な問題を並列サブタスクに分解することで、テスト時に大きな言語モデル推論をスケールすることができる。
しかし、既存のMASのほとんどは集中的なオーケストレーションに依存しており、そこではメインエージェントが作業の割り当て、アウトプットの収集、結果のマージを行う。
サブタスクの数が増えるにつれて、このコントローラは通信と統合のボトルネックとなる。
並列エージェントによる協調を分散化するMASフレームワークである分散言語モデル(DeLM)と、共有検証コンテキスト、タスクキューを提案する。
エージェントは、サブタスクを非同期に主張し、累積進捗を読み出し、ローカル推論を実行し、コンパクトに検証された更新を書き戻す。
共有コンテキストは共通の通信基板として機能し、中央コントローラを通じて更新をルーティングすることなく、エージェントが互いに検証された進捗を構築できる。
実証的には、DeLMはソフトウェアエンジニアリングのテストタイムスケーリングと長期コンテキスト推論の両方を改善している。
SWE-bench Verifiedでは、DeLMはAvg全体で最高のパフォーマンスを達成する。
1、Pass@2、Pass@4は最強のベースラインを10.5ポイント上回り、タスク当たりのコストは約50%削減された。
LongBench-v2 Multi-Doc QAでは、DeLMは4つのフロンティアモデルファミリーで最高平均精度を達成し、最強のベースラインを最大5.7%改善した。
コードはプロジェクトのWebサイトhttps://yuzhenmao.github.io/DeLM/.comで公開されている。
関連論文リスト
- Graph-of-Agents: A Graph-based Framework for Multi-Agent LLM Collaboration [57.23877089929136]
Graph-of-Agents (GoA)はマルチエージェントLLM通信をモデリングするための新しいグラフベースのフレームワークである。
GoAは3つの選択されたエージェントしか使用せず、最近のマルチエージェントLCMベースラインよりも優れたパフォーマンスを実現している。
論文 参考訳(メタデータ) (2026-04-18T21:13:03Z) - AgentGit: A Version Control Framework for Reliable and Scalable LLM-Powered Multi-Agent Systems [7.408263799616532]
AgentGitはGitライクなロールバックとブランチをマルチエージェントシステム(MAS)にもたらすフレームワークです。
AgentGitは冗長、ランタイム、トークンの使用を著しく削減し、複数のブランチをまたいだ並列探索をサポートしています。
この作業は、より堅牢なMAS設計への実践的なパスを提供し、コラボレーティブAIシステムにおけるエラー回復、安全な探索、計算、A/Bテストを可能にする。
論文 参考訳(メタデータ) (2025-11-01T17:11:31Z) - AgentRL: Scaling Agentic Reinforcement Learning with a Multi-Turn, Multi-Task Framework [76.96794548655292]
大規模言語モデル(LLM)は、オンラインインタラクションを通じて学習できる汎用エージェントの構築への関心が高まっている。
マルチターンでLLMエージェントをトレーニングするために強化学習(RL)を適用することで、スケーラブルなインフラストラクチャと安定したトレーニングアルゴリズムが欠如しているため、マルチタスク設定は依然として困難である。
本稿では、スケーラブルなマルチターンマルチタスクエージェントRLトレーニングのためのAgentRLフレームワークを提案する。
論文 参考訳(メタデータ) (2025-10-05T13:40:01Z) - Anemoi: A Semi-Centralized Multi-agent System Based on Agent-to-Agent Communication MCP server from Coral Protocol [0.7288110873705294]
Anemoi は、Coral Protocol の Agent-to-Agent (A2A) 通信 MCP サーバ上に構築された、半集中型の MAS である。
従来のデザインとは異なり、Anemoiは構造的かつ直接的なエージェント間コラボレーションを可能にし、すべてのエージェントが進捗を監視し、結果を評価し、ボトルネックを特定し、リアルタイムに改善を提案する。
論文 参考訳(メタデータ) (2025-08-23T15:45:10Z) - CodeAgents: A Token-Efficient Framework for Codified Multi-Agent Reasoning in LLMs [16.234259194402163]
マルチエージェント推論を符号化し、マルチエージェントシステムにおける構造化されたトークン効率の計画を可能にするプロンプトフレームワークであるCodeAgentsを紹介する。
その結果, 計画性能は一貫した改善がみられ, 基本となる自然言語よりも3~36ポイントの絶対的な向上が見られた。
論文 参考訳(メタデータ) (2025-07-04T02:20:19Z) - CRAB: Cross-environment Agent Benchmark for Multimodal Language Model Agents [49.68117560675367]
Crabは、クロス環境タスクをサポートするように設計された最初のベンチマークフレームワークである。
私たちのフレームワークは複数のデバイスをサポートし、Pythonインターフェースで簡単に任意の環境に拡張できます。
実験の結果、GPT-4oの1剤が38.01%の最高完成率を達成することが示された。
論文 参考訳(メタデータ) (2024-07-01T17:55:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。