論文の概要: Coordination as an Architectural Layer for LLM-Based Multi-Agent Systems
- arxiv url: http://arxiv.org/abs/2605.03310v1
- Date: Tue, 05 May 2026 02:56:44 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-06 19:35:43.740362
- Title: Coordination as an Architectural Layer for LLM-Based Multi-Agent Systems
- Title(参考訳): LLMに基づくマルチエージェントシステムのための構造層としてのコーディネーション
- Authors: Maksym Nechepurenko, Pavel Shuvalov,
- Abstract要約: マルチエージェントLLMシステムは41%から87%の速度で生産に失敗する。
コーディネーションは、エージェントロジックと情報アクセスから分離可能なアーキテクチャ層として扱われるべきである、と我々は主張する。
我々はこれを予測市場における情報制御設計でインスタンス化する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Multi-agent LLM systems fail in production at rates between 41% and 87%, mostly due to coordination defects rather than base-model capability. Existing responses split between cataloguing failure modes empirically and shipping declarative orchestration frameworks as engineering tools; neither delivers a principled mapping from coordination configuration to predictable failure-mode signature. We argue that coordination should be treated as a configurable architectural layer, separable from agent logic and from information access, enabling architectural reasoning rather than only engineering productivity. We instantiate this with an information-controlled design on prediction markets: a single LLM, fixed tools, fixed per-call output cap, and fixed prompt template across five reference coordination configurations, with total compute per question treated as an endogenous architectural output. The Murphy decomposition of the Brier score separates calibration from discriminative power, so configurations leave distinguishable signatures even when aggregate scores coincide. On 100 Polymarket binary markets resolved after the model's training cutoff (claude-opus-4-6) we report Murphy signatures, a cost-quality Pareto frontier, category-conditioned analysis, and a bootstrap power-projection. Three of five pre-specified predictions are upheld in direction; two configurations dominate the Pareto frontier within this regime; exploratory bootstrap intervals separate consensus alignment from others, though pairwise tests do not survive Bonferroni correction at n=100. We also deploy the same configurations as live agents on Foresight Arena under web-search-enabled conditions, as an on-chain replication channel accumulating in parallel. Harness, trace dataset, and production agents are released. We position this as a methodology-validating first instantiation, not a general cross-model claim.
- Abstract(参考訳): マルチエージェントLLMシステムは、41%から87%の速度で生産に失敗する。
既存の応答は、経験的に障害モードのカタログと宣言的なオーケストレーションフレームワークをエンジニアリングツールとして提供するものとで、どちらもコーディネーション構成から予測可能な障害モードシグネチャへの原則的なマッピングを提供していません。
コーディネーションは構成可能なアーキテクチャ層として扱われ、エージェントロジックと情報アクセスから分離可能であり、エンジニアリングの生産性だけでなくアーキテクチャの推論を可能にするべきだと我々は主張する。
一つのLSM、固定ツール、固定されたコール単位の出力上限、および5つの参照調整構成にまたがる固定されたプロンプトテンプレート、問合せ毎の総計算を内在的アーキテクチャ出力として扱うという、予測市場における情報制御設計でこれをインスタンス化する。
ブライアスコアのマーフィー分解はキャリブレーションを識別力から分離するため、アグリゲーションスコアが一致する場合でも、構成は区別可能なシグネチャを残す。
モデルの縮小後に解決した100のポリマーケットバイナリマーケット(claude-opus-4-6)では、Murphyシグネチャ、コスト品質のParetoフロンティア、カテゴリ条件分析、ブートストラップパワープロジェクションが報告されている。
5つの事前特定された予測のうち3つは順に維持されており、2つの構成がパレート・フロンティアを支配しており、探索的なブートストラップ間隔は他のものとのコンセンサスアライメントを分離している。
また、Web検索可能な条件下で、Foresight Arena上のライブエージェントと同じ構成をデプロイします。
Harness、トレースデータセット、プロダクションエージェントがリリースされている。
我々はこれを、一般的なクロスモデルクレームではなく、第一インスタンス化の方法論を検証するものとして位置づける。
関連論文リスト
- Towards Multi-Agent Autonomous Reasoning in Hydrodynamics [0.06999740786886537]
本稿では,多エージェントをレイヤ実行グラフ(LEG)を介して協調させる,流体力学のためのマルチエージェントシステム(MAS)のプロトタイプを提案する。
プランナーエージェントは、ドメイン知識を厳密な制御ロジックとしてハードコーディングすることなく、自然言語ルーティングからクエリ固有の実行トポロジを構築する。
レポーターエージェントが最終応答を合成し、ランタイムが監査性をサポートするためのツール呼び出し毎に証明をログする。
論文 参考訳(メタデータ) (2026-05-01T21:17:55Z) - Decision Trace Schema for Governance Evidence in Real-Time Risk Systems [0.0]
単一のロギングフォーマットが、決定の達成方法に関するガバナンス関連の完全な記録をキャプチャすることはない。
DESは10の必要な根レベルフィールドを定義し、結合されたエビデンス戦略を導入している。
DESは4つのレイヤを同時にカバーする唯一の仕様である。
論文 参考訳(メタデータ) (2026-04-10T13:06:38Z) - Auto-Configured Networks for Multi-Scale Multi-Output Time-Series Forecasting [7.883762084227456]
産業予測は、しばしばマルチソースの非同期信号とマルチ出力ターゲットを含む。
現在のプラクティスはアライメント戦略やネットワーク設計の修正であり、事前処理を体系的に共同設計することは困難である。
本稿では,エラーと複雑性のバランスをとる予測モデルのデプロイ可能なParetoセットを出力する自動設定フレームワークを提案する。
論文 参考訳(メタデータ) (2026-04-08T21:28:30Z) - MinerU2.5-Pro: Pushing the Limits of Data-Centric Document Parsing at Scale [92.09717763663873]
我々は、データエンジニアリングとトレーニング戦略設計を通じて、純粋に最先端の技術を進化させるMinerU2.5-Proを提案する。
コアとなるのは、カバレッジ、情報性、アノテーションの正確性を中心に設計されたData Engineだ。
我々は,MinerU2.5-Pro が OmniDocBench v1.6 上で 95.69 を達成することを示す。
論文 参考訳(メタデータ) (2026-04-06T15:44:18Z) - Automated Self-Testing as a Quality Gate: Evidence-Driven Release Management for LLM Applications [51.56484100374058]
我々は,エビデンスに基づくリリース決定を伴う品質ゲートを導入する自動自己テストフレームワークを提案する。
内部展開型多エージェント対話型AIシステムの縦型ケーススタディにより,本フレームワークの評価を行った。
論文 参考訳(メタデータ) (2026-03-13T20:44:15Z) - ORCH: many analyses, one merge-a deterministic multi-agent orchestrator for discrete-choice reasoning with EMA-guided routing [0.6445605125467574]
ORCHは異種言語モデルを編成する離散選択推論のためのフレームワークである。
タスクの分解と回答の集約に固定されたルールを使用し、パイプラインを予測可能、再現可能、トレーニング不要にする。
MMLU、MMLU-Pro、GSM8Kの実験では、ORCHは単一モデルベースラインと多数投票アンサンブルを一貫して上回っている。
論文 参考訳(メタデータ) (2026-02-02T08:27:58Z) - Towards a Science of Scaling Agent Systems [79.64446272302287]
エージェント評価の定義を定式化し,エージェント量,コーディネーション構造,モデル,タスク特性の相互作用として,スケーリング法則を特徴付ける。
協調指標を用いて予測モデルを導出し,R2=0をクロスバリデーションし,未知のタスク領域の予測を可能にする。
ツールコーディネーショントレードオフ: 固定的な計算予算の下では, ツールヘビータスクはマルチエージェントのオーバーヘッドから不均衡に悩まされ, 2) 能力飽和: 調整が減少または負のリターンを, 単一エージェントのベースラインが45%を超えると達成できる。
論文 参考訳(メタデータ) (2025-12-09T06:52:21Z) - Metacognitive Self-Correction for Multi-Agent System via Prototype-Guided Next-Execution Reconstruction [58.51530390018909]
大規模言語モデルに基づくマルチエージェントシステムは、協調的な問題解決において優れているが、エラーのカスケードには脆弱である。
我々は,MASにリアルタイム,教師なし,ステップレベルの誤り検出と自己補正を付与するメタ認知フレームワークMASCを提案する。
論文 参考訳(メタデータ) (2025-10-16T05:35:37Z) - Unsupervised Conformal Inference: Bootstrapping and Alignment to Control LLM Uncertainty [49.19257648205146]
生成のための教師なし共形推論フレームワークを提案する。
我々のゲートは、分断されたUPPよりも厳密で安定した閾値を提供する。
その結果は、ラベルのない、API互換の、テスト時間フィルタリングのゲートになる。
論文 参考訳(メタデータ) (2025-09-26T23:40:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。