論文の概要: Dynamic Coordination Strategy Selection for Enterprise Multi-Agent Systems
- arxiv url: http://arxiv.org/abs/2606.00804v2
- Date: Thu, 04 Jun 2026 11:06:01 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-05 19:21:32.99363
- Title: Dynamic Coordination Strategy Selection for Enterprise Multi-Agent Systems
- Title(参考訳): エンタープライズマルチエージェントシステムの動的コーディネーション戦略選択
- Authors: Thanh Luong Tuan,
- Abstract要約: 本稿では,グローバルに固定されるのではなく,問題クラスによって協調戦略を動的に選択すべきかどうかを評価する。
1,440個の出力はすべて固定されたソンネットルーブリックによって判定される。
企業調整方針は、決定論的勝者選択法ではなく、動的ルーティングをデフォルトとして使用するべきであると結論付けている。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Enterprise multi-agent systems increasingly expose multiple coordination patterns, but deployments often lack evidence for when to use consensus, debate, synthesis, or a simpler single-agent workflow. This paper evaluates whether coordination strategy should be selected dynamically by problem class rather than fixed globally. We run a frozen matrix of 30 enterprise tasks spanning six industries, five problem classes, four execution conditions, three replications per cell, and four model arms: qwen_local, sonnet, gemma_openrouter, and an auxiliary openai cloud-validation arm. All 1,440 generated outputs are judged by a fixed Sonnet rubric. The main finding is bounded and operationally useful, but it is not the original strict H1. The pre-registered exact-winner/CI criterion is not supported: exact winner identity is unstable across model arms, and several predicted strategies are close to, but not above, the best observed alternative. A weaker near-best routing claim is strongly supported. In every pre-registered model arm and problem class, and again in the auxiliary OpenAI validation arm, the predicted strategy is within 0.10 quality-score points of the best observed condition. Structured compliance verification is the clearest exception to the original mapping: all arms favor single_agent rather than consensus. A pre-registered Kendall's W test finds no reliable difference between Vietnamese-domain and English-domain tasks in how consistently the four coordination conditions are ranked (mean W of 0.20 in both strata; signed-rank p = .85), so H2 is not supported. We conclude that enterprise coordination policy should use dynamic routing as a calibrated default, not as a deterministic winner-selection law.
- Abstract(参考訳): エンタープライズマルチエージェントシステムは、ますます複数の調整パターンを公開するが、デプロイには、コンセンサス、議論、合成、単純な単一エージェントワークフローを使用するための証拠が欠けていることが多い。
本稿では,グローバルに固定されるのではなく,問題クラスによって協調戦略を動的に選択すべきかどうかを評価する。
6つの業界にまたがる30のエンタープライズタスク,5つの問題クラス,4つの実行条件,セル毎に3つのレプリケーション,4つのモデルアーム – qwen_local, sonnet, gemma_openrouter,および補助的なopenaiクラウドバリデーションアーム – からなるフリーズマトリックスを実行する。
1,440個の出力はすべて固定されたソンネットルーブリックによって判定される。
主な発見は有界で運用上有用であるが、元々の厳密なH1ではない。
事前登録された正確な勝者/CI基準はサポートされない: 正確な勝者のアイデンティティはモデルアーム間で不安定であり、いくつかの予測戦略は、最良に観察された代替手段に近いが、上述の通りではない。
より弱いニアベストルーティングクレームが強くサポートされている。
事前登録されたモデルアームと問題クラス、および補助的なOpenAIバリデーションアームでは、予測戦略は最高の観測条件の0.10品質スコアポイント以内である。
構造化コンプライアンス検証は、オリジナルのマッピングの最も明確な例外である。
登録済みのKendall's Wテストでは、4つの調整条件が連続的にランク付けされるベトナムドメインと英語ドメインのタスク(どちらも0.20であり、符号付きランクp = .85)の信頼性の違いは見つからないため、H2はサポートされない。
企業コーディネート政策は、決定論的勝者選択法ではなく、校正デフォルトとして動的ルーティングを使用するべきであると結論付けている。
関連論文リスト
- KYA: A Framework-Agnostic Trust Layer for Autonomous Systems with Verifiable Provenance and Hierarchical Policy Composition [0.0]
KYA(Know Your Agents)は、自律システムのためのオープンソースのフレームワークに依存しない信頼層である。
PyPIのveldt-kyaパッケージとしてApache 2.0で利用可能である。
論文 参考訳(メタデータ) (2026-05-25T02:59:54Z) - An Interpretable CF-RL-TOPSIS Fusion Model for Skills-Aware Talent Recommendation [0.0]
本研究では,6つのセマンティックプロキシから構築したトランジション対応協調ブランチ,強化スタイルの職業家族バンディット,エントロピー重み付きTOPSISブランチを統合した遅延融合モデルを提案する。
このモデルは、2つのフリーズされたICTタレント履歴ベンチマーク、JobHopとKarrierewegeで、時系列トップ5ランキングとペアのWilcoxonテストを用いて評価されている。
論文 参考訳(メタデータ) (2026-05-22T19:22:58Z) - Coordination as an Architectural Layer for LLM-Based Multi-Agent Systems [0.0]
マルチエージェントLLMシステムは41%から87%の速度で生産に失敗する。
コーディネーションは、エージェントロジックと情報アクセスから分離可能なアーキテクチャ層として扱われるべきである、と我々は主張する。
我々はこれを予測市場における情報制御設計でインスタンス化する。
論文 参考訳(メタデータ) (2026-05-05T02:56:44Z) - Towards a Science of Scaling Agent Systems [79.64446272302287]
エージェント評価の定義を定式化し,エージェント量,コーディネーション構造,モデル,タスク特性の相互作用として,スケーリング法則を特徴付ける。
協調指標を用いて予測モデルを導出し,R2=0をクロスバリデーションし,未知のタスク領域の予測を可能にする。
ツールコーディネーショントレードオフ: 固定的な計算予算の下では, ツールヘビータスクはマルチエージェントのオーバーヘッドから不均衡に悩まされ, 2) 能力飽和: 調整が減少または負のリターンを, 単一エージェントのベースラインが45%を超えると達成できる。
論文 参考訳(メタデータ) (2025-12-09T06:52:21Z) - Eigen-1: Adaptive Multi-Agent Refinement with Monitor-Based RAG for Scientific Reasoning [53.45095336430027]
暗黙的な検索と構造化された協調を組み合わせた統合フレームワークを開発する。
Humanity's Last Exam (HLE) Bio/Chem Goldでは,48.3%の精度を実現している。
SuperGPQAとTRQAの結果はドメイン間の堅牢性を確認した。
論文 参考訳(メタデータ) (2025-09-25T14:05:55Z) - Pure Exploration under Mediators' Feedback [63.56002444692792]
マルチアームバンディット(Multi-armed bandits)は、各インタラクションステップにおいて、学習者が腕を選択し、報酬を観察する、シーケンシャルな意思決定フレームワークである。
本稿では,学習者が仲介者の集合にアクセスできるシナリオについて考察する。
本稿では,学習者には仲介者の方針が知られていると仮定して,最適な腕を発見するための逐次的意思決定戦略を提案する。
論文 参考訳(メタデータ) (2023-08-29T18:18:21Z) - Optimal Clustering with Bandit Feedback [57.672609011609886]
本稿では,バンディットフィードバックを用いたオンラインクラスタリングの問題点について考察する。
これは、NPハード重み付きクラスタリング問題をサブルーチンとして解決する必要性を回避するための、シーケンシャルなテストのための新しい停止規則を含む。
合成および実世界のデータセットの広範なシミュレーションを通して、BOCの性能は下界と一致し、非適応的ベースラインアルゴリズムよりも大幅に優れることを示す。
論文 参考訳(メタデータ) (2022-02-09T06:05:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。