論文の概要: SDOF: Taming the Alignment Tax in Multi-Agent Orchestration with State-Constrained Dispatch
- arxiv url: http://arxiv.org/abs/2605.15204v1
- Date: Mon, 20 Apr 2026 12:51:39 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-25 12:34:33.82289
- Title: SDOF: Taming the Alignment Tax in Multi-Agent Orchestration with State-Constrained Dispatch
- Title(参考訳): SDOF:多エージェントオーケストレーションにおけるアライメント税のテーピング : 国家制約付きディスパッチ
- Authors: Zhantao Wang,
- Abstract要約: 制約状態マシンとしてマルチエージェント実行を扱うフレームワークであるSDOFを提案する。
Beisen iTalentプラットフォームが支援する採用システムでは、専門家による185のシナリオが1671のライブAPIコールを起動する。
GSPO 対応 7B Intent Router は,この FSM 制約付き逆ルーティングベンチマークにおいてゼロショット GPT-4o よりも高いジョイント精度を実現する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Multi-agent orchestration frameworks such as LangChain, LangGraph, and CrewAI route tasks through graph-based pipelines but do not enforce the stage constraints that govern real business processes. We present SDOF, a framework that treats multi-agent execution as a constrained state machine. SDOF operates through two primary defensive layers, implemented by three components: (1) an Online-RLHF Specialized Intent Router trained via Generative Reward Modeling (GRPO) and (2) a StateAwareDispatcher with GoalStage finite-automaton checks and precondition/postcondition SkillRegistry validation for auditable execution control. On a recruitment system backed by the Beisen iTalent platform (6000+ enterprises), 185 expert-curated scenarios trigger 1671 live API calls. Our GSPO-aligned 7B Intent Router achieves higher joint accuracy than zero-shot GPT-4o on this FSM-constrained adversarial routing benchmark (80.9% versus 48.9%). In end-to-end execution, SDOF reaches 86.5% task completion (95% confidence interval 80.8 to 90.7) and blocks all 22 operations in the injection, illegal HR subset. Under a broader message-level blocking audit, SDOF attains precision 100% and recall 88%, expert agreement kappa=0.94. A separate evaluation on 960 SGD-derived dialogues spanning 8 service domains surfaces 201 stage-order conflicts under our FSM mapping, 41 of which arise in the normal split. This arXiv version reports the current validated scope; extended multi-seed training comparisons and deeper workflow evaluations will be released in a subsequent update.
- Abstract(参考訳): LangChain、LangGraph、CrewAIといったマルチエージェントオーケストレーションフレームワークは、グラフベースのパイプラインを通じてタスクをルーティングするが、実際のビジネスプロセスを管理するステージ制約は強制しない。
制約状態マシンとしてマルチエージェント実行を扱うフレームワークであるSDOFを提案する。
SDOFは,(1)ジェネレーティブ・リワード・モデリング(GRPO)によりトレーニングされたオンラインRLHF特化インテント・ルータ,(2)GoalStage有限オートマトンチェックを備えたStateAwareDispatcher,および、監査可能な実行制御のためのプレコンディション/ポストコンディショニング・スキル登録検証という,2つの主要な防御レイヤを通じて動作する。
Beisen iTalentプラットフォーム(6000以上の企業)が支援する採用システムでは、専門家による185のシナリオが1671のライブAPIコールを起動する。
GSPO 対応 7B Intent Router は,この FSM 制約付き対向ルーティングベンチマーク (80.9% 対 48.9% ) においてゼロショット GPT-4o よりも高いジョイント精度を実現する。
エンドツーエンド実行では、SDOFは86.5%のタスク完了(95%信頼区間80.8から90.7)に達し、インジェクション中の22の操作をすべてブロックする。
より広範なメッセージレベルのブロッキング監査の下で、SDOFは100%の精度を獲得し、88%の専門家合意であるkappa=0.94をリコールする。
8つのサービスドメインにまたがる960のSGD由来の対話に対する別の評価では、FSMマッピングの下で201のステージオーダーの競合が表面化しており、そのうち41は通常の分割で発生する。
このarXivバージョンでは、現在の検証済みスコープが報告されている。 拡張されたマルチシードトレーニング比較とより深いワークフロー評価は、その後のアップデートでリリースされる予定である。
関連論文リスト
- CHI-Bench: Can AI Agents Automate End-to-End, Long-Horizon, Policy-Rich Healthcare Workflows? [150.84850629123287]
現実的な医療業務のエンドツーエンドの自動化は、現在のベンチマークで不足している3つの機能を強調します。
$-Benchは3つのドメインにわたる長期医療のベンチマークである。
30以上のエージェントハーネス/モデル構成で、最高のエージェントはタスクの28.0%しか解決せず、厳格なパス3では20%をクリアし、単一のセッションですべてのタスクを実行するとパフォーマンスは3.8%に低下する。
論文 参考訳(メタデータ) (2026-05-15T22:34:31Z) - ClawForge: Generating Executable Interactive Benchmarks for Command-Line Agents [59.626170560327274]
textbfClawForgeは、ステートコンフリクト下で実行可能なコマンドラインカテゴリのためのジェネレータベースのベンチマークフレームワークである。
私たちはこのフレームワークをClawForge-Bench(17のシナリオ、6の能力カテゴリ)としてインスタンス化します。
論文 参考訳(メタデータ) (2026-05-13T21:34:08Z) - Beyond Task Success: Measuring Workflow Fidelity in LLM-Based Agentic Payment Systems [1.8717456484053328]
エージェント成功率(ASR)は、観測されたエージェントの実行シーケンスと期待されるエージェントの実行シーケンスを比較する軌跡-忠実度メトリックである。
ASRは18のLLMと90,000のタスクインスタンスにわたる階層型マルチエージェントシステム(HMASP)に適用される。
ASR診断によって誘導されるプロンプト改良と決定論的ルーティングガードは、大幅にTSRの改善をもたらす。
論文 参考訳(メタデータ) (2026-05-07T15:50:26Z) - Measuring the Permission Gate: A Stress-Test Evaluation of Claude Code's Auto Mode [9.116800340266066]
Claude Codeの自動モードは、AIコーディングエージェントに最初にデプロイされたパーミッションシステムである。
Anthropicは、生産トラフィックに対して0.4%の偽陽性率と17%の偽陰性率を報告している。
本研究では, 個々の行動レベルでの状態変化行動253件を, オラクル・グラウンドの真理に対して評価した。
論文 参考訳(メタデータ) (2026-04-04T17:56:30Z) - AVDA: Autonomous Vibe Detection Authoring for Cybersecurity [0.1633272850273525]
AVDAは、モデルコンテキストプロトコル(MCP)を活用して、組織コンテキストをAI支援コード生成に統合することで検出を自動化するフレームワークである。
我々は,多種多様な生産検出コーパスと最先端LCMの3つのオーサリング戦略 – Baseline, Sequential, Agentic – を評価した。
その結果,エージェント品質の87%をトークンコストの40倍以下で達成できた。
論文 参考訳(メタデータ) (2026-03-26T21:52:33Z) - SKILLS: Structured Knowledge Injection for LLM-Driven Telecommunications Operations [0.0]
汎用言語モデル(LLM)エージェントは、実際のAPIインターフェースを介して通信操作を実行するか、あるいは、構造化されたドメインガイダンスを必要とするか?
8 TM Forum Open APIドメインにまたがる37の通信シナリオからなるベンチマークフレームワークであるSKILLSを紹介した。
5つのオープンウェイトモデル条件と185のシナリオランの結果は、すべてのモデルで一貫したスキルリフトを示している。
論文 参考訳(メタデータ) (2026-03-16T14:48:53Z) - Towards a Science of Scaling Agent Systems [79.64446272302287]
エージェント評価の定義を定式化し,エージェント量,コーディネーション構造,モデル,タスク特性の相互作用として,スケーリング法則を特徴付ける。
協調指標を用いて予測モデルを導出し,R2=0をクロスバリデーションし,未知のタスク領域の予測を可能にする。
ツールコーディネーショントレードオフ: 固定的な計算予算の下では, ツールヘビータスクはマルチエージェントのオーバーヘッドから不均衡に悩まされ, 2) 能力飽和: 調整が減少または負のリターンを, 単一エージェントのベースラインが45%を超えると達成できる。
論文 参考訳(メタデータ) (2025-12-09T06:52:21Z) - SOPBench: Evaluating Language Agents at Following Standard Operating Procedures and Constraints [59.645885492637845]
SOPBenchは、各サービス固有のSOPコードプログラムを実行可能な関数の有向グラフに変換する評価パイプラインである。
提案手法では,各サービス固有のSOPコードプログラムを実行可能関数の有向グラフに変換し,自然言語SOP記述に基づいてこれらの関数を呼び出しなければならない。
我々は18の先行モデルを評価し、上位モデルでさえタスクが困難であることを示す。
論文 参考訳(メタデータ) (2025-03-11T17:53:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。