論文の概要: From Inference Routing to Agent Orchestration: Declarative Policy Compilation with Cross-Layer Verification
- arxiv url: http://arxiv.org/abs/2603.27299v1
- Date: Sat, 28 Mar 2026 15:04:31 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-31 23:18:44.887602
- Title: From Inference Routing to Agent Orchestration: Declarative Policy Compilation with Cross-Layer Verification
- Title(参考訳): 推論ルーティングからエージェントオーケストレーションへ:クロス層検証による宣言的ポリシーコンパイル
- Authors: Huamin Chen, Xunzhuo Liu, Bowei He, Xue Liu,
- Abstract要約: Semantic Router DSLは、要求ごとの推論のために本番環境にデプロイされる非チューリング完全ポリシー言語である。
本稿では、ステートレスな要求ごとのルーティングからマルチステップのエージェントルーティングまで、同じ言語を拡張した。
- 参考スコア(独自算出の注目度): 10.651054435747385
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The Semantic Router DSL is a non-Turing-complete policy language deployed in production for per-request LLM inference routing: content signals (embedding similarity, PII detection, jailbreak scoring) feed into weighted projections and priority-ordered decision trees that select a model, enforce privacy policies, and produce structured audit traces -- all from a single declarative source file. Prior work established conflict-free compilation for probabilistic predicates and positioned the DSL within the Workload-Router-Pool inference architecture. This paper extends the same language from stateless, per-request routing to multi-step agent workflows -- the full path from inference gateway to agent orchestration to infrastructure deployment. The DSL compiler emits verified decision nodes for orchestration frameworks (LangGraph, OpenClaw), Kubernetes artifacts (NetworkPolicy, Sandbox CRD, ConfigMap), YANG/NETCONF payloads, and protocol-boundary gates (MCP, A2A) -- all from the same source. Because the language is non-Turing-complete, the compiler guarantees exhaustive routing, conflict-free branching, referential integrity, and audit traces structurally coupled to the decision logic. Because signal definitions are shared across targets, a threshold change propagates from inference gateway to agent gate to infrastructure artifact in one compilation step -- eliminating cross-team coordination as the primary source of policy drift. We ground the approach in four pillars -- auditability, cost efficiency, verifiability, and tunability -- and identify the verification boundary at each layer.
- Abstract(参考訳): コンテンツ信号(類似性、PII検出、ジェイルブレイクのスコアリング)は、重み付けされたプロジェクションと優先順位付けされた決定ツリーにフィードされ、モデルを選択し、プライバシポリシーを実行し、構造化された監査トレースを生成する。
以前の作業では、確率論的述語のためのコンフリクトフリーコンパイルを確立し、Workload-Router-Pool推論アーキテクチャ内にDSLを配置していた。
本稿では、同じ言語をステートレスなリクエスト単位のルーティングから、推論ゲートウェイからエージェントオーケストレーション、インフラストラクチャデプロイメントまでの完全なパスであるマルチステップエージェントワークフローに拡張する。
DSLコンパイラは、オーケストレーションフレームワーク(LangGraph、OpenClaw)、Kubernetesアーティファクト(NetworkPolicy、Sandbox CRD、ConfigMap)、YANG/NETCONFペイロード、プロトコルバウンダリゲート(MCP、A2A)の検証済みの決定ノードを同じソースから出力する。
言語はチューリング完全ではないため、コンパイラは徹底的なルーティング、コンフリクトのない分岐、参照整合性、そして決定ロジックに構造的に結合された監査トレースを保証する。
信号定義はターゲット間で共有されるため、しきい値の変更は、推論ゲートウェイからエージェントゲートから、ひとつのコンパイルステップでインフラストラクチャアーティファクトへと伝播する。
このアプローチを4つの柱 – 監査性,コスト効率,検証性,チューニング性 – に基盤を置いて,各レイヤの検証境界を特定します。
関連論文リスト
- The Workload-Router-Pool Architecture for LLM Inference Optimization: A Vision Paper from the vLLM Semantic Router Project [30.96691028676722]
vLLM Semantic Routerプロジェクトは、信号駆動ルーティング、コンテキスト長プールルーティング、ルータパフォーマンスエンジニアリング、ポリシー競合検出、低レイテンシ組み込みモデル、カテゴリ認識セマンティックキャッシング、ユーザフィードバック駆動ルーティング適応、幻覚検出、プライバシーとジェイルブレイク保護のための階層的コンテンツ安全分類を対象とする一連の作業をリリースした。
本稿では,LLM推論最適化のための3次元フレームワークであるWorkload-Pool-Poolアーキテクチャについて述べる。
論文 参考訳(メタデータ) (2026-03-22T18:30:11Z) - Conflict-Free Policy Languages for Probabilistic ML Predicates: A Framework and Case Study with the Semantic Router DSL [11.868735376461446]
ルーティングとアクセス制御システムのクラスは、確率的ML信号に基づいて決定を下す。
そのような2つのシグナルは、著者が分離することを意図したカテゴリで宣言され、同じクエリでしきい値をクリアし、それを静かに間違ったモデルにルーティングする。
本研究では, 実際に支配的な埋め込みの場合, 独立しきい値処理を温度スケールのソフトマックスに置き換えることで, 共ファイリングが不可能なヴォロノイ地域への埋め込み空間を分割することを示す。
論文 参考訳(メタデータ) (2026-03-18T18:14:34Z) - A Trace-Based Assurance Framework for Agentic AI Orchestration: Contracts, Testing, and Governance [0.22940141855172028]
本稿では,Large Language Models (LLM) を用いたエージェントAIシステムの保証フレームワークを提案する。
実行は、明示的なステップとトレースコントラクトを備えたメッセージ・アクション・トレース(MAT)として実装される。
このフレームワークは、有界摂動に対する予算付き反例探索として定式化されたストレステストを含む。
論文 参考訳(メタデータ) (2026-03-18T10:23:48Z) - vLLM Semantic Router: Signal Driven Decision Routing for Mixture-of-Modality Models [8.433829083279518]
vLLM Semantic Routerは、Mixture-of-Modality(MoM)モデルデプロイメントのための信号駆動決定ルーティングフレームワークである。
システムは、各要求から異種信号タイプを抽出する。
異なるデプロイメントシナリオは、同じアーキテクチャ上で異なるシグナル決定構成として表現される。
論文 参考訳(メタデータ) (2026-02-23T15:00:01Z) - Let It Flow: Agentic Crafting on Rock and Roll, Building the ROME Model within an Open Agentic Learning Ecosystem [90.17610617854247]
本稿では,エージェントモデルの生産パイプラインを最適化する基盤インフラであるエージェント学習エコシステム(ALE)を紹介する。
ALEは、重量最適化のためのトレーニング後のフレームワークであるROLL、軌道生成のためのサンドボックス環境マネージャであるROCK、効率的なコンテキストエンジニアリングのためのエージェントフレームワークであるiFlow CLIの3つのコンポーネントで構成されている。
ROMEはALEが基盤として100万件以上のトラジェクトリをトレーニングしたオープンソースエージェントです。
論文 参考訳(メタデータ) (2025-12-31T14:03:39Z) - AgentRouter: A Knowledge-Graph-Guided LLM Router for Collaborative Multi-Agent Question Answering [51.07491603393163]
tAgentは知識グラフ誘導ルーティング問題としてマルチエージェントQAを定式化するフレームワークである。
エージェントアウトプットのソフトな監督と重み付けされた集約を活用することで、エージェントは多様なエージェントの相補的な強みを捉える、原則化された協調スキームを学ぶ。
論文 参考訳(メタデータ) (2025-10-06T23:20:49Z) - Rethinking Testing for LLM Applications: Characteristics, Challenges, and a Lightweight Interaction Protocol [83.83217247686402]
大言語モデル(LLM)は、単純なテキストジェネレータから、検索強化、ツール呼び出し、マルチターンインタラクションを統合する複雑なソフトウェアシステムへと進化してきた。
その固有の非決定主義、ダイナミズム、文脈依存は品質保証に根本的な課題をもたらす。
本稿では,LLMアプリケーションを3層アーキテクチャに分解する: textbftextitSystem Shell Layer, textbftextitPrompt Orchestration Layer, textbftextitLLM Inference Core。
論文 参考訳(メタデータ) (2025-08-28T13:00:28Z) - RCR-Router: Efficient Role-Aware Context Routing for Multi-Agent LLM Systems with Structured Memory [57.449129198822476]
RCRは、マルチエージェント大言語モデル(LLM)システムのためのロールアウェアコンテキストルーティングフレームワークである。
役割とタスクステージに基づいて、各エージェントに対して意味的に関連するメモリサブセットを動的に選択する。
軽量スコアリングポリシは、メモリ選択をガイドし、エージェント出力を共有メモリストアに統合する。
論文 参考訳(メタデータ) (2025-08-06T21:59:34Z) - HADA: Human-AI Agent Decision Alignment Architecture [0.0]
HADAはプロトコルとフレームワークのリファレンスアーキテクチャであり、大きな言語モデル(LLM)エージェントとレガシーアルゴリズムの両方を組織的目標と値に一致させる。
技術的および非技術的アクターは、戦略的、戦術的、リアルタイムな地平線を越えて、あらゆる決定をクエリ、ステア、監査、または競合することができる。
論文 参考訳(メタデータ) (2025-06-01T14:04:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。