論文の概要: From Admission to Invariants: Measuring Deviation in Delegated Agent Systems
- arxiv url: http://arxiv.org/abs/2604.17517v2
- Date: Tue, 21 Apr 2026 18:18:32 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-23 15:36:10.357925
- Title: From Admission to Invariants: Measuring Deviation in Delegated Agent Systems
- Title(参考訳): 許可から不変性へ:分解剤系における偏差の測定
- Authors: Marcelo Fernandez,
- Abstract要約: エージェントの行動が入場時に確立された許容行動空間A0内に留まっているかどうかを,施行に基づくガバナンスでは判断できないことを示す。
実施に基づく監視のための情報理論上の不可能性を証明し、IMLが検出遅延を許容できる限り有限に抑えた入場時間ドリフトを検出することを示す。
- 参考スコア(独自算出の注目度): 0.4929694290403903
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Autonomous agent systems are governed by enforcement mechanisms that flag hard constraint violations at runtime. The Agent Control Protocol identifies a structural limit of such systems: a correctly-functioning enforcement engine can enter a regime in which behavioral drift is invisible to it, because the enforcement signal operates below the layer where deviation is measurable. We show that enforcement-based governance is structurally unable to determine whether an agent behavior remains within the admissible behavior space A0 established at admission time. Our central result, the Non-Identifiability Theorem, proves that A0 is not in the sigma-algebra generated by the enforcement signal g under the Local Observability Assumption, which every practical enforcement system satisfies. The impossibility arises from a fundamental mismatch: g evaluates actions locally against a point-wise rule set, while A0 encodes global, trajectory-level behavioral properties set at admission time. An agent can therefore drift -- systematically shifting its behavioral distribution away from admission-time expectations -- while every individual action remains within the permitted action space. We define the Invariant Measurement Layer (IML), which bypasses this limitation by retaining direct access to the generative model of A0, restoring observability precisely in the region where enforcement is structurally blind. We prove an information-theoretic impossibility for enforcement-based monitoring and show IML detects admission-time drift with provably finite detection delay. Validated across four settings: three drift scenarios (300 and 1000 steps), a live n8n webhook pipeline, and a LangGraph StateGraph agent -- enforcement triggers zero violations while IML detects each drift type within 9-258 steps of drift onset.
- Abstract(参考訳): 自律エージェントシステムは、実行時に厳しい制約違反をフラグする執行機構によって管理される。
エージェント制御プロトコル(Agen Control Protocol)は、そのようなシステムの構造的限界を識別する: 正しく機能する機関は、偏差が測定可能な層の下にあるため、動作のドリフトが見えない状態に入ることができる。
エージェントの動作が入場時に確立された許容行動空間A0内に留まっているかどうかを,施行に基づくガバナンスが構造的に決定できないことを示す。
我々の中心的な結果であるNon-Identifiability Theoremは、A0が局所可観測性推定(Local Observability Assumption)の下での強制信号gによって生成されるシグマ代数にはないことを証明している。
g はポイントワイドな規則集合に対して局所的に行動を評価するが、A0 は入場時に設定されたグローバルな軌道レベルの行動特性を符号化する。
エージェントは、許可されたアクション空間内に個々のアクションが残されている間、その行動分布を入院時の期待から体系的にシフトさせることができる。
Invariant Measurement Layer (IML) は、A0の生成モデルへの直接アクセスを維持することにより、この制限を回避し、構造的に盲目な領域において、正確に可観測性を回復する。
実施に基づく監視のための情報理論上の不可能性を証明し、IMLが検出遅延を許容できる限り有限に抑えた入場時間ドリフトを検出することを示す。
3つのドリフトシナリオ(300ステップと1000ステップ)、ライブのn8n webhookパイプライン、LangGraph StateGraphエージェントの4つの設定で検証されている。
関連論文リスト
- Label-Free Detection of Governance Evidence Degradation in Risk Decision Systems [0.0]
不正検出・信用スコアリングにおけるリスク決定システムは、構造ラベルが存在しない状態で運用される。
既存のフレームワークは、ドリフト検出とガバナンスエビデンス評価と運用対応を統合していません。
本稿では,ガバナンスドリフトツールキットのラベルフリーガバナンス監視拡張について述べる。
論文 参考訳(メタデータ) (2026-04-20T05:46:15Z) - Agent Control Protocol: Admission Control for Agent Actions [0.4929694290403903]
エージェントコントロールプロトコル(エージェントコントロールプロトコル、ACP)は、B2Bの機関環境における自律エージェントの受け入れ制御ガバナンスのための正式な仕様である。
ACPは、暗号ID、能力に基づく認可、決定論的リスク評価、連鎖デリゲート、および暗号化連鎖監査を定義する。
ACPはRBACとZero Trustの上で動作し、どちらのモデルも解決しない問題に対処する。
論文 参考訳(メタデータ) (2026-03-19T12:28:28Z) - Unsupervised Conformal Inference: Bootstrapping and Alignment to Control LLM Uncertainty [49.19257648205146]
生成のための教師なし共形推論フレームワークを提案する。
我々のゲートは、分断されたUPPよりも厳密で安定した閾値を提供する。
その結果は、ラベルのない、API互換の、テスト時間フィルタリングのゲートになる。
論文 参考訳(メタデータ) (2025-09-26T23:40:47Z) - CANTXSec: A Deterministic Intrusion Detection and Prevention System for CAN Bus Monitoring ECU Activations [53.036288487863786]
物理ECUアクティベーションに基づく最初の決定論的侵入検知・防止システムであるCANTXSecを提案する。
CANバスの古典的な攻撃を検知・防止し、文献では調査されていない高度な攻撃を検知する。
物理テストベッド上での解法の有効性を実証し,攻撃の両クラスにおいて100%検出精度を達成し,100%のFIAを防止した。
論文 参考訳(メタデータ) (2025-05-14T13:37:07Z) - Defending against Indirect Prompt Injection by Instruction Detection [109.30156975159561]
InstructDetectorは、LLMの動作状態を利用して潜在的なIPI攻撃を特定する、新しい検出ベースのアプローチである。
InstructDetectorは、ドメイン内設定で99.60%、ドメイン外設定で96.90%の検出精度を達成し、攻撃成功率をBIPIAベンチマークで0.03%に下げる。
論文 参考訳(メタデータ) (2025-05-08T13:04:45Z) - SOPBench: Evaluating Language Agents at Following Standard Operating Procedures and Constraints [59.645885492637845]
SOPBenchは、各サービス固有のSOPコードプログラムを実行可能な関数の有向グラフに変換する評価パイプラインである。
提案手法では,各サービス固有のSOPコードプログラムを実行可能関数の有向グラフに変換し,自然言語SOP記述に基づいてこれらの関数を呼び出しなければならない。
我々は18の先行モデルを評価し、上位モデルでさえタスクが困難であることを示す。
論文 参考訳(メタデータ) (2025-03-11T17:53:02Z) - DARTH: Holistic Test-time Adaptation for Multiple Object Tracking [87.72019733473562]
複数物体追跡(MOT)は、自律運転における知覚システムの基本的構成要素である。
運転システムの安全性の追求にもかかわらず、テスト時間条件における領域シフトに対するMOT適応問題に対する解決策は提案されていない。
我々はMOTの総合的なテスト時間適応フレームワークであるDARTHを紹介する。
論文 参考訳(メタデータ) (2023-10-03T10:10:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。