論文の概要: Insuring Every Action: An Authority Frontier Framework for Runtime Actuarial Control of Autonomous AI Agents
- arxiv url: http://arxiv.org/abs/2605.25632v1
- Date: Mon, 25 May 2026 09:31:48 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-26 19:50:19.625414
- Title: Insuring Every Action: An Authority Frontier Framework for Runtime Actuarial Control of Autonomous AI Agents
- Title(参考訳): すべてのアクションをインストールする: 自律型AIエージェントのランタイムアクチュエータ制御のためのオーソリティフロンティアフレームワーク
- Authors: Hao-Hsuan Chen,
- Abstract要約: 本稿では,アクタリカル・アクション・インタフェース (AAI) を提案する。
次に、各予備資本のレベルにおいて、ランタイムがどれだけ自律的にリリースするかを測定する、評価プリミティブであるオーソリティフロンティアを開発します。
このコントリビューションは、自律エージェントサイドエフェクトのランタイムアクチュエータ制御のためのベンチマーク対応評価フレームワークである。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Autonomous AI agents increasingly issue side-effect-bearing actions: database mutations, refunds, payments, external commitments. We propose the Actuarial Action Interface (AAI), a deterministic runtime contract that prices each such action against a contractually fixed safe default under a time-consistent risk mapping, and gates execution against a per-boundary reserve capital budget. We then develop the Authority Frontier, an evaluation primitive measuring how much autonomous authority the runtime releases at each level of reserve capital. The framework provides (i) a deterministic quote-bind-commit protocol with toll-bounded capability tokens; (ii) a universal seven-class action taxonomy mapping heterogeneous tool calls to comparable authority units; (iii) replay determinism and pathwise reserve coverage under alpha-spending; (iv) cross-domain normalization via full reserve demand C_full and capital metrics Capital@k. We instantiate AAI across four agentic environments (database mutation, customer-service refund, and the public tau-bench retail and airline tool-use traces) and report a live Postgres panel in which three Azure-hosted models propose actions through the same contract. The frontier exhibits a common low-reserve refusal and intermediate-release pattern across domains, with saturation only where the budget grid reaches full reserve demand; required reserve capital varies by 22x (Capital@50 from 289 to 6457). The framework does not force domains into the same shape; it surfaces each domain's actuarial geometry. In the live panel the contract prevents realized loss across all three models at low budget while differing in underwriting persistence under denial: model identity is an actuarial underwriting variable. The contribution is a benchmark-ready evaluation framework for runtime actuarial control of autonomous-agent side effects.
- Abstract(参考訳): 自律型AIエージェントは、データベースの突然変異、返金、支払い、外部のコミットメントといった副作用のあるアクションをますます発行する。
本稿では,時間的制約のあるリスクマッピングの下で,契約的に固定されたセーフデフォルトに対して各アクションを価格設定する決定論的ランタイム契約であるアクチュアリアル・アクション・インタフェース(AAI)を提案し,また,各リザーブド・キャピタル予算に対する実行をゲートする。
次に、各予備資本のレベルにおいて、ランタイムがどれだけ自律的にリリースするかを測定する、評価プリミティブであるオーソリティフロンティアを開発します。
フレームワークが提供する
i) toll-bounded capabilities tokensによる決定論的引用-bind-commitプロトコル
(ii) 異種ツールコールを同等の権限単位にマッピングする普遍的な7級行動分類
三 アルファ・スペンディングによる決定主義及びパスワイズ・リザーブ・カバーの再生
(四)全リザーブドC_full及びキャピタル@kによるクロスドメイン正規化
AAIを4つのエージェント環境(データベースの突然変異、カスタマーサービス返金、パブリックなタウベンチと航空会社のツール使用トレース)にわたってインスタンス化し、Azureがホストする3つのモデルが同じ契約を通じてアクションを提案する、ライブのPostgresパネルを報告します。
このフロンティアは、予算グリッドが完全なリザーブド需要に達する場合にのみ飽和し、要求されるリザーブ・キャピタルが22倍(Capital@50:289〜6457)となるような、共通の低リザーブ・リザーブ・アンド・中間レザーブ・パターンを示す。
このフレームワークはドメインを同じ形に強制するのではなく、各ドメインのアクチュエーター幾何学を表面化する。
ライブパネルでは、契約は低予算で3つのモデルにまたがる損失を防止します。
このコントリビューションは、自律エージェントサイドエフェクトのランタイムアクチュエータ制御のためのベンチマーク対応評価フレームワークである。
関連論文リスト
- ComplexMCP: Evaluation of LLM Agents in Dynamic, Interdependent, and Large-Scale Tool Sandbox [61.862814740220806]
$textbfComplexMCP$は厳格な条件下でエージェントを評価するために設計されたベンチマークである。
Model Context Protocol (MCP)上に構築された$textbfComplexMCP$は300以上の精巧にテストされたツールを提供する。
論文 参考訳(メタデータ) (2026-05-11T16:20:51Z) - AgenticAITA: A Proof-Of-Concept About Deliberative Multi-Agent Reasoning for Autonomous Trading Systems [0.0]
AgentICAITAはエージェントAIフレームワークで、従来のシグナルを置き換えて、完全に自律的なループでパラダイムを実行する。
このフレームワークは、76の資産にわたる157のゼロ・インターベンション・呼び出しを達成し、デリバティブ・パイプラインの運用上の正しさを示す。
論文 参考訳(メタデータ) (2026-05-01T16:25:43Z) - Governing What You Cannot Observe: Adaptive Runtime Governance for Autonomous AI Agents [0.0]
自律的なAIエージェントは、完全に認証されたままで、振る舞いのドリフト、敵の適応、決定パターンのシフトによって、コードの変更なしに、安全が保たれる。
エージェントの管理は、未観測のリスクに対する限界を見積もることを減らす。
textbfRiskGateはこのフレームワークを、専用の統計推定器(KL分散、セグメント-vs-rest $z$-tests、シーケンシャルパターンマッチング)、フェイルセーフなモノトニックパイプライン、クローズドループオートパイロットでインスタンス化する。
論文 参考訳(メタデータ) (2026-04-27T16:46:15Z) - Taming Actor-Observer Asymmetry in Agents via Dialectical Alignment [59.536125286960186]
セルフリフレクションと相互監査を可能にするために、専門的な役割を割り当てるマルチエージェントフレームワークがますます採用されている。
アクター・オブザーバ非対称性(Actor-Observer Asymmetric)と呼ばれる認知バイアスを同時に誘発する。
ReTASは、対立する視点を客観的なコンセンサスに合成するためにエージェントを誘導する。
論文 参考訳(メタデータ) (2026-04-21T15:05:58Z) - Harness as an Asset: Enforcing Determinism via the Convergent AI Agent Framework (CAAF) [0.0]
大規模言語モデルは、安全クリティカルエンジニアリングにおける制御可能性のギャップを生み出します。
本稿では,エージェントをオープンループ生成からクローズループフェールセーフ決定性に移行するConvergent AI Agent Framework(CAAF)を紹介する。
CAAFの3つの柱は相補的な故障面に対処し、コモディティコストで制御可能性ギャップを閉じることはない。
論文 参考訳(メタデータ) (2026-04-18T15:15:09Z) - Quantifying Self-Preservation Bias in Large Language Models [9.590157416396194]
本稿では,emphTwo-role Benchmark for Self-Preservationを紹介する。
役割アイデンティティが客観的ユーティリティを過度に上回る頻度を測定する。
我々は,低改善体制下では,モデルが解釈スラックを利用してポストホック合理化を行うのを観察する。
論文 参考訳(メタデータ) (2026-04-02T15:38:31Z) - Adversarial Intent is a Latent Variable: Stateful Trust Inference for Securing Multimodal Agentic RAG [5.4716896485317195]
マルチモーダルエージェントRAGに対する現在のステートレスディフェンスは、悪意のあるセマンティクスを配布する敵の戦略を検出するのに失敗する。
MMA-RAGTは,MTA (Modular Trust Agent) が管理する推定時制御フレームワークで,ほぼ信頼状態を維持している。
論文 参考訳(メタデータ) (2026-02-24T23:52:27Z) - Towards a Science of Scaling Agent Systems [79.64446272302287]
エージェント評価の定義を定式化し,エージェント量,コーディネーション構造,モデル,タスク特性の相互作用として,スケーリング法則を特徴付ける。
協調指標を用いて予測モデルを導出し,R2=0をクロスバリデーションし,未知のタスク領域の予測を可能にする。
ツールコーディネーショントレードオフ: 固定的な計算予算の下では, ツールヘビータスクはマルチエージェントのオーバーヘッドから不均衡に悩まされ, 2) 能力飽和: 調整が減少または負のリターンを, 単一エージェントのベースラインが45%を超えると達成できる。
論文 参考訳(メタデータ) (2025-12-09T06:52:21Z) - VCG Mechanism Design with Unknown Agent Values under Stochastic Bandit
Feedback [104.06766271716774]
本研究では,エージェントが自己の価値を知らない場合に,マルチラウンドの福祉最大化機構設計問題について検討する。
まず、福祉に対する後悔の3つの概念、各エージェントの個々のユーティリティ、メカニズムの3つの概念を定義します。
当社のフレームワークは価格体系を柔軟に制御し、エージェントと販売者の後悔のトレードオフを可能にする。
論文 参考訳(メタデータ) (2020-04-19T18:00:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。