論文の概要: Harnessing Embodied Agents: Runtime Governance for Policy-Constrained Execution
- arxiv url: http://arxiv.org/abs/2604.07833v2
- Date: Fri, 10 Apr 2026 01:58:54 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-13 13:51:27.761156
- Title: Harnessing Embodied Agents: Runtime Governance for Policy-Constrained Execution
- Title(参考訳): ハーネスング・エンボディード・エージェント:政策制約された実行のための実行時ガバナンス
- Authors: Xue Qin, Simin Luan, John See, Cong Yang, Zhijun Li,
- Abstract要約: エージェントは受動的推論システムから、ツールやロボット、物理的環境と相互作用するアクティブエグゼクタへと進化している。
既存のアプローチでは、エージェントループ内に安全性とリカバリが組み込まれているため、実行制御の標準化、監査、適応が困難になる。
本稿では,エージェント認知と実行監視を分離する,ポリシー制約付き実行のためのフレームワークを提案する。
- 参考スコア(独自算出の注目度): 14.412476605788482
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Embodied agents are evolving from passive reasoning systems into active executors that interact with tools, robots, and physical environments. Once granted execution authority, the central challenge becomes how to keep actions governable at runtime. Existing approaches embed safety and recovery logic inside the agent loop, making execution control difficult to standardize, audit, and adapt. This paper argues that embodied intelligence requires not only stronger agents, but stronger runtime governance. We propose a framework for policy-constrained execution that separates agent cognition from execution oversight. Governance is externalized into a dedicated runtime layer performing policy checking, capability admission, execution monitoring, rollback handling, and human override. We formalize the control boundary among the embodied agent, Embodied Capability Modules (ECMs), and runtime governance layer, and validate through 1000 randomized simulation trials across three governance dimensions. Results show 96.2% interception of unauthorized actions, reduction of unsafe continuation from 100% to 22.2% under runtime drift, and 91.4% recovery success with full policy compliance, substantially outperforming all baselines (p<0.001). By reframing runtime governance as a first-class systems problem, this paper positions policy-constrained execution as a key design principle for embodied agent systems.
- Abstract(参考訳): エージェントは受動的推論システムから、ツールやロボット、物理的環境と相互作用するアクティブエグゼクタへと進化している。
一度実行権限が与えられると、中央の課題は実行時にアクションを管理可能にする方法になる。
既存のアプローチでは、エージェントループ内に安全性とリカバリロジックを組み込むことで、実行制御の標準化、監査、適応が困難になる。
本稿では、インテリジェンスを具現化するには、より強力なエージェントだけでなく、より強力なランタイムガバナンスが必要であると論じる。
本稿では,エージェント認知と実行監視を分離する,ポリシー制約付き実行のためのフレームワークを提案する。
ガバナンスは、ポリシーチェック、機能受け入れ、実行監視、ロールバック処理、ヒューマンオーバーライドを実行する専用のランタイム層に外部化されます。
実施エージェント,Embodied Capability Modules (ECMs) およびランタイムガバナンス層間の制御境界を形式化し,3つのガバナンス領域にわたる1000のランダム化シミュレーション試行を通じて検証する。
その結果、不正行為の96.2%のインターセプト、安全でない継続を100%から22.2%に減らし、完全なポリシー準拠で91.4%のリカバリが成功し、全てのベースラインを大幅に上回った(p<0.001)。
ランタイムガバナンスを第一級システム問題として再考することにより,エージェントシステムの鍵となる設計原則として,ポリシー制約付き実行を位置づける。
関連論文リスト
- From Governance Norms to Enforceable Controls: A Layered Translation Method for Runtime Guardrails in Agentic AI [0.0]
本稿では,標準由来のガバナンス目標を4つのコントロール層に結合するレイヤ変換手法を提案する。
ガバナンスの目的、技術的なコントロール、ランタイムのガードレール、保証の証拠を区別します。
標準は、アーキテクチャ、ランタイムポリシー、ヒューマンエスカレーション、監査を横断するコントロール配置をガイドしなければなりません。
論文 参考訳(メタデータ) (2026-04-06T22:49:28Z) - When Should a Robot Think? Resource-Aware Reasoning via Reinforcement Learning for Embodied Robotic Decision-Making [68.12864562049957]
身体ロボットシステムは、高レベルの推論をサポートするために、大規模言語モデル(LLM)ベースのエージェントにますます依存している。
エージェントはいつ、いつ、いつ行動すべきか?
本稿では,エンボディエージェントのリソース・アウェア・オーケストレーションのための階層的なフレームワークであるRARRL(Resource-Aware Reasoning via Reinforcement Learning)を提案する。
論文 参考訳(メタデータ) (2026-03-17T15:38:50Z) - Cryptographic Runtime Governance for Autonomous AI Systems: The Aegis Architecture for Verifiable Policy Enforcement [0.0]
本稿では,自律型AIシステムのためのランタイムガバナンスアーキテクチャであるAegisについて述べる。
エージスは政策と法的制約を諮問の原則よりも実行条件として扱う。
論文 参考訳(メタデータ) (2026-03-15T04:04:57Z) - The Controllability Trap: A Governance Framework for Military AI Agents [0.0]
我々はエージェント軍事AIガバナンスフレームワーク(AMAGF)を提案する。
AMAGFは、予防的ガバナンス、予防的ガバナンス、矯正的ガバナンスの3つの柱を中心に構成された測定可能なアーキテクチャである。
制御品質スコア(英: Control Quality Score, CQS)は、人間の制御を定量化し、制御が弱まるにつれて累積応答を可能にする複合リアルタイムメトリックである。
論文 参考訳(メタデータ) (2026-03-03T20:48:01Z) - When Actions Go Off-Task: Detecting and Correcting Misaligned Actions in Computer-Use Agents [50.5814495434565]
この研究は、コンピュータ利用エージェント(CUA)における不整合検出を定義し、研究する最初の試みである。
実世界のCUAデプロイメントにおける3つの一般的なカテゴリを特定し、人間の注釈付きアクションレベルのアライメントラベルを用いたリアルな軌跡のベンチマークであるMisActBenchを構築した。
本稿では,実行前に不整合を検知し,構造化されたフィードバックによって繰り返し修正する,実用的で普遍的なガードレールであるDeActionを提案する。
論文 参考訳(メタデータ) (2026-02-09T18:41:15Z) - Governance-as-a-Service: A Multi-Agent Framework for AI System Compliance and Policy Enforcement [0.0]
ガバナンス・アズ・ア・サービス(Government-as-a-Service:G)は、エージェントのアウトプットを実行時に規制するポリシー駆動の執行層である。
Gは宣言的ルールと、違反のコンプライアンスと深刻度に基づいてエージェントをスコアするTrust Factorメカニズムを採用している。
その結果、Gはスループットを保ちながら高いリスクの振る舞いを確実にブロックまたはリダイレクトすることを示した。
論文 参考訳(メタデータ) (2025-08-26T07:48:55Z) - Security Challenges in AI Agent Deployment: Insights from a Large Scale Public Competition [101.86739402748995]
44の現実的なデプロイメントシナリオを対象とした,22のフロンティアAIエージェントを対象にしています。
Agent Red Teamingベンチマークを構築し、19の最先端モデルで評価します。
私たちの発見は、今日のAIエージェントの重要かつ永続的な脆弱性を浮き彫りにしたものです。
論文 参考訳(メタデータ) (2025-07-28T05:13:04Z) - SOPBench: Evaluating Language Agents at Following Standard Operating Procedures and Constraints [59.645885492637845]
SOPBenchは、各サービス固有のSOPコードプログラムを実行可能な関数の有向グラフに変換する評価パイプラインである。
提案手法では,各サービス固有のSOPコードプログラムを実行可能関数の有向グラフに変換し,自然言語SOP記述に基づいてこれらの関数を呼び出しなければならない。
我々は18の先行モデルを評価し、上位モデルでさえタスクが困難であることを示す。
論文 参考訳(メタデータ) (2025-03-11T17:53:02Z) - Robust Deep Reinforcement Learning against Adversarial Perturbations on
State Observations [88.94162416324505]
深部強化学習(DRL)エージェントは、自然な測定誤差や対向雑音を含む観測を通して、その状態を観察する。
観測は真の状態から逸脱するので、エージェントを誤解させ、準最適行動を起こすことができる。
本研究は, 従来の手法を, 対人訓練などの分類タスクの堅牢性向上に応用することは, 多くのRLタスクには有効でないことを示す。
論文 参考訳(メタデータ) (2020-03-19T17:59:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。