論文の概要: A Five-Plane Reference Architecture for Runtime Governance of Production AI Agents
- arxiv url: http://arxiv.org/abs/2606.12320v1
- Date: Wed, 10 Jun 2026 16:54:47 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-11 16:42:38.578345
- Title: A Five-Plane Reference Architecture for Runtime Governance of Production AI Agents
- Title(参考訳): 生産AIエージェントのランタイムガバナンスのための5面参照アーキテクチャ
- Authors: Krti Tallam,
- Abstract要約: 本稿では,生産AIエージェントのガバナンスのための参照アーキテクチャを提案する。
我々は、許容と否定を一般化する6つの割り込みプリミティブの分類を定義し、4つの正当性不変量について主張する。
5つの具体的判断にまたがる7つの生産エージェントの脅威の隠蔽を実証する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Enterprise security was built to govern data boundaries: the protected surface was data at rest and in transit, and the controls -- access control, data-loss prevention, perimeter inspection -- governed crossings of that boundary. Production AI agents dissolve this assumption. An agent reads context, calls tools, invokes connectors, and modifies systems of record on an enterprise's behalf, so risk moves inside the workflow, into sequences of individually-permitted actions that may transform a business process no one authorized. Existing policy engines do not extend to this regime: they evaluate request-time decisions against atomic principals, where agentic systems require stateful evaluation against composite principals whose authority attenuates through delegation chains. We present a reference architecture for the runtime governance of production agents, built from four composable primitives: a five-plane decomposition (a reasoning plane that adjudicates intent, and four enforcement planes -- network, identity, endpoint, data -- that realize the decision), stop-anywhere mediation, composite principals with capability attenuation, and audit as a structured evidence substrate. We define a taxonomy of six interruption primitives that generalize allow and deny, state and argue for four correctness invariants, and demonstrate the foreclosure of seven production-agent threats across five concrete workflows. A reference implementation of the policy-engine core supplies measured evidence: attenuation correctness and evidence reconstructability hold on every trial, adjudication runs in single-digit microseconds, and the audit substrate's tamper-evidence behaves exactly as designed. We are explicit about scope: the architecture governs delegated action, not model behavior, and a full-system evaluation against a live agent benchmark is the invited next step.
- Abstract(参考訳): 企業セキュリティは、データバウンダリを管理するために構築され、保護された表面は、静止状態にあるデータであり、制御 -- アクセス制御、データロス防止、周辺検査 -- が、そのバウンダリの横断を支配していた。
生産AIエージェントはこの前提を解消する。
エージェントはコンテキストを読み、ツールを呼び出し、コネクタを呼び出し、企業に代わってレコードシステムを変更するため、リスクはワークフロー内を移動し、承認されていないビジネスプロセスを変換する個々の許可されたアクションのシーケンスへと変化する。
既存の政策エンジンはこの体制に及ばない:彼らは原子の原理に対する要求時決定を評価し、エージェントシステムは委譲連鎖を通じて権限が減衰する複合原理に対するステートフルな評価を必要とする。
5面分解(意図を指示する推論平面と、決定を実現する4つの強制面(ネットワーク、アイデンティティ、エンドポイント、データ))、任意の仲介、機能減衰を伴う複合プリンシパル、構造化されたエビデンス基板としての監査の4つの構成可能なプリミティブから構築された、プロダクションエージェントのランタイムガバナンスのためのリファレンスアーキテクチャを提案する。
本研究では,6つの割り込みプリミティブの分類を定義し,許容と否定を一般化し,4つの正当性不変性を主張する。
ポリシーエンジンコアのリファレンス実装は、測定された証拠を供給している: 減衰の正しさと証拠の再構築性は、すべてのトライアルで保持され、偏見は1桁のマイクロ秒で実行され、監査基板のタンパーエビデンスは、正確に設計されているように振る舞う。
アーキテクチャはモデルの振る舞いではなくデリゲートされたアクションを管理し、ライブエージェントベンチマークに対するフルシステム評価が次のステップとして招待されます。
関連論文リスト
- AgentReputation: A Decentralized Agentic AI Reputation Framework [3.6704226968275253]
我々はエージェントAIシステムのための分散3層評価フレームワークである textbfAgentReputation を提案する。
このフレームワークは、タスク実行、評価サービス、タンパー保護の永続化を分離し、それぞれの強みを活用し、独立した進化を可能にする。
定量化において、AgentReputationはリソース割り当て、アクセス制御、適応的な検証エスカレーションをサポートする決定対応のポリシーエンジンを提供する。
論文 参考訳(メタデータ) (2026-04-30T12:33:39Z) - Decision Evidence Maturity Model for Agentic AI: A Property-Level Method Specification [0.0]
エージェントAIシステムは、実行テレメトリを通じて大規模な意思決定証拠を生成するが、プロパティレベルの再構築は失敗することが多い。
このパターンをコンテナ誤認(container fallacy)と呼んでいます。
本稿では,エージェント決定のための特性レベル再構成法であるDecision Evidence Maturity Model (DEMM)を提案する。
論文 参考訳(メタデータ) (2026-04-29T09:59:36Z) - Structural Enforcement of Goal Integrity in AI Agents via Separation-of-Powers Architecture [0.10152838128195464]
Policy-Execution-Authorization (PEA)アーキテクチャは、システムレベルでの安全性を強制する"パワーの分離"設計である。
PEAはインテントの生成、承認、実行を、暗号的に制約された機能トークンを介して接続された独立した分離されたレイヤに分離する。
論文 参考訳(メタデータ) (2026-04-26T10:31:13Z) - Auditable Agents [10.007755929469814]
LLMエージェントはツールを呼び、データベースをクエリし、タスクをデリゲートし、外部の副作用を引き起こす。
エージェントシステムが世界で活動できるようになると、もはや有害なアクションが防げるかどうかという問題ではない。
我々は、説明責任(コンプライアンスを判断し、責任を割り当てる能力)、監査可能性(説明責任を可能にするシステム特性)、監査(信頼できる証拠から振る舞いを再構築するプロセス)を区別する。
論文 参考訳(メタデータ) (2026-04-07T06:25:49Z) - Architecting Secure AI Agents: Perspectives on System-Level Defenses Against Indirect Prompt Injection Attacks [46.32011684548212]
AIエージェントは間接的なプロンプトインジェクションに対して脆弱であり、信頼できないデータに埋め込まれた悪意のある命令は危険なエージェントアクションを引き起こす可能性がある。
本稿では,間接的インジェクション攻撃に対するシステムレベルの防御の展望について論じる。
論文 参考訳(メタデータ) (2026-03-31T17:15:46Z) - ElephantBroker: A Knowledge-Grounded Cognitive Runtime for Trustworthy AI Agents [45.88028371034407]
ElephantBrokerはオープンソースの認知ランタイムで、Neo4jナレッジグラフとQdrantベクトルストアを統合する。
このシステムは、ハイブリッド5ソース検索パイプラインからなる完全な認知ループ(ストア、検索、スコア、構成、保護、学習)を実装している。
論文 参考訳(メタデータ) (2026-03-26T07:03:12Z) - Automated Self-Testing as a Quality Gate: Evidence-Driven Release Management for LLM Applications [51.56484100374058]
我々は,エビデンスに基づくリリース決定を伴う品質ゲートを導入する自動自己テストフレームワークを提案する。
内部展開型多エージェント対話型AIシステムの縦型ケーススタディにより,本フレームワークの評価を行った。
論文 参考訳(メタデータ) (2026-03-13T20:44:15Z) - Agents of Chaos [50.53354213047402]
実験室環境に展開する自律言語モデルを用いたエージェントの探索的再チームの研究を報告する。
20人のAI研究者が、良心的および敵対的な条件下でエージェントと対話した。
我々の発見は、現実的なデプロイメント設定におけるセキュリティ、プライバシ、ガバナンスに関連する脆弱性の存在を確立します。
論文 参考訳(メタデータ) (2026-02-23T16:28:48Z) - To Throw a Stone with Six Birds: On Agents and Agenthood [0.0]
Six Birds Theory (SBT)は、マクロな物体を原始体ではなく誘導的閉包として扱う。
SBT内では,タイプ正当性評価を行う。
我々はこの契約を4つのチェック可能なコンポーネントを用いて有限制御システムで運用する。
論文 参考訳(メタデータ) (2026-02-03T10:46:23Z) - Making LLMs Reliable When It Matters Most: A Five-Layer Architecture for High-Stakes Decisions [51.56484100374058]
現在の大規模言語モデル(LLM)は、実行前にアウトプットをチェックできるが、不確実な結果を伴う高い戦略決定には信頼性が低い検証可能な領域で優れている。
このギャップは、人間と人工知能(AI)システムの相互認知バイアスによって引き起こされ、そのセクターにおける評価と投資の持続可能性の保証を脅かす。
本報告では、7つのフロンティアグレードLDMと3つの市場向けベンチャーヴィグネットの時間的圧力下での系統的質的評価から生まれた枠組みについて述べる。
論文 参考訳(メタデータ) (2025-11-10T22:24:21Z) - SOPBench: Evaluating Language Agents at Following Standard Operating Procedures and Constraints [59.645885492637845]
SOPBenchは、各サービス固有のSOPコードプログラムを実行可能な関数の有向グラフに変換する評価パイプラインである。
提案手法では,各サービス固有のSOPコードプログラムを実行可能関数の有向グラフに変換し,自然言語SOP記述に基づいてこれらの関数を呼び出しなければならない。
我々は18の先行モデルを評価し、上位モデルでさえタスクが困難であることを示す。
論文 参考訳(メタデータ) (2025-03-11T17:53:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。