論文の概要: SARC: A Governance-by-Architecture Framework for Agentic AI Systems
- arxiv url: http://arxiv.org/abs/2605.07728v1
- Date: Fri, 08 May 2026 13:34:36 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-11 19:43:39.074352
- Title: SARC: A Governance-by-Architecture Framework for Agentic AI Systems
- Title(参考訳): SARC:エージェントAIシステムのためのガバナンス・バイ・アーキテクチャ・フレームワーク
- Authors: Gaston Besanson,
- Abstract要約: エージェントAIシステムは、ツール、サブエージェント、外部サービスを通じてますます機能するが、ガバナンスコントロールは、プロンプト、ダッシュボード、ポストホックドキュメンテーションにアタッチされることが多い。
SARCは、制約をステート、アクションスペース、報酬と共に第一級の仕様オブジェクトとして扱うツール使用エージェントのためのランタイムガバナンスアーキテクチャである。
SARCは厳密な述語の下でゼロのハードコントラスト違反を実行し、その宣言されたPAAのスロットリング応答は、ポリシー・アズ・コードのみと比較して、ソフトウインドウのオーバーアーを89.5%削減する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Agentic AI systems increasingly act through tools, sub-agents, and external services, but governance controls are still commonly attached to prompts, dashboards, or post-hoc documentation. This creates a structural mismatch in regulated settings: obligations that must constrain execution are often evaluated only after execution has occurred. We introduce SARC, a runtime governance architecture for tool-using agents that treats constraints as first-class specification objects alongside state, action space, and reward. A SARC specification declares each constraint's source, class, predicate, verification point, response protocol, and operating point, and compiles these into four enforcement sites in the agent loop: a Pre-Action Gate, an Action-Time Monitor, a Post-Action Auditor, and an Escalation Router. We formalize the minimal invariants required for specification-trace correspondence, show why finite reward penalties do not generally substitute for hard runtime constraints, and extend the architecture to multi-agent workflows through constraint propagation, authority intersection, and attribution-preserving trace trees. We implement a prototype audit checker and report a reproducible synthetic evaluation over 50 seeds comparing SARC against post-hoc audit, output filtering, workflow rules, and policy-as-code-only baselines on a procurement task. SARC executes zero hard-constraint violations under exact predicates; its declared PAA throttling response reduces soft-window overages by 89.5% relative to policy-as-code-only. Predicate-noise and enforcement-failure sweeps are consistent with the claim that residual hard violations under SARC scale with enforcement-stack error rather than environmental violation opportunity. SARC provides the architectural substrate through which obligations can be made executable, inspectable, and auditable at runtime.
- Abstract(参考訳): エージェントAIシステムは、ツール、サブエージェント、外部サービスを通じてますます機能するが、ガバナンスコントロールは、プロンプト、ダッシュボード、ポストホックドキュメンテーションにアタッチされることが多い。
これにより、規制された設定で構造的なミスマッチが発生します。実行を制限する義務は、実行が実行された後にのみ評価されます。
SARCは、制約をステート、アクションスペース、報酬と共に第一級の仕様オブジェクトとして扱うツール使用エージェントのためのランタイムガバナンスアーキテクチャである。
SARC仕様は、各制約のソース、クラス、述語、検証ポイント、レスポンスプロトコル、オペレーションポイントを宣言し、エージェントループ内の4つの強制的サイト(Pre-Action Gate、Action-Time Monitor、Post-Action Auditor、Escalation Router)にコンパイルする。
仕様トレース対応に必要な最小限の不変量を形式化し、有限報酬ペナルティが一般にハードランタイム制約に代わらない理由を示し、制約伝搬、権威交叉、帰属保存トレースツリーを通じてアーキテクチャをマルチエージェントワークフローに拡張する。
我々は,プロトタイプ監査チェッカーを実装し,SARCとポストホック監査,出力フィルタリング,ワークフロールール,ポリシ・アズ・コードのみのベースラインを比較した50種以上の合成評価を行った。
SARCは厳密な述語の下でゼロのハードコントラスト違反を実行し、その宣言されたPAAのスロットリング応答は、ポリシー・アズ・コードのみと比較して、ソフトウインドウのオーバーアーを89.5%削減する。
SARCの下での残留するハード違反は、環境侵害の機会ではなく、強制的スタックエラーを伴うという主張と一致している。
SARCは、実行時に義務を実行可能、検査可能、監査可能なアーキテクチャ基板を提供する。
関連論文リスト
- Securing the Agent: Vendor-Neutral, Multitenant Enterprise Retrieval and Tool Use [0.0]
本稿では,ポリシー意識の取り込み,検索時間ゲーティング,共有推論を組み合わせた階層型分離アーキテクチャを提案する。
このアプローチは、サーバ上でのセキュリティクリティカルなオペレーション – ツール実行承認、ステートアイソレーション、ポリシ執行 – を集中化します。
我々はこれを実証的に評価し、ABACゲーティングは無視可能なオーバーヘッドを導入しながら、テナント間のリークを排除していることを示す。
論文 参考訳(メタデータ) (2026-05-06T17:59:21Z) - IMPACT-CYCLE: A Contract-Based Multi-Agent System for Claim-Level Supervisory Correction of Long-Video Semantic Memory [73.22944697933603]
既存のパイプラインは不透明でエンドツーエンドの出力を生成し、検査の中間状態は公開しない。
IMPACT-Cycleは,マルチモーダル反復クレームレベルのメンテナンスとして,長時間ビデオ理解を再構築するマルチエージェントシステムである。
論文 参考訳(メタデータ) (2026-04-22T03:03:33Z) - KAIJU: An Executive Kernel for Intent-Gated Execution of LLM Agents [5.931389072124715]
ReActを使用した大規模言語モデルに基づくツールコール自律エージェントには3つの制限がある。
最近の作業は、計画と実行を分離する方向に進んでいるが、各ケースモデルでは、実行メカニズムと結合され続けている。
LLMエージェントのシステムレベルの抽象化を導入し,実行エージェントを推論層から分離する。
論文 参考訳(メタデータ) (2026-03-31T21:38:28Z) - Dynamic analysis enhances issue resolution [53.50448142467294]
DAIRA(Dynamic Analysis-enhanced Issue Resolution Agent)は、エージェントの推論サイクルに動的解析を組み込む自動修復フレームワークである。
テストトレース駆動の方法論によって駆動されるDAIRAは、軽量モニタを使用して重要なランタイムデータを抽出する。
Gemini 3 Flash Previewを使用すると、DAIRAは新たな最先端(SOTA)パフォーマンスを確立し、SWE-bench Verifiedデータセットで79.4%の解像度を達成する。
論文 参考訳(メタデータ) (2026-03-23T14:48:54Z) - A Trace-Based Assurance Framework for Agentic AI Orchestration: Contracts, Testing, and Governance [0.22940141855172028]
本稿では,Large Language Models (LLM) を用いたエージェントAIシステムの保証フレームワークを提案する。
実行は、明示的なステップとトレースコントラクトを備えたメッセージ・アクション・トレース(MAT)として実装される。
このフレームワークは、有界摂動に対する予算付き反例探索として定式化されたストレステストを含む。
論文 参考訳(メタデータ) (2026-03-18T10:23:48Z) - Cryptographic Runtime Governance for Autonomous AI Systems: The Aegis Architecture for Verifiable Policy Enforcement [0.0]
本稿では,自律型AIシステムのためのランタイムガバナンスアーキテクチャであるAegisについて述べる。
エージスは政策と法的制約を諮問の原則よりも実行条件として扱う。
論文 参考訳(メタデータ) (2026-03-15T04:04:57Z) - ESAA-Security: An Event-Sourced, Verifiable Architecture for Agent-Assisted Security Audits of AI-Generated Code [0.0]
本稿では,ソフトウェアリポジトリのエージェント支援セキュリティ監査のためのドメイン固有フレームワークであるESAA-Securityを提案する。
このフレームワークは構造化されたチェック結果、脆弱性の在庫、深刻度分類、リスク、修正ガイダンス、エグゼクティブサマリー、最終的なマークダウン/JSON監査レポートを生成する。
論文 参考訳(メタデータ) (2026-03-06T15:15:26Z) - Robust and Efficient Tool Orchestration via Layered Execution Structures with Reflective Correction [55.13278005189741]
私たちは、高レベルのツール依存関係をキャプチャする階層化された実行構造を学ぶために、ツールオーケストレーションをモデル化します。
本稿では,局所的にエラーを検出し,修正するスキーマ対応反射補正機構を提案する。
この設計では、エラーを個々のツールコールに限定し、実行軌跡全体の再計画を避ける。
論文 参考訳(メタデータ) (2026-02-21T22:20:01Z) - Analyzing and Internalizing Complex Policy Documents for LLM Agents [53.14898416858099]
大規模言語モデル(LLM)ベースのエージェントシステムは、多様なビジネスルールをコードするコンテキスト内ポリシー文書に依存している。
これは、パフォーマンスを保ちながら、ポリシー文書をモデルプリエントに組み込む内部化手法の開発を動機付けます。
CC-Genは4つのレベルにまたがる制御可能な複雑度を持つエージェントベンチマークジェネレータである。
論文 参考訳(メタデータ) (2025-10-13T16:30:07Z) - SOPBench: Evaluating Language Agents at Following Standard Operating Procedures and Constraints [59.645885492637845]
SOPBenchは、各サービス固有のSOPコードプログラムを実行可能な関数の有向グラフに変換する評価パイプラインである。
提案手法では,各サービス固有のSOPコードプログラムを実行可能関数の有向グラフに変換し,自然言語SOP記述に基づいてこれらの関数を呼び出しなければならない。
我々は18の先行モデルを評価し、上位モデルでさえタスクが困難であることを示す。
論文 参考訳(メタデータ) (2025-03-11T17:53:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。