論文の概要: AgentRiskBOM: A Risk-Scoping Security Bill of Materials for Agentic AI Systems
- arxiv url: http://arxiv.org/abs/2606.21877v1
- Date: Sat, 20 Jun 2026 04:38:41 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-26 02:28:06.008103
- Title: AgentRiskBOM: A Risk-Scoping Security Bill of Materials for Agentic AI Systems
- Title(参考訳): AgentRiskBOM:エージェントAIシステムのリスクスコープセキュリティ法案
- Authors: Srimonti Dutta, Akshata Kishore Moharir,
- Abstract要約: 本稿ではリスクスコープツールを用いたAIエージェントのためのセキュリティBOMであるAgentRiskBOMを紹介する。
SBOM、AIBOM、MLBOM上の付加層であり、権威のための権威のあるランタイムフィールドを追加する場所を参照している。
カバレッジ分析により、AgentRiskBOMは16の能力範囲で14のネイティブ等価スコア、SBOMは1、AIBOMは1.5、MLBOMは2のスコアを得る。
- 参考スコア(独自算出の注目度): 0.519554837386174
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Agentic AI systems retrieve private context, invoke tools, write files, call external services, coordinate with other agents, and may act without human approval. Existing bill of materials artifacts improve transparency for dependencies, model metadata, and training provenance, but leave an agentic transparency gap: capability opacity, the absence of a structured account of what a deployed agent can access, remember, change, delegate, and prove afterward. This paper introduces AgentRiskBOM, a security BOM for risk-scoping tool-using AI agents. It is an additive layer over SBOM, AIBOM, and MLBOM artifacts, referencing them where authoritative while adding fields for runtime authority: autonomy, tool permissions, memory, credential scope, approval gates, audit signals, inter-agent communication, and external action capability. We implement AgentRiskBOM as a JSON-schema artifact with a reproducible corpus, risk scenarios, scorer, diff detector, control mapper, and reports. We evaluate AgentRiskBOM on 13 open-source agents spanning coding, RAG, and multi-agent archetypes, plus 52 risk scenarios across 14 categories. The schema validates all 13 corpus artifacts. Coverage analysis gives AgentRiskBOM a native-equivalent score of 14 across 16 capability dimensions, vs. 1 for SBOM, 1.5 for AIBOM and 2 for MLBOM. Across modeled risk categories, AgentRiskBOM exposes 100% risk-category visibility vs. 10.5% for SBOM-like and 20.9% for AIBOM-like views. To test agentic authority drift, we inject 33 structured deployment mutations; the diff detector identifies the correct change type for all mutations. A secondary penalty-based scorer yields a Spearman correlation of 0.73 with the primary scorer, supporting rank-level consistency while showing that thresholds require human calibration. The results show that agentic AI security needs a machine-readable authority-and-risk artifact before incidents occur.
- Abstract(参考訳): エージェントAIシステムは、プライベートコンテキストを検索し、ツールを呼び出し、ファイルを書き、外部サービスを呼び、他のエージェントとコーディネートする。
既存のマテリアルアーティファクトの請求書は、依存関係の透明性、モデルのメタデータ、トレーニングの成果を改善するが、エージェントの透明性のギャップは残る:能力の不透明さ、デプロイされたエージェントがアクセス、記憶、変更、デリゲート、そして後続の証明など、構造化された説明がない。
本稿ではリスクスコープツールを用いたAIエージェントのためのセキュリティBOMであるAgentRiskBOMを紹介する。
SBOM、AIBOM、MLBOMのアーティファクト上の付加層であり、自律性、ツールパーミッション、メモリ、クレデンシャルスコープ、承認ゲート、監査信号、エージェント間通信、外部アクション能力といったランタイム権限のフィールドを追加しながら、権限のある場所を参照する。
我々は、再現可能なコーパス、リスクシナリオ、スコアラ、差分検出器、制御マッパー、レポートを備えたJSONスキーマアーティファクトとしてAgentRiskBOMを実装した。
我々は、コーディング、RAG、マルチエージェントのアーチタイプにまたがる13のオープンソースエージェントに対して、AgentRiskBOMを評価し、14のカテゴリにわたる52のリスクシナリオを評価した。
スキーマは、13のコーパスアーティファクトをすべて検証する。
カバレッジ分析により、AgentRiskBOMは16の能力範囲で14のネイティブ等価スコア、SBOMは1、AIBOMは1.5、MLBOMは2のスコアを得る。
モデル付きリスクカテゴリ全体では、AgentRiskBOMは100%のリスクカテゴリの可視性を示し、SBOMライクなビューは10.5%、AIBOMライクなビューは20.9%である。
エージェント・オーソリティ・ドリフトをテストするため、33の構造化された展開変異を注入し、diff検出器は全ての突然変異に対して正しい変化タイプを検出する。
二次ペナルティベースのスコアラは、スピアマンと一次スコアラとの相関を0.73とし、ランクレベルの一貫性をサポートしながら、閾値が人間のキャリブレーションを必要とすることを示す。
その結果、エージェントAIセキュリティには、インシデントが発生する前に、マシン可読な権限とリスクを持つアーティファクトが必要であることが示された。
関連論文リスト
- AgentDoG 1.5: A Lightweight and Scalable Alignment Framework for AI Agent Safety and Security [147.50046962090795]
軽量でスケーラブルなエージェント安全アライメントフレームワークを提案する。
CodexとOpenClawの実行シナリオの緊急リスクに対応するため、エージェント安全分類を更新する。
AgentDoG 1.5 に基づいて,高効率なエージェント安全性 SFT と RL トレーニング環境を構築した。
我々は,AgentDoG 1.5をトレーニング不要のオンラインガードレールとしてリアルタイム安全モデレーションとして展開する。
論文 参考訳(メタデータ) (2026-05-28T11:48:37Z) - Towards Security-Auditable LLM Agents: A Unified Graph Representation [22.355591892994642]
本稿ではエージェントセキュリティ監査のための統合構造表現であるエージェントBOMを提案する。
エージェントBOMは、クロスセッションメモリ中毒やツール誤用など、ステルス攻撃チェーンを再構築できることを示す。
Agent-BOMは複雑なエージェントエコシステムにおける根本原因分析とセキュリティ適応のための統一的で監査可能な基盤を提供する。
論文 参考訳(メタデータ) (2026-05-07T18:14:29Z) - Governing Dynamic Capabilities: Cryptographic Binding and Reproducibility Verification for AI Agent Tool Use [0.0]
既存のセキュリティレイヤでは、AIエージェントに何ができるか、それが主張するものを実行したのか、マルチエージェントインタラクションで何が起きたのかを検証できない。
既存のフレームワークはこれら2つを詳述し、サイレントな能力のエスカレーションを可能にし、検証済みの証明なしに相互作用を残す。
我々は3つのエージェントガバナンス要件を導出する:能力の完全性(G1)、行動の妥当性(G2)、相互作用監査性(G3)。
基本(Ed25519, SHA-256; 97 us verify)と拡張(BBS+選択開示、Groth16 DV-SNARK; 13.8 ms)の2つの暗号に依存しないインスタンス化で検証する。
論文 参考訳(メタデータ) (2026-03-15T11:46:57Z) - Re-Evaluating EVMBench: Are AI Agents Ready for Smart Contract Security? [10.248746359119625]
EVMbenchは、スマートコントラクトセキュリティに関するAIエージェントのための最初の大規模なベンチマークである。
その成果は、完全に自動化されたAI監査が到達範囲内にあるという期待を後押しした。
これらの発見は、完全に自動化されたAI監査が差し迫っているという物語に挑戦する。
論文 参考訳(メタデータ) (2026-03-11T14:07:16Z) - AgentDoG: A Diagnostic Guardrail Framework for AI Agent Safety and Security [126.49733412191416]
現在のガードレールモデルは、リスク診断におけるエージェント的リスク認識と透明性を欠いている。
エージェントリスクをソース(場所)、障害モード(方法)、結果(何)で分類する統合された3次元分類法を提案する。
AgentDoG(AgentDoG)のための,エージェント安全性ベンチマーク(ATBench)と診断ガードレールフレームワークを新たに導入する。
論文 参考訳(メタデータ) (2026-01-26T13:45:41Z) - AgentArmor: Enforcing Program Analysis on Agent Runtime Trace to Defend Against Prompt Injection [14.522205401511727]
大きな言語モデル(LLM)エージェントは、自然言語推論と外部ツールの実行を組み合わせることで、さまざまな問題を解決するための強力な新しいパラダイムを提供する。
本研究では,エージェントランタイムトレースを解析可能なセマンティクスを用いた構造化プログラムとして扱う新しい知見を提案する。
本稿では,エージェントトレースをグラフ中間表現に基づく構造化プログラム依存表現に変換するプログラム解析フレームワークであるAgentArmorを提案する。
論文 参考訳(メタデータ) (2025-08-02T07:59:34Z) - On the Resilience of LLM-Based Multi-Agent Collaboration with Faulty Agents [58.79302663733703]
大規模言語モデルに基づくマルチエージェントシステムは、専門家エージェントの協力により、様々なタスクにまたがる優れた能力を示している。
不器用なエージェントや悪意のあるエージェントが与える影響 - システム全体のパフォーマンスにおいて、頻繁にタスクでエラーを犯すものは、いまだに過小評価されていない。
本稿では,下流タスクにおける障害要因下での各種システム構造のレジリエンスについて検討する。
論文 参考訳(メタデータ) (2024-08-02T03:25:20Z) - Malicious Agent Detection for Robust Multi-Agent Collaborative Perception [52.261231738242266]
多エージェント協調(MAC)知覚は、単エージェント認識よりも敵攻撃に対して脆弱である。
MAC知覚に特異的な反応防御であるMADE(Malicious Agent Detection)を提案する。
我々は、ベンチマーク3DデータセットV2X-simとリアルタイムデータセットDAIR-V2Xで包括的な評価を行う。
論文 参考訳(メタデータ) (2023-10-18T11:36:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。