論文の概要: Hybrid Inspection and Task-Based Access Control in Zero-Trust Agentic AI
- arxiv url: http://arxiv.org/abs/2605.02682v1
- Date: Mon, 04 May 2026 15:00:37 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-05 20:33:50.350177
- Title: Hybrid Inspection and Task-Based Access Control in Zero-Trust Agentic AI
- Title(参考訳): ゼロトラストエージェントAIにおけるハイブリッド検査とタスクベースアクセス制御
- Authors: Majed El Helou, Benjamin Ryder, Chiara Troiani, Jean Diaconu, Hervé Muyal, Marcelo Yannuzzi,
- Abstract要約: 侵入されたまたは悪意のあるエージェントアプリケーションは、ツールコールを改ざんしたり、結果を偽造したり、対象の意図したタスクの範囲を超えて許可を求めることができる。
本稿では,ゼロトラスト・インターセプション・レイヤによって実現される決定論的および意味論的制御を組み合わせた,ハイブリッド・ランタイム実行モデルを提案する。
タスクに関連性のある非関連ツールコールを含むマルチターンインタラクションを備えた対話ツールデータセットを新たに生成する。
- 参考スコア(独自算出の注目度): 4.092829002386613
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Authorizing Large Language Model (LLM)-driven agents to dynamically invoke tools and access protected resources introduces significant security risks, and the risks grow dramatically as agents engage in multi-turn conversations and scale toward distributed collaboration. A compromised or malicious agentic application can tamper with tool calls, falsify results, or request permissions beyond the scope of the subject's intended tasks, which could go unnoticed with current delegated authorization flows given their lack of visibility into the original subject's intent. In light of this, we make the following contributions towards Continuous Agent Semantic Authorization (CASA). First, we propose a hybrid runtime enforcement model that combines deterministic and semantic controls enabled by a zero-trust interception layer. Five deterministic controls enforce structural and data-integrity guarantees over the message flow, while a semantic inspection layer evaluates whether tool call choices align with the intended tasks commissioned to the agent. Second, differently from prior Task-Based Access Control (TBAC) techniques that operate on single-turn interactions, we decompose the semantic layer into two stages: i) a task-extraction step that distills the subject's objectives from multi-turn conversations at the interception layer, and ii) a task-tool semantic matching step at the authorization server that evaluates whether the requested tools are appropriate for the extracted tasks. Third, we extend the ASTRA dataset that we introduced in a prior work, by generating novel conversation-tool datasets with multi-turn interactions containing relevant and irrelevant tool calls for a given task. Lastly, we provide the first experimental results for TBAC under multi-turn conversations.
- Abstract(参考訳): ツールを動的に起動し、保護されたリソースにアクセスするために、LLM(Large Language Model)駆動のエージェントを認可することは、重大なセキュリティリスクをもたらし、エージェントがマルチターン会話に従事し、分散コラボレーションに向かってスケールするにつれて、そのリスクは劇的に増加する。
侵入されたまたは悪意のあるエージェントアプリケーションは、ツールコールを改ざんしたり、結果を改ざんしたり、対象の意図したタスクの範囲を超えて要求を許可したりすることができる。
これを踏まえ、継続的エージェントセマンティック・オーソライゼーション(CASA)に以下の貢献をします。
まず,ゼロトラスト・インターセプション・レイヤによって実現される決定論的・意味論的制御を結合したハイブリッドランタイム実行モデルを提案する。
5つの決定論的制御は、メッセージフローに対して構造的およびデータ統合性を保証する一方で、セマンティックインスペクション層は、ツールコールの選択がエージェントに委託されたタスクと一致しているかを評価する。
第2に、シングルターンインタラクションで動作する以前のタスクベースアクセス制御(TBAC)技術とは違って、セマンティックレイヤを2つのステージに分割する。
一 インターセプション層におけるマルチターン会話から被験者の目的を抽出するタスク抽出ステップ
二 要求されたツールが抽出されたタスクに適切かどうかを評価するための、認可サーバにおけるタスクツール意味マッチングのステップ。
第3に,従来の作業で導入したASTRAデータセットを拡張し,関連するツール呼び出しと無関係なタスク呼び出しを含むマルチターンインタラクションを備えた対話ツールデータセットを新たに生成する。
最後に,TBACのマルチターン会話における実験結果について報告する。
関連論文リスト
- SmartSnap: Proactive Evidence Seeking for Self-Verifying Agents [45.71333459905404]
SmartSnapは、受動的でポストホックな検証から、エージェント自身による積極的な自己検証へのパラダイムシフトである。
両ミッションで設計された新しいタイプのエージェントである「自己検証エージェント」を導入し、タスクを完了し、検証された証拠でその達成を証明した。
モデルファミリとスケールにわたるモバイルタスクの実験は、SmartSnapパラダイムによって、スケーラブルなLLM駆動エージェントのトレーニングが可能になることを実証しています。
論文 参考訳(メタデータ) (2025-12-26T14:51:39Z) - Code-in-the-Loop Forensics: Agentic Tool Use for Image Forgery Detection [59.04089915447622]
ForenAgentはインタラクティブなIFDフレームワークで、MLLMが検出対象に関するPythonベースの低レベルツールを自律的に生成、実行、洗練することができる。
人間の推論にインスパイアされた我々は、グローバルな認識、局所的な焦点、反復的探索、そして全体論的偏見を含む動的推論ループを設計する。
実験の結果,ForenAgent は IFD 課題に対する創発的なツール利用能力と反射的推論を示すことがわかった。
論文 参考訳(メタデータ) (2025-12-18T08:38:44Z) - Interact-RAG: Reason and Interact with the Corpus, Beyond Black-Box Retrieval [49.85856484781787]
本稿では,ILMエージェントを検索プロセスのアクティブマニピュレータに高める新しいパラダイムであるInteract-RAGを紹介する。
我々は、ゼロショット実行と相互作用軌跡の合成を可能にする推論強化ワークフローを開発する。
6つのベンチマーク実験により、Interact-RAGは他の高度な手法よりも大幅に優れていることが示された。
論文 参考訳(メタデータ) (2025-10-31T15:48:43Z) - Delegated Authorization for Agents Constrained to Semantic Task-to-Scope Matching [4.092829002386613]
ツールを動的に呼び出し、保護されたリソースにアクセスするための大規模言語モデル駆動エージェントの認可は、重大なリスクをもたらす。
我々は,保護されたリソースへのアクセス要求を意味的に検査できる権限付与モデルを導入し,評価する。
本研究は,マルチエージェントおよびツール拡張アプリケーションに対して,意図認識による認証を可能にするセマンティックマッチング技術について,さらなる研究の必要性を強調した。
論文 参考訳(メタデータ) (2025-10-30T17:07:00Z) - MA-RAG: Multi-Agent Retrieval-Augmented Generation via Collaborative Chain-of-Thought Reasoning [36.3918410061572]
MA-RAGは、複雑な情報探索タスクにおける固有の曖昧さと推論の問題に対処する。
エンドツーエンドの微調整や分離されたコンポーネント拡張に依存する従来のRAGメソッドとは異なり、MA-RAGは特別なAIエージェントの協調的なセットを編成する。
本結果は,検索強化システムにおける協調的,モジュール型推論の有効性を浮き彫りにしたものである。
論文 参考訳(メタデータ) (2025-05-26T15:05:18Z) - SOPBench: Evaluating Language Agents at Following Standard Operating Procedures and Constraints [59.645885492637845]
SOPBenchは、各サービス固有のSOPコードプログラムを実行可能な関数の有向グラフに変換する評価パイプラインである。
提案手法では,各サービス固有のSOPコードプログラムを実行可能関数の有向グラフに変換し,自然言語SOP記述に基づいてこれらの関数を呼び出しなければならない。
我々は18の先行モデルを評価し、上位モデルでさえタスクが困難であることを示す。
論文 参考訳(メタデータ) (2025-03-11T17:53:02Z) - Audit-LLM: Multi-Agent Collaboration for Log-based Insider Threat Detection [16.154903877808795]
Audit-LLMは3つの協調エージェントからなるマルチエージェントログベースのインサイダー脅威検出フレームワークである。
本稿では,2つの独立実行者が推論交換を通じて結論を反復的に洗練し,合意に達するための,ペアワイズ・エビデンスに基づくマルチエージェント・ディベート(EMAD)機構を提案する。
論文 参考訳(メタデータ) (2024-08-12T11:33:45Z) - Learning to Use Tools via Cooperative and Interactive Agents [58.77710337157665]
ツール学習は、外部ツールを使用してユーティリティを拡張するエージェントとして、大きな言語モデル(LLM)を促進する。
ツール選択,ツール実行,アクションキャリブレーションの3つの特別なエージェントを個別にコーディネートする,協調型対話型エージェントフレームワークであるConAgentsを提案する。
3つのデータセットに対する実験により、LLMは、ConAgentsを装備した場合、大幅に改善されたベースラインよりも優れた性能を示した。
論文 参考訳(メタデータ) (2024-03-05T15:08:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。