論文の概要: AgentGuard: An Attribute-Based Access Control Framework for Tool-Use LLM-Based Agent
- arxiv url: http://arxiv.org/abs/2605.28071v1
- Date: Wed, 27 May 2026 07:28:39 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-28 17:38:55.84353
- Title: AgentGuard: An Attribute-Based Access Control Framework for Tool-Use LLM-Based Agent
- Title(参考訳): AgentGuard: ツール使用 LLM ベースのエージェントのための属性ベースのアクセス制御フレームワーク
- Authors: Jiaqi Luo, Songyang Peng, Jiarun Dai, Zhile Chen, Zhuoxiang Shen, Geng Hong, Xudong Pan, Yuan Zhang, Min Yang,
- Abstract要約: LLMをベースとしたエージェントは、複雑なタスクを達成するために、自律的に関連するツールを起動する能力のために、最近大きな注目を集めている。
最近の研究によると、これらのエージェントは深刻なセキュリティリスクに直面しており、プライバシーの漏洩、金融損失、さらにはシステム全体の妥協につながる可能性がある。
本稿では,ツール利用 LLM エージェントのための属性ベースのアクセス制御フレームワークである AgentGuard を提案する。
- 参考スコア(独自算出の注目度): 20.435146053464177
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: LLM-based agents have recently attracted significant attention due to their ability to autonomously invoke relevant tools to accomplish complex tasks. However, recent studies have shown that these agents face severe security risks, which may lead to privacy leakage, financial loss, or even full system compromise. In this paper, we present AgentGuard, an attribute-based access control framework for tool-use LLM-based agents. AgentGuard adopts a client-server architecture. On the client side, AgentGuard provides lightweight integration for agents implemented in different programming languages and architectures. It requires only minor code modifications (e.g., around 10 lines) without changing the underlying agent execution logic. On the server side, AgentGuard provides three complementary inspection mechanisms to cover both single-tool and cross-tool security risks in agent execution. In addition, it offers a visualized front-end interface for security policy specification and runtime auditing. Currently, AgentGuard is publicly accessible at https://github.com/WhitzardAgent/AgentGuard.
- Abstract(参考訳): LLMをベースとしたエージェントは、複雑なタスクを達成するために、自律的に関連するツールを起動する能力のために、最近大きな注目を集めている。
しかし、最近の研究では、これらのエージェントは深刻なセキュリティリスクに直面しており、プライバシーの漏洩、金融損失、さらにはシステム全体の妥協につながる可能性があることが示されている。
本稿では,ツール利用 LLM エージェントのための属性ベースのアクセス制御フレームワークである AgentGuard を提案する。
AgentGuardはクライアントサーバアーキテクチャを採用する。
クライアント側では、AgentGuardは異なるプログラミング言語やアーキテクチャで実装されたエージェントに対して軽量な統合を提供する。
基盤となるエージェントの実行ロジックを変更することなく、小さなコード修正(例:約10行)しか必要としない。
サーバ側では、AgentGuardはエージェントの実行においてシングルツールとクロスツールのセキュリティリスクの両方をカバーする3つの補完的な検査メカニズムを提供する。
さらに、セキュリティポリシー仕様とランタイム監査のための可視化されたフロントエンドインターフェイスを提供する。
AgentGuardは現在、https://github.com/WhitzardAgent/AgentGuard.comで公開されている。
関連論文リスト
- Taming Various Privilege Escalation in LLM-Based Agent Systems: A Mandatory Access Control Framework [16.14469140816631]
LLM(Large Language Model)ベースのエージェントシステムは、複雑な現実世界のタスクに対してますます多くデプロイされている。
本稿では,特権エスカレーションのレンズによる攻撃の理解と軽減を目的としている。
属性ベースアクセス制御(ABAC)に基づく必須アクセス制御フレームワークSEAgentを提案する。
評価の結果,SEAgentは低偽陽性率と無視可能なシステムオーバーヘッドを維持しつつ,様々な特権のエスカレーションを効果的に抑制していることがわかった。
論文 参考訳(メタデータ) (2026-01-17T03:22:56Z) - PSG-Agent: Personality-Aware Safety Guardrail for LLM-based Agents [60.23552141928126]
PSG-AgentはLLMベースのエージェントのためのパーソナライズされた動的システムである。
まずPSG-Agentは、安定した特性のために相互作用履歴をマイニングすることでパーソナライズされたガードレールを作成する。
第二に、PSG-Agentは特別なガードでエージェントパイプラインを横断する継続的監視を実装している。
論文 参考訳(メタデータ) (2025-09-28T03:31:59Z) - Progent: Programmable Privilege Control for LLM Agents [46.31581986508561]
本稿では,大規模言語モデルエージェントをセキュアにするための最初の特権制御フレームワークであるProgentを紹介する。
Progentは、潜在的に悪意のあるものをブロックしながら、ユーザタスクに必要なツールコールの実行をエージェントに制限することで、ツールレベルでのセキュリティを強化する。
モジュール設計のおかげで、Progentの統合はエージェント内部を変更せず、既存のエージェントの実装に最小限の変更しか必要としません。
論文 参考訳(メタデータ) (2025-04-16T01:58:40Z) - AgentHarm: A Benchmark for Measuring Harmfulness of LLM Agents [84.96249955105777]
LLMエージェントは誤用された場合、より大きなリスクを引き起こすが、その堅牢性は未発見のままである。
我々は, LLMエージェント誤用の研究を容易にするために, AgentHarmと呼ばれる新しいベンチマークを提案する。
主要なLLMは、ジェイルブレイクなしで悪意のあるエージェント要求に驚くほど準拠している。
論文 参考訳(メタデータ) (2024-10-11T17:39:22Z) - GuardAgent: Safeguard LLM Agents by a Guard Agent via Knowledge-Enabled Reasoning [79.07152553060601]
安全ガード要求を満たすか否かを動的に確認し,目標エージェントを保護する最初のガードレールエージェントであるガードアジェントを提案する。
特にGuardAgentは、まず安全ガードの要求を分析してタスクプランを生成し、それからその計画をガードレールコードにマップして実行します。
GuardAgentは、それぞれ98%と83%のガードレール精度を持つ2つのベンチマークにおいて、異なる種類のエージェントに対する違反行為を効果的に抑制することを示した。
論文 参考訳(メタデータ) (2024-06-13T14:49:26Z) - Watch Out for Your Agents! Investigating Backdoor Threats to LLM-Based Agents [47.219047422240145]
我々は、LSMベースのエージェントに対して、典型的な安全脅威であるバックドアアタックの1つを調査する第一歩を踏み出した。
具体的には、ユーザ入力とモデル出力のみを操作できる従来のLDMに対するバックドア攻撃と比較して、エージェントバックドア攻撃はより多様で隠蔽的な形式を示す。
論文 参考訳(メタデータ) (2024-02-17T06:48:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。