論文の概要: FORTIS: Benchmarking Over-Privilege in Agent Skills
- arxiv url: http://arxiv.org/abs/2605.09163v2
- Date: Wed, 13 May 2026 06:09:23 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-14 17:13:58.833138
- Title: FORTIS: Benchmarking Over-Privilege in Agent Skills
- Title(参考訳): FORTIS:エージェントスキルにおける過剰な生産性のベンチマーク
- Authors: Shawn Li, Chenxiao Yu, Han Wang, Wei Yang, Ryan Rossi, Franck Dernoncourt, Xiyang Hu, Philip Yu, Chaowei Xiao, Huan Zhang, Yue Zhao,
- Abstract要約: 2段階にわたるエージェントスキルの過剰な特権を評価するベンチマークを提案する。
過剰に特権化された行動は例外ではなく規範であることがわかった。
その結果、エージェント動作を含むスキル層は、それ自体が現在のシステムにおける特権エスカレーションの主要な源であることを示唆している。
- 参考スコア(独自算出の注目度): 68.34663362794069
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Large language model agents increasingly operate through an intermediate skill layer that mediates between user intent and concrete task execution. This layer is widely treated as an organizational abstraction, but we argue it is also a privilege boundary that current models routinely exceed. We present \textbf{FORTIS}, a benchmark that evaluates over-privilege in agent skills across two stages: whether a model selects the minimally sufficient skill from a large overlapping library, and whether it executes that skill without expanding into broader tools or actions than the skill permits. Across ten frontier models and three domains, we find that over-privileged behavior is the norm rather than the exception. Models consistently reach for higher-privilege skills and tools than the task requires, failing at both stages at rates that remain high even for the strongest available models. Failure is especially severe under the ordinary conditions of real user interaction: incomplete specification, convenience framing, and proximity to skill boundaries. None of these requires adversarial construction. The results indicate that the skill layer, far from containing agent behavior, is itself a primary source of privilege escalation in current systems.
- Abstract(参考訳): 大規模言語モデルエージェントは、ユーザ意図と具体的なタスク実行の間を仲介する中間スキルレイヤを介して、ますます運用されるようになる。
このレイヤは組織的な抽象化として広く扱われていますが、現在のモデルが日常的に上回る特権境界でもある、と私たちは考えています。
本稿では,モデルが大規模に重複するライブラリから最小限のスキルを選択するか,そのスキルを実行するかという2段階にわたるエージェントスキルの過小評価を行うベンチマークであるtextbf{FORTIS}について述べる。
10のフロンティアモデルと3つの領域にわたって、過剰に特権化された振る舞いは例外ではなく規範である。
モデルは、タスクよりも高い特権スキルとツールに一貫して到達し、最強のモデルであっても高いレートで、両方の段階で失敗する。
不完全な仕様、便利なフレーミング、スキルバウンダリの近接といった、実際のユーザインタラクションの一般的な条件下では、特に障害は深刻です。
いずれも敵陣建設は必要としない。
その結果、エージェント動作を含むスキル層は、それ自体が現在のシステムにおける特権エスカレーションの主要な源であることを示唆している。
関連論文リスト
- SkillScope: Toward Fine-Grained Least-Privilege Enforcement for Agent Skills [39.85716310474543]
SkillScopeは,エージェントスキルの細粒度化のためのフレームワークである。
SkillScopeは、潜在的な過小評価候補を抽出し、それらをグラフで検証したユーザタスクと、過小評価されたアクションの制約の下で検証する。
我々はSkillScopeの有効性実験と大規模実世界計測による評価を行った。
論文 参考訳(メタデータ) (2026-05-07T08:34:14Z) - Breaking User-Centric Agency: A Tri-Party Framework for Agent-Based Recommendation [59.362016745945375]
第1回LLM-Adnt Recommendation framework(TriRec)を提案する。
TriRecは、ユーザユーティリティ、アイテム露出、プラットフォームレベルの公正性を明示的に調整する。
精度、公平性、およびアイテムレベルのユーティリティにおいて、一貫した利得を示す。
論文 参考訳(メタデータ) (2026-03-11T11:40:13Z) - SoK: Agentic Skills -- Beyond Tool Use in LLM Agents [6.356997609995175]
エージェントシステムは、より確実にロングホライゾンを実行するために、再利用可能な手続き能力、すなわちエージェントスキルに依存している。
本論文は,全ライフサイクルのスキルレイヤ(発見,実践,蒸留,貯蔵,構成,評価,更新)をマッピングする。
我々は、スキルベースのエージェントのセキュリティとガバナンスの影響を分析し、サプライチェーンのリスク、スキルペイロードによるインジェクションの促進、信頼度の高い実行をカバーします。
論文 参考訳(メタデータ) (2026-02-24T13:11:38Z) - Agent Skill Framework: Perspectives on the Potential of Small Language Models in Industrial Environments [14.079091139464175]
この研究は、エージェントスキルプロセスの形式的な数学的定義を導入し、その後、様々な大きさの言語モデルの体系的な評価を行った。
その結果、小型モデルは信頼性の高いスキル選択に苦しむ一方で、中程度のサイズのSLM(約12B~30B)はエージェントスキルアプローチから大きく恩恵を受けることがわかった。
論文 参考訳(メタデータ) (2026-02-18T17:52:17Z) - The Why Behind the Action: Unveiling Internal Drivers via Agentic Attribution [63.61358761489141]
LLM(Large Language Model)ベースのエージェントは、カスタマーサービス、Webナビゲーション、ソフトウェアエンジニアリングといった現実世界のアプリケーションで広く使われている。
本稿では,タスク結果に関係なく,エージェントの動作を駆動する内部要因を識別する,テキスト汎用エージェント属性のための新しいフレームワークを提案する。
標準ツールの使用やメモリ誘起バイアスのような微妙な信頼性リスクなど、さまざまなエージェントシナリオでフレームワークを検証する。
論文 参考訳(メタデータ) (2026-01-21T15:22:21Z) - Youtu-LLM: Unlocking the Native Agentic Potential for Lightweight Large Language Models [78.73992315826035]
ネイティブエージェントインテリジェンスと高い計算効率を調和させる軽量言語モデルであるYoutu-LLMを紹介する。
Youtu-LLMは、スクラッチから体系的に推論と計画能力の育成まで事前訓練されている。
論文 参考訳(メタデータ) (2025-12-31T04:25:11Z) - SOPBench: Evaluating Language Agents at Following Standard Operating Procedures and Constraints [59.645885492637845]
SOPBenchは、各サービス固有のSOPコードプログラムを実行可能な関数の有向グラフに変換する評価パイプラインである。
提案手法では,各サービス固有のSOPコードプログラムを実行可能関数の有向グラフに変換し,自然言語SOP記述に基づいてこれらの関数を呼び出しなければならない。
我々は18の先行モデルを評価し、上位モデルでさえタスクが困難であることを示す。
論文 参考訳(メタデータ) (2025-03-11T17:53:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。