論文の概要: Do Coding Agents Understand Least-Privilege Authorization?
- arxiv url: http://arxiv.org/abs/2605.14859v1
- Date: Thu, 14 May 2026 14:05:58 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-15 21:45:34.862395
- Title: Do Coding Agents Understand Least-Privilege Authorization?
- Title(参考訳): コーディングエージェントは最小限の認可に従わないか?
- Authors: Zheng Yan, Jingxiang Weng, Charles Chen, Dengyun Peng, Ethan Qin, Jiannan Guan, Jinhao Liu, Qiming Yu, Yixin Yuan, Fanqing Meng, Carl Che, Mengkang Hu,
- Abstract要約: 我々は、フロンティアモデルが実行チェーンに必要なパーミッションを省略し、未使用または機密アクセスを許可していることを示す。
本稿では,まず,タスクを前方にシミュレーションしてカバレッジ指向のポリシを生成し,各エントリをグラウンディングと感度で監査する。
この分解は、すべての評価されたモデルに対する攻撃の成功を減少させながら、タイトネスバイアスモデルにおいて、センシティブタスクの成功を最大15.8%改善する。
- 参考スコア(独自算出の注目度): 14.240332406666779
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: As coding agents gain access to shells, repositories, and user files, least-privilege authorization becomes a prerequisite for safe deployment: an agent should receive enough authority to complete the task, without unnecessary authority that exposes sensitive surfaces.To study whether current models can infer this boundary themselves, we first introduce permission-boundary inference, where a model maps a task instruction and terminal environment to a file-level read/write/execute policy, and AuthBench, a benchmark of 120 realistic terminal tasks with human-reviewed permission labels and executable validators for utility and attack outcomes.AuthBench shows that authorization is not a simple conservative-versus-permissive calibration problem: frontier models often omit permissions required by the execution chain while also granting unused or sensitive accesses.Increasing inference-time reasoning does not resolve this mismatch. Instead, each model moves toward a model-specific authorization attractor: more reasoning makes it more consistent in its own failure mode, whether broad-but-exposed or tight-but-brittle.This suggests that direct policy generation is the bottleneck, because a single generation must both discover all necessary accesses and reject all unnecessary ones.We therefore propose Sufficiency-Tightness Decomposition, which first generates a coverage-oriented policy by forward-simulating the task and then audits each granted entry for grounding and sensitivity.Across tested models, this decomposition improves sensitive-task success by up to 15.8% on tightness-biased models while reducing attack success across all evaluated models.
- Abstract(参考訳): コーディングエージェントがシェル、レポジトリ、ユーザファイルへのアクセスを得るとき、最低限の権限は安全な配置の必須条件となる: エージェントは、センシティブな表面を露出する不必要な権限なしでタスクを完了させる十分な権限を受け取るべきである。現在のモデルがこの境界自体を推論できるかどうかを調べるために、まずパーミッション境界推論を導入する。そこで、モデルがタスク命令と端末環境をファイルレベルの読み取り/書き込み/実行ポリシーにマッピングし、AuthBenchは、人間がレビューしたパーミッションラベルを持つ120のリアルなターミナルタスクのベンチマークであり、ユーティリティと攻撃結果の実行可能なバリデータである。AuthBenchは、認証が単純な保守的逆戻りのキャリブレーションの問題ではないことを示している。フロンティアモデルは、チェーンによって要求される権限を省略すると同時に、機密性のないアクセスを許可する。
これは、単一世代がすべての必要なアクセスを発見し、不要なものをすべて拒否しなければならないため、直接的なポリシー生成がボトルネックであることを示している。従って、我々は、まずタスクを前方にシミュレーションしてカバレッジ指向のポリシーを生成し、次に与えられたエントリをグラウンドと感度で監査し、テストされたモデル全体で、センシティブなタスクの成功を最大15.8%改善し、すべての評価されたモデルに対する攻撃成功を減少させる。
関連論文リスト
- PRISM: : Planning and Reasoning with Intent in Simulated Embodied Environments [59.07829883257003]
5つの集合住宅の上に建設され、PRISMは300の人間認証タスクを3つの能力レベルに構成する。
PRISMはエージェントに依存しない実行可能なアクションAPIを公開し、任意のエージェントをエンドツーエンドで評価できるようにする。
論文 参考訳(メタデータ) (2026-05-12T04:59:47Z) - Permit: Permission-Aware Representation Intervention for Controlled Generation in Large Language Models [11.113178145712885]
大きな言語モデル(LLM)は、機密文書やユーザコンテキストを扱うエンタープライズ環境にますます多くデプロイされている。
従来のアクセス制御では、情報がモデルにアクセスできるかどうかを規制するが、モデルが生成時にその情報をどのように利用するかはほとんど制限されていない。
Permitは、モデルが隠した状態に直接きめ細かな制御を施すことにより、このギャップを埋める新しいパーミッション対応表現介入フレームワークである。
論文 参考訳(メタデータ) (2026-05-10T11:20:48Z) - Authorization Propagation in Multi-Agent AI Systems: Identity Governance as Infrastructure [0.0]
我々はこの問題を認可伝搬と呼ぶ。
RBAC、ABAC、ReBACのような古典的なアクセス制御モデルでは、完全には対処できない。
この論文は、認可伝達をワークフローレベルのプロパティとして形式化し、3つのサブプロブレムを特定し、マルチエージェントAIシステムにおける認可アーキテクチャの7つの構造的要件を導出する。
論文 参考訳(メタデータ) (2026-05-06T20:56:17Z) - From CRUD to Autonomous Agents: Formal Validation and Zero-Trust Security for Semantic Gateways in AI-Native Enterprise Systems [0.0]
本稿では,モデルコンテキストプロトコル(MCP)が管理するセマンティックゲートウェイの設計,形式検証,実証評価を提案する。
ゲートウェイは、エンタプライズAPIをセマンティックサーフェスとして再構成する。
このアーキテクチャでは、事前に推論されたセマンティックファイアウォール、決定論的ツールレベルRBAC、アウトオブバンドの暗号化人間対ループの承認を含む3層ゼロトラストセキュリティモデルが導入されている。
論文 参考訳(メタデータ) (2026-04-28T12:25:06Z) - Compiling Activation Steering into Weights via Null-Space Constraints for Stealthy Backdoors [48.881343993730844]
安全性に整合した大規模言語モデル(LLM)は、現実世界のパイプラインにますますデプロイされている。
敵は通常の評価では動作しないバックドアのチェックポイントを配布することができる。
最近のポストホック重み付け法は、そのようなバックドアを注入するための効率的なアプローチを提供する。
論文 参考訳(メタデータ) (2026-04-14T06:48:33Z) - CREDIT: Certified Ownership Verification of Deep Neural Networks Against Model Extraction Attacks [54.04030169323115]
我々は、モデル抽出攻撃(MEA)に対する認証された所有権検証であるCREDITを紹介する。
DNNモデル間の類似性を定量化し、実用的な検証しきい値を提案し、このしきい値に基づいてオーナシップ検証を行うための厳密な理論的保証を提供する。
我々は、さまざまなドメインやタスクにまたがるいくつかの主流データセットに対するアプローチを広範囲に評価し、最先端のパフォーマンスを実現した。
論文 参考訳(メタデータ) (2026-02-23T23:36:25Z) - To Throw a Stone with Six Birds: On Agents and Agenthood [0.0]
Six Birds Theory (SBT)は、マクロな物体を原始体ではなく誘導的閉包として扱う。
SBT内では,タイプ正当性評価を行う。
我々はこの契約を4つのチェック可能なコンポーネントを用いて有限制御システムで運用する。
論文 参考訳(メタデータ) (2026-02-03T10:46:23Z) - SWAP: Towards Copyright Auditing of Soft Prompts via Sequential Watermarking [58.475471437150674]
ソフトプロンプト(SWAP)のための逐次透かしを提案する。
SWAPは、特定のディフェンダー指定のアウト・オブ・ディストリビューション・クラスを通じて、透かしを符号化する。
11のデータセットの実験では、SWAPの有効性、無害性、および潜在的適応攻撃に対する堅牢性を示す。
論文 参考訳(メタデータ) (2025-11-05T13:48:48Z) - TrustLoRA: Low-Rank Adaptation for Failure Detection under Out-of-distribution Data [62.22804234013273]
本稿では,共変量および意味的シフトの両条件下での拒絶による分類を統一し,促進する,単純な故障検出フレームワークを提案する。
キーとなる洞察は、障害固有の信頼性知識を低ランクアダプタで分離し、統合することにより、障害検出能力を効果的かつ柔軟に向上できるということです。
論文 参考訳(メタデータ) (2025-04-20T09:20:55Z) - Towards Copyright Protection for Knowledge Bases of Retrieval-augmented Language Models via Reasoning [58.57194301645823]
大規模言語モデル(LLM)は、現実のパーソナライズされたアプリケーションにますます統合されている。
RAGで使用される知識基盤の貴重かつしばしばプロプライエタリな性質は、敵による不正使用のリスクをもたらす。
これらの知識基盤を保護するための透かし技術として一般化できる既存の方法は、一般的に毒やバックドア攻撃を含む。
我々は、無害な」知識基盤の著作権保護の名称を提案する。
論文 参考訳(メタデータ) (2025-02-10T09:15:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。