論文の概要: Securing Computer-Use Agents: A Unified Architecture-Lifecycle Framework for Deployment-Grounded Reliability
- arxiv url: http://arxiv.org/abs/2605.07110v1
- Date: Fri, 08 May 2026 01:38:46 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-11 19:43:38.723266
- Title: Securing Computer-Use Agents: A Unified Architecture-Lifecycle Framework for Deployment-Grounded Reliability
- Title(参考訳): コンピュータ利用エージェントのセキュア化 - デプロイ周囲の信頼性を実現する統一アーキテクチャライフサイクルフレームワーク
- Authors: Zejian Chen, Zhanyuan Liu, Chaozhuo Li, Mengxiang Han, Songyang Liu, Litian Zhang, Feng Gao, Yiming Hei, Xi Zhang,
- Abstract要約: この記事では、CUAのデプロイメント基盤信頼性のためのアーキテクチャライフサイクルフレームワークを開発する。
この分析は、代表システム、ベンチマーク、およびセキュリティ/プライバシー研究を合成する。
- 参考スコア(独自算出の注目度): 21.333731425525205
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Computer-use agents(CUAs)are moving frombounded benchmarks toward real software environments, wherethey operate browsers, desktops, mobile applications, flesystems,terminals, and tool backends. In such settings, reliability isno longer captured by task success alone: perception errors,planning drift, memory use, tool mediation, permission scope,and runtime oversight jointly determine whether agent actionsremain aligned with user intent, Existing surveys organize theCUA landscape by methods, platforms, benchmarks, or securitythreats, but less explicitly connect capability formation, author-ity exposure, failure manifestation, and control placement. Toaddress this gap, the article develops an architecture-lifecycleframework for deployment-grounded reliability in CUAs. Thearchitectural view analyzes Perception, Decision, and Executionas coupled layers that transform software observations intoauthority-bearing actions, The lifecycle view examines Creation.Deployment, Operation, and Maintenance as stages in which priorsare learned, tools and permissions are bound, runtime trajecto.ries are stressed, and assurance must be preserved under drift.Using this lens, the analysis synthesizes representative systems,benchmarks, and security/privacy studies; distinguishes wherefailures become visible from where their enabling conditions areintroduced, and maps recurring intervention surfaces for controloversight, and assurance. OpenClaw is used only as a public moti.vating example of an open deployment pattern, not as a verifedinternal case study. The conclusion highlights open challengesin controllable grounding, long-horizon constraint preservation,safe authority binding, mixed-trust runtime defense, privacy-preserving memory,and continual assurance.
- Abstract(参考訳): コンピュータ利用エージェント(CUA)は、ブラウザ、デスクトップ、モバイルアプリケーション、ファイルシステム、端末、ツールバックエンドを運用する実際のソフトウェア環境へ、バウンドされたベンチマークから移行している。
認識エラー、計画ドリフト、メモリ使用、ツールメディエーション、パーミッションスコープ、実行時の監視 エージェントアクションがユーザ意図に一致しているかどうかを共同で判断する 既存の調査では、メソッド、プラットフォーム、ベンチマーク、セキュリティ脅威によってCUAのランドスケープを整理するが、機能形成、作者の露出、障害発生、制御配置を明示的に結合するものではない。
このギャップに対処するため、本記事ではCUAのデプロイメント・グラウンド・信頼性のためのアーキテクチャ・ライフサイクル・フレームワークを開発する。
Thearchitectural view analyzes Perception, Decision, and Executionas combined layer that transform software observed into Authority-bearing action, the lifecycle view examines Creation.Deployment, Operation, and maintenance as stage that priorsare learn, tool and permissions are bound, runtime trajecto.ries are stressed, and assurance must maintain under drift. このレンズを使用すると、分析は代表的システム、ベンチマーク、セキュリティ/プライバシ研究を合成し、その実現可能な状況から障害が見えるようにし、制御と保証のための介入面をマップする。
OpenClawは、オープンデプロイメントパターンの公開moti.vating例としてのみ使用される。
結論は、コントロール可能なグラウンディング、長期の制約保存、安全な権限拘束、混合トラストランタイム防御、プライバシ保護メモリ、継続的な保証に関するオープンな課題を強調している。
関連論文リスト
- Clawed and Dangerous: Can We Trust Open Agentic Systems? [12.04979073308511]
オープンエージェントシステムは、プランニングを外部機能、永続メモリ、特権実行と組み合わせる。
本稿では,6次元分析分類法を導入し,攻撃,ベンチマーク,防衛,監査,隣接技術基盤にまたがる50の論文を合成する。
文献は攻撃特性とベンチマーク構築において比較的成熟しているが,デプロイメントコントロールや運用管理,永続的メモリの完全性,能力回復には依然として弱いことが,我々のレビューで示されている。
論文 参考訳(メタデータ) (2026-03-27T09:45:12Z) - A Trace-Based Assurance Framework for Agentic AI Orchestration: Contracts, Testing, and Governance [0.22940141855172028]
本稿では,Large Language Models (LLM) を用いたエージェントAIシステムの保証フレームワークを提案する。
実行は、明示的なステップとトレースコントラクトを備えたメッセージ・アクション・トレース(MAT)として実装される。
このフレームワークは、有界摂動に対する予算付き反例探索として定式化されたストレステストを含む。
論文 参考訳(メタデータ) (2026-03-18T10:23:48Z) - Detecting Object Tracking Failure via Sequential Hypothesis Testing [80.7891291021747]
ビデオにおけるリアルタイムのオンラインオブジェクト追跡は、コンピュータビジョンにおける中核的なタスクである。
本稿では,物体追跡を逐次的仮説テストとして解釈することを提案する。
本研究では,地中追跡情報と内部追跡情報の両方を活用することにより,教師なしと教師なしの両方の変種を提案する。
論文 参考訳(メタデータ) (2026-02-13T14:57:15Z) - The Why Behind the Action: Unveiling Internal Drivers via Agentic Attribution [63.61358761489141]
LLM(Large Language Model)ベースのエージェントは、カスタマーサービス、Webナビゲーション、ソフトウェアエンジニアリングといった現実世界のアプリケーションで広く使われている。
本稿では,タスク結果に関係なく,エージェントの動作を駆動する内部要因を識別する,テキスト汎用エージェント属性のための新しいフレームワークを提案する。
標準ツールの使用やメモリ誘起バイアスのような微妙な信頼性リスクなど、さまざまなエージェントシナリオでフレームワークを検証する。
論文 参考訳(メタデータ) (2026-01-21T15:22:21Z) - CaMeLs Can Use Computers Too: System-level Security for Computer Use Agents [60.98294016925157]
AIエージェントは、悪意のあるコンテンツがエージェントの行動をハイジャックして認証情報を盗んだり、金銭的損失を引き起こすような、インジェクション攻撃に弱い。
CUAのためのシングルショットプランニングでは、信頼できるプランナーが、潜在的に悪意のあるコンテンツを観察する前に、条件付きブランチで完全な実行グラフを生成する。
このアーキテクチャ分離は命令インジェクションを効果的に防止するが、ブランチステアリング攻撃を防ぐには追加の対策が必要であることを示す。
論文 参考訳(メタデータ) (2026-01-14T23:06:35Z) - Towards Verifiably Safe Tool Use for LLM Agents [53.55621104327779]
大規模言語モデル(LLM)ベースのAIエージェントは、データソース、API、検索エンジン、コードサンドボックス、さらにはその他のエージェントなどのツールへのアクセスを可能にすることで、機能を拡張する。
LLMは意図しないツールインタラクションを起動し、機密データを漏洩したり、クリティカルレコードを上書きしたりするリスクを発生させる。
モデルベースセーフガードのようなリスクを軽減するための現在のアプローチは、エージェントの信頼性を高めるが、システムの安全性を保証することはできない。
論文 参考訳(メタデータ) (2026-01-12T21:31:38Z) - Architectures for Building Agentic AI [0.0]
この章は、エージェント的および生成的AIの信頼性は、主にアーキテクチャ上の特性であると主張している。
古典的基盤を基盤として,実践的な分類ツール利用エージェント,メモリ拡張エージェント,計画・自己改善エージェント,マルチエージェントシステム,具体化・ウェブエージェントを提案する。
論文 参考訳(メタデータ) (2025-12-10T09:28:40Z) - SoK: Measuring What Matters for Closed-Loop Security Agents [0.0]
CLASP: Closed-Loop Autonomous Security Performanceフレームワークを紹介します。
セキュリティライフサイクル(リコネッサンス、エクスプロイト、ルート原因合成分析、パッチ合成、バリデーション)をコアエージェント機能と整合させる。
次に,閉ループ能力(CLC)スコア(Closed-Loop Capability, CLC)を定義する。
論文 参考訳(メタデータ) (2025-10-02T04:20:35Z) - Bridging the Mobile Trust Gap: A Zero Trust Framework for Consumer-Facing Applications [51.56484100374058]
本稿では,信頼できないユーザ制御環境で動作するモバイルアプリケーションを対象としたZero Trustモデルを提案する。
デザインサイエンスの方法論を用いて、この研究は、実行時の信頼の強制をサポートする6つのピラーフレームワークを導入した。
提案したモデルは,デプロイ前コントロールを越えてモバイルアプリケーションをセキュアにするための,実用的で標準に準拠したアプローチを提供する。
論文 参考訳(メタデータ) (2025-08-20T18:42:36Z) - DRIFT: Dynamic Rule-Based Defense with Injection Isolation for Securing LLM Agents [52.92354372596197]
大規模言語モデル(LLM)は、強力な推論と計画能力のため、エージェントシステムの中心となってきています。
この相互作用は、外部ソースからの悪意のある入力がエージェントの振る舞いを誤解させる可能性がある、インジェクション攻撃のリスクも引き起こす。
本稿では,信頼に値するエージェントシステムのための動的ルールベースの分離フレームワークを提案する。
論文 参考訳(メタデータ) (2025-06-13T05:01:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。