論文の概要: Attacking Multimodal OS Agents with Malicious Image Patches
- arxiv url: http://arxiv.org/abs/2503.10809v1
- Date: Thu, 13 Mar 2025 18:59:12 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-03-17 22:04:29.041302
- Title: Attacking Multimodal OS Agents with Malicious Image Patches
- Title(参考訳): 悪意のあるイメージパッチによるマルチモーダルOSエージェントの攻撃
- Authors: Lukas Aichberger, Alasdair Paren, Yarin Gal, Philip Torr, Adel Bibi,
- Abstract要約: オペレーティングシステム(OS)エージェントの最近の進歩により、視覚言語モデルがOSのグラフィカルユーザインタフェースと直接対話できるようになる。
これらのマルチモーダルOSエージェントは、アプリケーションプログラミングインタフェース(API)を介して単一のプロンプトに応答して、自律的にコンピュータベースのタスクを実行する
スクリーンショットに写っていると、OSエージェントが特定のAPIを悪用して有害なアクションを起こさせるように、敵対的に妨害された悪意ある画像パッチ(MIP)を新たに導入する。
- 参考スコア(独自算出の注目度): 43.09197967149309
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Recent advances in operating system (OS) agents enable vision-language models to interact directly with the graphical user interface of an OS. These multimodal OS agents autonomously perform computer-based tasks in response to a single prompt via application programming interfaces (APIs). Such APIs typically support low-level operations, including mouse clicks, keyboard inputs, and screenshot captures. We introduce a novel attack vector: malicious image patches (MIPs) that have been adversarially perturbed so that, when captured in a screenshot, they cause an OS agent to perform harmful actions by exploiting specific APIs. For instance, MIPs embedded in desktop backgrounds or shared on social media can redirect an agent to a malicious website, enabling further exploitation. These MIPs generalise across different user requests and screen layouts, and remain effective for multiple OS agents. The existence of such attacks highlights critical security vulnerabilities in OS agents, which should be carefully addressed before their widespread adoption.
- Abstract(参考訳): オペレーティングシステム(OS)エージェントの最近の進歩により、視覚言語モデルがOSのグラフィカルユーザインタフェースと直接対話できるようになる。
これらのマルチモーダルOSエージェントは、アプリケーションプログラミングインタフェース(API)を介して単一のプロンプトに応答して、自律的にコンピュータベースのタスクを実行する。
このようなAPIは通常、マウスクリック、キーボード入力、スクリーンショットキャプチャなど、低レベルの操作をサポートする。
スクリーンショットに写っていると、OSエージェントが特定のAPIを悪用して有害なアクションを起こさせるように、敵対的に妨害された悪意ある画像パッチ(MIP)を新たに導入する。
例えば、デスクトップのバックグラウンドに埋め込まれたり、ソーシャルメディアで共有されたMIPは、エージェントを悪意のあるウェブサイトにリダイレクトし、さらなるエクスプロイトを可能にする。
これらのMIPは、異なるユーザリクエストと画面レイアウトにまたがって一般化され、複数のOSエージェントに有効である。
このような攻撃の存在は、OSエージェントの重大なセキュリティ脆弱性を強調している。
関連論文リスト
- UFO2: The Desktop AgentOS [60.317812905300336]
UFO2はWindowsデスクトップ用のマルチエージェントAgentOSで、実用的なシステムレベルの自動化に発展している。
我々は、20以上の現実世界のWindowsアプリケーションに対してUFO2を評価し、従来のCUAよりもロバスト性および実行精度を大幅に改善した。
我々の結果は、ディープOSの統合によって、信頼性の高いユーザ指向のデスクトップ自動化へのスケーラブルな道が開けることを示している。
論文 参考訳(メタデータ) (2025-04-20T13:04:43Z) - The Obvious Invisible Threat: LLM-Powered GUI Agents' Vulnerability to Fine-Print Injections [21.322212760700957]
LLM(Large Language Model)ベースのGUIエージェントは、高レベルな命令に従ってユーザの代用タスクを実行する専門的な自律システムである。
フォームや予約サービスなどの現実世界のタスクを完了させるには、GUIエージェントは機密性の高いユーザーデータを処理する必要がある。
これらの攻撃は、エージェントと人間のユーザに対する視覚的満足度の違いを悪用することが多い。
論文 参考訳(メタデータ) (2025-04-15T15:21:09Z) - Multi-Agent Systems Execute Arbitrary Malicious Code [9.200635465485067]
敵コンテンツは、システム内の制御と通信をハイジャックして、安全でないエージェントや機能を呼び出すことができることを示す。
直接的または間接的なプロンプト注入の影響を受けないエージェントであっても,制御フローハイジャック攻撃が成功することを示す。
論文 参考訳(メタデータ) (2025-03-15T16:16:08Z) - PC-Agent: A Hierarchical Multi-Agent Collaboration Framework for Complex Task Automation on PC [98.82146219495792]
本稿では,PC-Agentという階層型エージェントフレームワークを提案する。
認識の観点からは,現在のMLLMのスクリーンショットコンテンツに対する認識能力の不十分さを克服するために,アクティブ知覚モジュール(APM)を考案する。
意思決定の観点から、複雑なユーザ命令や相互依存サブタスクをより効果的に扱うために、階層的なマルチエージェント協調アーキテクチャを提案する。
論文 参考訳(メタデータ) (2025-02-20T05:41:55Z) - Attacking Vision-Language Computer Agents via Pop-ups [61.744008541021124]
VLMエージェントは、慎重に設計された対向的なポップアップによって容易に攻撃できることを示す。
この混乱は、エージェントが通常のタスクを実行する代わりにポップアップをクリックさせる。
論文 参考訳(メタデータ) (2024-11-04T18:56:42Z) - Imprompter: Tricking LLM Agents into Improper Tool Use [35.255462653237885]
大規模言語モデル(LLM)エージェントは、生成機械学習とコードインタプリタ、Webブラウジング、メール、より一般的には外部リソースなどのツールを融合した、新興コンピューティングパラダイムである。
我々はエージェントベースのシステムのセキュリティ基盤に貢献し、自動的に計算された難読化された敵攻撃の新しいクラスを探索する。
論文 参考訳(メタデータ) (2024-10-19T01:00:57Z) - Dissecting Adversarial Robustness of Multimodal LM Agents [70.2077308846307]
我々は、VisualWebArena上に現実的な脅威モデルを用いて、200の敵タスクと評価スクリプトを手動で作成する。
我々は,クロボックスフロンティアLMを用いた最新のエージェントを,リフレクションやツリーサーチを行うエージェントを含む,壊すことに成功している。
AREを使用して、新しいコンポーネントの追加に伴うロバスト性の変化を厳格に評価しています。
論文 参考訳(メタデータ) (2024-06-18T17:32:48Z) - CAAP: Context-Aware Action Planning Prompting to Solve Computer Tasks with Front-End UI Only [21.054681757006385]
本稿では,スクリーンショット画像のみを通して環境を知覚するエージェントを提案する。
大規模言語モデルの推論能力を活用することで,大規模人間の実演データの必要性を解消する。
AgentはMiniWoB++の平均成功率は94.5%、WebShopの平均タスクスコアは62.3である。
論文 参考訳(メタデータ) (2024-06-11T05:21:20Z) - Not what you've signed up for: Compromising Real-World LLM-Integrated
Applications with Indirect Prompt Injection [64.67495502772866]
大規模言語モデル(LLM)は、様々なアプリケーションに統合されつつある。
本稿では、プロンプトインジェクション攻撃を用いて、攻撃者が元の命令をオーバーライドし、制御を採用する方法を示す。
我々は、コンピュータセキュリティの観点から、影響や脆弱性を体系的に調査する包括的な分類法を導出する。
論文 参考訳(メタデータ) (2023-02-23T17:14:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。