論文の概要: Anonymization-Enhanced Privacy Protection for Mobile GUI Agents: Available but Invisible
- arxiv url: http://arxiv.org/abs/2602.10139v1
- Date: Sun, 08 Feb 2026 15:50:04 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-12 21:44:01.166412
- Title: Anonymization-Enhanced Privacy Protection for Mobile GUI Agents: Available but Invisible
- Title(参考訳): 匿名化によるモバイルGUIエージェントのプライバシー保護強化
- Authors: Lepeng Zhao, Zhenhua Zou, Shuo Li, Zhuotao Liu,
- Abstract要約: Mobile Graphical User Interface (GUI)エージェントは、複雑なスマートフォンタスクを自動化する強力な機能を示している。
本稿では,機密データへのアクセスの原則を強制する匿名化に基づくプライバシー保護フレームワークを提案する。
本システムは,PII認識モデルを用いてセンシティブなUIコンテンツを検出し,それを決定論的型保存プレースホルダーに置き換える。
- 参考スコア(独自算出の注目度): 12.742325129012576
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Mobile Graphical User Interface (GUI) agents have demonstrated strong capabilities in automating complex smartphone tasks by leveraging multimodal large language models (MLLMs) and system-level control interfaces. However, this paradigm introduces significant privacy risks, as agents typically capture and process entire screen contents, thereby exposing sensitive personal data such as phone numbers, addresses, messages, and financial information. Existing defenses either reduce UI exposure, obfuscate only task-irrelevant content, or rely on user authorization, but none can protect task-critical sensitive information while preserving seamless agent usability. We propose an anonymization-based privacy protection framework that enforces the principle of available-but-invisible access to sensitive data: sensitive information remains usable for task execution but is never directly visible to the cloud-based agent. Our system detects sensitive UI content using a PII-aware recognition model and replaces it with deterministic, type-preserving placeholders (e.g., PHONE_NUMBER#a1b2c) that retain semantic categories while removing identifying details. A layered architecture comprising a PII Detector, UI Transformer, Secure Interaction Proxy, and Privacy Gatekeeper ensures consistent anonymization across user instructions, XML hierarchies, and screenshots, mediates all agent actions over anonymized interfaces, and supports narrowly scoped local computations when reasoning over raw values is necessary. Extensive experiments on the AndroidLab and PrivScreen benchmarks show that our framework substantially reduces privacy leakage across multiple models while incurring only modest utility degradation, achieving the best observed privacy-utility trade-off among existing methods.
- Abstract(参考訳): Mobile Graphical User Interface (GUI) エージェントは、マルチモーダル大言語モデル(MLLM)とシステムレベルの制御インタフェースを活用することで、複雑なスマートフォンタスクを自動化する強力な能力を実証している。
しかし、このパラダイムは、エージェントが通常、画面全体をキャプチャして処理し、電話番号、住所、メッセージ、財務情報などの機密性の高い個人情報を暴露するなど、重大なプライバシー上のリスクをもたらす。
既存の防御はUIの露出を減らすか、タスク非関連コンテンツのみを難読化するか、ユーザー認証に頼るかのいずれかだが、シームレスなエージェントのユーザビリティを維持しながらタスククリティカルな機密情報を保護することはできない。
本稿では,機密データへのアクセスの原則を強制する匿名化に基づくプライバシ保護フレームワークを提案する。
提案システムは,PII認識モデルを用いてセンシティブなUIコンテンツを検出し,詳細を識別しながらセマンティックなカテゴリを保持する決定論的型保存プレースホルダー(PHONE_NUMBER#a1b2c)に置き換える。
PII Detector、UI Transformer、Secure Interaction Proxy、Privacy Gatekeeperで構成される階層アーキテクチャは、ユーザ命令、XML階層、スクリーンショット間の一貫した匿名化を確保し、匿名化インターフェース上ですべてのエージェントアクションを仲介し、生値の推論が必要なときに狭い範囲のローカル計算をサポートする。
AndroidLabとPrivScreenベンチマークの大規模な実験により、当社のフレームワークは、複数のモデル間でのプライバシのリークを著しく低減しつつ、わずかにユーティリティの劣化を招き、既存の方法の中で最もよく観察されたプライバシとユーティリティのトレードオフを実現しています。
関連論文リスト
- GUIGuard: Toward a General Framework for Privacy-Preserving GUI Agents [38.42792282309646]
GUIはよりリッチでアクセスしやすいプライベート情報を公開し、プライバシーリスクはシーケンシャルなシーンにわたるインタラクションの軌跡に依存する。
本稿では,プライバシ認識,プライバシ保護,保護下のタスク実行という,プライバシ保護GUIエージェントのための3段階フレームワークを提案する。
この結果は,GUIエージェントにとって重要なボトルネックとして,プライバシ認識に注目した。
論文 参考訳(メタデータ) (2026-01-26T11:33:40Z) - Privacy Beyond Pixels: Latent Anonymization for Privacy-Preserving Video Understanding [56.369026347458835]
本稿では,ビデオ基盤モデルにおける視覚的プライバシ保護の新たな定式化について紹介する。
入力ピクセルレベルの匿名化に関する現在のプライバシー保護手法では、ユーティリティビデオモデル全体を再トレーニングする必要がある。
軽量な Anonym Adapter Module (AAM) は、一般的なタスクユーティリティを維持しながら、ビデオ機能からプライベート情報を除去する。
論文 参考訳(メタデータ) (2025-11-11T18:56:27Z) - Effective and Stealthy One-Shot Jailbreaks on Deployed Mobile Vision-Language Agents [29.62914440645731]
アプリ内のプロンプトインジェクションを活用する一発のjailbreak攻撃を提示する。
悪意のあるアプリはUIテキストに短いプロンプトを埋め込むが、エージェントがADBを介してUIを駆動すると明らかになる。
当社のフレームワークは,(1)悪質なアプリへのペイロードをエージェントの視覚入力として注入する低プライバシー認識チェーンターゲティング,(2)物理的タッチ属性を用いてエージェントを識別し,エージェント操作時にのみペイロードを公開するタッチベーストリガ,(3)ステルス誘導された文字レベルのワンショットプロンプトエフェクト,の3つの重要なコンポーネントから構成される。
論文 参考訳(メタデータ) (2025-10-09T05:34:57Z) - GAMA: A General Anonymizing Multi-Agent System for Privacy Preservation Enhanced by Domain Rules and Disproof Mechanism [14.491054279033968]
GAMA(General Anonymizing Multi-Agent System)
GAMAはエージェントのワークスペースをプライベートとパブリックに分割し、構造化された匿名化機構を通じてプライバシーを確保する。
GAMAを2つの一般的な質問応答データセット、公開プライバシーリークベンチマーク、およびプライバシに関連する2つのカスタマイズされた質問応答データセットで評価する。
論文 参考訳(メタデータ) (2025-09-12T07:22:49Z) - Mind the Privacy Unit! User-Level Differential Privacy for Language Model Fine-Tuning [62.224804688233]
差分プライバシ(DP)は、モデルが特定のプライバシユニットで「ほとんど区別できない」ことを保証することで、有望なソリューションを提供する。
ユーザ間でのプライバシー保護の確保に必要なアプリケーションによって動機づけられたユーザレベルのDPについて検討する。
論文 参考訳(メタデータ) (2024-06-20T13:54:32Z) - Diff-Privacy: Diffusion-based Face Privacy Protection [58.1021066224765]
本稿では,Diff-Privacyと呼ばれる拡散モデルに基づく顔のプライバシー保護手法を提案する。
具体的には、提案したマルチスケール画像インバージョンモジュール(MSI)をトレーニングし、元の画像のSDMフォーマット条件付き埋め込みのセットを得る。
本研究は,条件付き埋め込みに基づいて,組込みスケジューリング戦略を設計し,デノナイズプロセス中に異なるエネルギー関数を構築し,匿名化と視覚的アイデンティティ情報隠蔽を実現する。
論文 参考訳(メタデータ) (2023-09-11T09:26:07Z) - SPAct: Self-supervised Privacy Preservation for Action Recognition [73.79886509500409]
アクション認識におけるプライバシー漏洩を緩和するための既存のアプローチは、ビデオデータセットのアクションラベルとともに、プライバシラベルを必要とする。
自己教師付き学習(SSL)の最近の進歩は、未ラベルデータの未発見の可能性を解き放ちつつある。
本稿では、プライバシーラベルを必要とせず、自己管理的な方法で、入力ビデオからプライバシー情報を除去する新しいトレーニングフレームワークを提案する。
論文 参考訳(メタデータ) (2022-03-29T02:56:40Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。