論文の概要: Mobile GUI Agent Privacy Personalization with Trajectory Induced Preference Optimization
- arxiv url: http://arxiv.org/abs/2604.11259v1
- Date: Mon, 13 Apr 2026 10:12:03 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-14 20:13:16.467775
- Title: Mobile GUI Agent Privacy Personalization with Trajectory Induced Preference Optimization
- Title(参考訳): 軌道誘導優先最適化を用いた移動体GUIエージェントのプライバシパーソナライゼーション
- Authors: Zhixin Lin, Jungang Li, Dongliang Xu, Shidong Pan, Yibo Shi, Yuchi Liu, Yuecong Min, Yue Yao,
- Abstract要約: Trajectory induced Preference Optimization (TIPO)は、強いタスク実行可能性を維持しながら、ペルソナのアライメントと区別を改善する。
TIPOは、プライバシに関連する重要なステップを強調し、アライメントノイズを抑制するためにパディングゲーティングのために、好みの強度重み付けを使用している。
プライバシ設定データセットの結果から、TIPOは、強いタスク実行可能性を維持しながら、ペルソナのアライメントと区別を改善します。
- 参考スコア(独自算出の注目度): 15.373687648148506
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Mobile GUI agents powered by Multimodal Large Language Models (MLLMs) can execute complex tasks on mobile devices. Despite this progress, most existing systems still optimize task success or efficiency, neglecting users' privacy personalization. In this paper, we study the often-overlooked problem of agent personalization. We observe that personalization can induce systematic structural heterogeneity in execution trajectories. For example, privacy-first users often prefer protective actions, e.g., refusing permissions, logging out, and minimizing exposure, leading to logically different execution trajectories from utility-first users. Such variable-length and structurally different trajectories make standard preference optimization unstable and less informative. To address this issue, we propose Trajectory Induced Preference Optimization (TIPO), which uses preference-intensity weighting to emphasize key privacy-related steps and padding gating to suppress alignment noise. Results on our Privacy Preference Dataset show that TIPO improves persona alignment and distinction while preserving strong task executability, achieving 65.60% SR, 46.22 Compliance, and 66.67% PD, outperforming existing optimization methods across various GUI tasks. The code and dataset will be publicly released at https://github.com/Zhixin-L/TIPO.
- Abstract(参考訳): MLLM(Multimodal Large Language Models)を利用するモバイルGUIエージェントは、モバイルデバイス上で複雑なタスクを実行できる。
この進歩にもかかわらず、既存のシステムの多くは依然としてタスクの成功や効率を最適化し、ユーザのプライバシーのパーソナライゼーションを無視している。
本稿ではエージェントのパーソナライズに関して,よく見過ごされる問題について考察する。
パーソナライゼーションは,実行軌跡の系統的構造的不均一性を誘導する。
例えば、プライバシ優先のユーザは、例えば、パーミッションの拒否、ログアウト、露出の最小化といった保護アクションを好んでおり、ユーティリティ優先のユーザから論理的に異なる実行トラジェクトリを生成する。
このような可変長で構造的に異なる軌道は、標準的な選好最適化を不安定にし、より情報的でないものにする。
この問題に対処するために、優先強度重み付けを用いて重要なプライバシー関連ステップを強調し、アライメントノイズを抑制するためのパッドゲーティングを行うトラジェクトリ誘導優先最適化(TIPO)を提案する。
プライバシー設定データセットの結果、TIPOは、強いタスク実行可能性を維持しながらペルソナのアライメントと区別を改善し、65.60%のSR、46.22のコンプライアンス、66.67%のPDを達成した。
コードとデータセットはhttps://github.com/Zhixin-L/TIPOで公開される。
関連論文リスト
- Synthetic Interaction Data for Scalable Personalization in Large Language Models [67.31884245564086]
本稿ではPersonaGymという高忠実な合成データ生成フレームワークを紹介する。
パーソナライゼーションを静的なペルソナ-参照ペアとして扱う以前の作業とは異なり、PersonaGymは動的な選好プロセスをモデル化する。
我々は,高忠実度マルチターンパーソナライズされたインタラクショントラジェクトリの大規模かつ高品質で多様な合成データセットであるPersonaAtlasをリリースする。
論文 参考訳(メタデータ) (2026-02-12T20:41:22Z) - POPI: Personalizing LLMs via Optimized Natural Language Preference Inference [42.25870704040321]
POPIは、不均一なユーザ信号を簡潔な自然言語要約に変換するための選好推論モデルを導入する一般的なフレームワークである。
これらの要約は、パーソナライズされた応答を生成するために共有生成モデルを必要とする透明でコンパクトで、転送可能なパーソナライズ表現として機能する。
4つのパーソナライズベンチマークによる大規模な実験により、POPIはパーソナライズ精度を常に改善し、コンテキストオーバーヘッドを大きなマージンで低減することを示した。
論文 参考訳(メタデータ) (2025-10-17T23:07:57Z) - Personalized Language Models via Privacy-Preserving Evolutionary Model Merging [53.97323896430374]
言語モデルにおけるパーソナライゼーションは、個々のユーザやユーザグループに対する振る舞いをモデル化することを目的としている。
進化的アルゴリズム(PriME)によるプライバシ保護モデルマージを提案する。
PriMEは、プライバシーリスクを低減しつつ、ユーティリティを直接最適化するために、勾配のない方法を採用している。
LaMPベンチマークの実験によると、Primeは一貫してベースラインを上回り、タスクパフォーマンスを最大45%改善している。
論文 参考訳(メタデータ) (2025-03-23T09:46:07Z) - Few-shot Steerable Alignment: Adapting Rewards and LLM Policies with Neural Processes [50.544186914115045]
大きな言語モデル(LLM)は、日々のアプリケーションにますます組み込まれています。
個人ユーザの多様な嗜好との整合性を確保することは、重要な課題となっている。
数発のステアライメントのための新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2024-12-18T16:14:59Z) - Discovering Preference Optimization Algorithms with and for Large Language Models [50.843710797024805]
オフライン優先最適化は、LLM(Large Language Model)出力の品質を向上・制御するための重要な手法である。
我々は、人間の介入なしに、新しい最先端の選好最適化アルゴリズムを自動で発見する客観的発見を行う。
実験は、ロジスティックと指数的損失を適応的にブレンドする新しいアルゴリズムであるDiscoPOPの最先端性能を示す。
論文 参考訳(メタデータ) (2024-06-12T16:58:41Z) - Online Sensitivity Optimization in Differentially Private Learning [8.12606646175019]
クリッピング閾値を動的に最適化する新しい手法を提案する。
我々は、このしきい値を学習可能なパラメータとして扱い、しきい値とコスト関数のクリーンな関係を確立する。
提案手法は, 多様なデータセット, タスク, モデル次元, プライバシレベルにまたがる代替的かつ適応的な戦略に対して, 徹底的に評価される。
論文 参考訳(メタデータ) (2023-10-02T00:30:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。