論文の概要: PersonalAlign: Hierarchical Implicit Intent Alignment for Personalized GUI Agent with Long-Term User-Centric Records
- arxiv url: http://arxiv.org/abs/2601.09636v1
- Date: Wed, 14 Jan 2026 17:12:48 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-15 18:59:20.482829
- Title: PersonalAlign: Hierarchical Implicit Intent Alignment for Personalized GUI Agent with Long-Term User-Centric Records
- Title(参考訳): パーソナライズされたGUIエージェントの長期ユーザ中心記録のための階層的インシシシトインテントアライメント
- Authors: Yibo Lyu, Gongwei Chen, Rui Shao, Weili Guan, Liqiang Nie,
- Abstract要約: パーソナライズされたGUIエージェント(PersonalAlign)の階層的意図的アライメントに注目した。
PersonalAlignは、曖昧な指示で省略された好みを解決するために、長期的なユーザレコードを永続的なコンテキストとして活用する必要がある。
GPT-5, Qwen3-VL, UI-TARSなどのGUIエージェントをAndroidIntent上で評価する。
- 参考スコア(独自算出の注目度): 67.68348568175718
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: While GUI agents have shown strong performance under explicit and completion instructions, real-world deployment requires aligning with users' more complex implicit intents. In this work, we highlight Hierarchical Implicit Intent Alignment for Personalized GUI Agent (PersonalAlign), a new agent task that requires agents to leverage long-term user records as persistent context to resolve omitted preferences in vague instructions and anticipate latent routines by user state for proactive assistance. To facilitate this study, we introduce AndroidIntent, a benchmark designed to evaluate agents' ability in resolving vague instructions and providing proactive suggestions through reasoning over long-term user records. We annotated 775 user-specific preferences and 215 routines from 20k long-term records across different users for evaluation. Furthermore, we introduce Hierarchical Intent Memory Agent (HIM-Agent), which maintains a continuously updating personal memory and hierarchically organizes user preferences and routines for personalization. Finally, we evaluate a range of GUI agents on AndroidIntent, including GPT-5, Qwen3-VL, and UI-TARS, further results show that HIM-Agent significantly improves both execution and proactive performance by 15.7% and 7.3%.
- Abstract(参考訳): GUIエージェントは明示的かつ完成的な命令の下で高いパフォーマンスを示してきたが、現実のデプロイメントはユーザのより複雑な暗黙の意図と整合する必要がある。
本稿では,パーソナライズされたGUIエージェントのための階層的意図的アライメント(PersonalAlign)について紹介する。これはエージェントが長期ユーザレコードを永続的コンテキストとして活用し,曖昧な指示で省略された嗜好を解消し,ユーザの状態によって潜時ルーチンを予測し,積極的な支援を行うための新しいエージェントタスクである。
そこで本研究では,エージェントが不明瞭な命令を解決し,長期ユーザレコードの推論を通じて積極的な提案を行う能力を評価するためのベンチマークであるAndroidIntentを紹介する。
評価のために,ユーザ固有の好み775件,長期記録20万件から215件のルーチンをアノテートした。
さらに, 階層型インテントメモリエージェント(HIM-Agent)を導入し, 個人記憶を継続的に更新し, 個人化のためのユーザの好みやルーチンを階層的に整理する。
最後に、GPT-5、Qwen3-VL、UI-TARSを含むAndroidIntent上のGUIエージェントの範囲を評価し、さらに、HIM-Agentは実行とプロアクティブパフォーマンスの両方を15.7%および7.3%改善することを示した。
関連論文リスト
- PersonaAgent: When Large Language Model Agents Meet Personalization at Test Time [87.99027488664282]
PersonaAgentは、汎用的なパーソナライゼーションタスクに対処するために設計されたフレームワークである。
パーソナライズされたメモリモジュールとパーソナライズされたアクションモジュールを統合する。
テストタイムのユーザ嗜好アライメント戦略は、リアルタイムのユーザの嗜好アライメントを保証する。
論文 参考訳(メタデータ) (2025-06-06T17:29:49Z) - SmartAgent: Chain-of-User-Thought for Embodied Personalized Agent in Cyber World [50.937342998351426]
COUT(Chain-of-User-Thought)は、新しい推論パラダイムである。
我々は、サイバー環境を認識し、パーソナライズされた要求を推論するエージェントフレームワークであるSmartAgentを紹介する。
我々の研究は、まずCOUTプロセスを定式化し、パーソナライズされたエージェント学習を具体化するための予備的な試みとして役立ちます。
論文 参考訳(メタデータ) (2024-12-10T12:40:35Z) - Identifying User Goals from UI Trajectories [19.492331502146886]
観測されたUI軌道からタスク目標を識別する手法を提案する。
また,2つの意図記述をパラフレーズとみなすことができるかどうかを評価するための新しい評価手法を提案する。
このタスクをベンチマークするために、人間と最先端モデル、特にGPT-4とGemini-1.5 Proのパフォーマンスを比較した。
論文 参考訳(メタデータ) (2024-06-20T13:46:10Z) - Tell Me More! Towards Implicit User Intention Understanding of Language
Model Driven Agents [110.25679611755962]
現在の言語モデル駆動エージェントは、しばしば効果的なユーザ参加のメカニズムを欠いている。
Intention-in-Interaction (IN3) は明示的なクエリを通してユーザの暗黙の意図を検査するための新しいベンチマークである。
私たちは、タスクの曖昧さを積極的に評価し、ユーザの意図を問う強力なモデルであるMistral-Interactを経験的に訓練し、それらを実行可能な目標へと洗練させます。
論文 参考訳(メタデータ) (2024-02-14T14:36:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。