論文の概要: PersonaAgent: When Large Language Model Agents Meet Personalization at Test Time
- arxiv url: http://arxiv.org/abs/2506.06254v1
- Date: Fri, 06 Jun 2025 17:29:49 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-09 17:28:43.569262
- Title: PersonaAgent: When Large Language Model Agents Meet Personalization at Test Time
- Title(参考訳): PersonaAgent: 大規模言語モデルエージェントがテスト時にパーソナライゼーションに出会ったとき
- Authors: Weizhi Zhang, Xinyang Zhang, Chenwei Zhang, Liangwei Yang, Jingbo Shang, Zhepei Wei, Henry Peng Zou, Zijie Huang, Zhengyang Wang, Yifan Gao, Xiaoman Pan, Lian Xiong, Jingguo Liu, Philip S. Yu, Xian Li,
- Abstract要約: PersonaAgentは、汎用的なパーソナライゼーションタスクに対処するために設計されたフレームワークである。
パーソナライズされたメモリモジュールとパーソナライズされたアクションモジュールを統合する。
テストタイムのユーザ嗜好アライメント戦略は、リアルタイムのユーザの嗜好アライメントを保証する。
- 参考スコア(独自算出の注目度): 87.99027488664282
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Large Language Model (LLM) empowered agents have recently emerged as advanced paradigms that exhibit impressive capabilities in a wide range of domains and tasks. Despite their potential, current LLM agents often adopt a one-size-fits-all approach, lacking the flexibility to respond to users' varying needs and preferences. This limitation motivates us to develop PersonaAgent, the first personalized LLM agent framework designed to address versatile personalization tasks. Specifically, PersonaAgent integrates two complementary components - a personalized memory module that includes episodic and semantic memory mechanisms; a personalized action module that enables the agent to perform tool actions tailored to the user. At the core, the persona (defined as unique system prompt for each user) functions as an intermediary: it leverages insights from personalized memory to control agent actions, while the outcomes of these actions in turn refine the memory. Based on the framework, we propose a test-time user-preference alignment strategy that simulate the latest n interactions to optimize the persona prompt, ensuring real-time user preference alignment through textual loss feedback between simulated and ground-truth responses. Experimental evaluations demonstrate that PersonaAgent significantly outperforms other baseline methods by not only personalizing the action space effectively but also scaling during test-time real-world applications. These results underscore the feasibility and potential of our approach in delivering tailored, dynamic user experiences.
- Abstract(参考訳): 大規模言語モデル(LLM)によって強化されたエージェントは、最近、広範囲のドメインやタスクにおいて印象的な機能を示す高度なパラダイムとして登場した。
それらの可能性にもかかわらず、現在のLLMエージェントは、ユーザのニーズや好みに応じて、柔軟性が欠如しているため、一大のアプローチを採用することが多い。
この制限は、多目的パーソナライゼーションタスクに対処するために設計された最初のパーソナライズされたLLMエージェントフレームワークであるPersonaAgentを開発する動機となっている。
具体的には、PersonaAgentは2つの補完的なコンポーネント - エピソードとセマンティックメモリ機構を含むパーソナライズされたメモリモジュール - と、エージェントがユーザに合わせてツールアクションを実行できるようにするパーソナライズされたアクションモジュールだ。
パーソナ(ユーザーごとにユニークなシステムプロンプトとして定義される)は仲介役として機能し、パーソナライズされたメモリからの洞察を利用してエージェントアクションを制御する。
本フレームワークをベースとして,最新のnのインタラクションをシミュレートしてペルソナプロンプトを最適化し,シミュレートされた応答とグラウンドトルース応答間のテキストロスフィードバックを通じて,リアルタイムなユーザ嗜好アライメントを確保するテスト時ユーザ嗜好アライメント戦略を提案する。
実験により、PersonaAgentはアクション空間を効果的にパーソナライズするだけでなく、実世界のテスト時にスケーリングすることで、他のベースライン手法よりも優れていることが示された。
これらの結果は、カスタマイズされた動的なユーザエクスペリエンスの提供において、私たちのアプローチの実現可能性と可能性を明確に示します。
関連論文リスト
- Embodied Agents Meet Personalization: Exploring Memory Utilization for Personalized Assistance [18.820008753896623]
大規模言語モデル(LLM)によって強化されたエンボディードエージェントは,家庭内オブジェクト再構成タスクにおいて高い性能を示した。
しかし、パーソナライズされた支援のためのメモリ利用におけるエンボディードエージェントの有効性は、いまだに過小評価されている。
本稿では,メモリ利用能力の評価を目的とした個人化エージェント評価フレームワークであるMementOについて述べる。
論文 参考訳(メタデータ) (2025-05-22T08:00:10Z) - SmartAgent: Chain-of-User-Thought for Embodied Personalized Agent in Cyber World [50.937342998351426]
COUT(Chain-of-User-Thought)は、新しい推論パラダイムである。
我々は、サイバー環境を認識し、パーソナライズされた要求を推論するエージェントフレームワークであるSmartAgentを紹介する。
我々の研究は、まずCOUTプロセスを定式化し、パーソナライズされたエージェント学習を具体化するための予備的な試みとして役立ちます。
論文 参考訳(メタデータ) (2024-12-10T12:40:35Z) - On Generative Agents in Recommendation [58.42840923200071]
Agent4Recは、Large Language Modelsに基づいたレコメンデーションのユーザーシミュレータである。
各エージェントは、ページ単位でパーソナライズされた推奨モデルと対話する。
論文 参考訳(メタデータ) (2023-10-16T06:41:16Z) - AgentCF: Collaborative Learning with Autonomous Language Agents for
Recommender Systems [112.76941157194544]
本稿では,エージェントベースの協調フィルタリングにより,レコメンデータシステムにおけるユーザとイテムのインタラクションをシミュレートするエージェントCFを提案する。
我々は、ユーザだけでなく、アイテムをエージェントとして、創造的に考慮し、両方のエージェントを同時に最適化する協調学習アプローチを開発します。
全体として、最適化されたエージェントは、ユーザ・イテム、ユーザ・ユーザ・ユーザ、アイテム・イテム、集合的インタラクションなど、フレームワーク内での多様なインタラクションの振る舞いを示す。
論文 参考訳(メタデータ) (2023-10-13T16:37:14Z) - Diagnosis, Feedback, Adaptation: A Human-in-the-Loop Framework for
Test-Time Policy Adaptation [20.266695694005943]
ポリシーは新しい環境にポリシーがデプロイされたときに発生する状態と報酬の変化によって、しばしば失敗する。
データ拡張は、エージェントの観察におけるタスク非関連の変化にモデルを不変にすることで、ロバスト性を高めることができる。
本稿では,ユーザからのフィードバックを直接活用して,タスク関連概念をパーソナライズする対話型フレームワークを提案する。
論文 参考訳(メタデータ) (2023-07-12T17:55:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。