論文の概要: Persona2Web: Benchmarking Personalized Web Agents for Contextual Reasoning with User History
- arxiv url: http://arxiv.org/abs/2602.17003v1
- Date: Thu, 19 Feb 2026 01:54:26 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-20 15:21:28.599094
- Title: Persona2Web: Benchmarking Personalized Web Agents for Contextual Reasoning with User History
- Title(参考訳): Persona2Web: ユーザ履歴とコンテキスト推論のためのパーソナライズされたWebエージェントのベンチマーク
- Authors: Serin Kim, Sangam Lee, Dongha Lee,
- Abstract要約: Persona2Webは、実際のオープンウェブ上でパーソナライズされたWebエージェントを評価するための最初のベンチマークである。
1) 長期にわたる嗜好を暗黙的に明らかにするユーザ履歴,(2) 暗黙的な嗜好を推論するエージェントを必要とするあいまいなクエリ,(3) パーソナライゼーションのきめ細かい評価を可能にする推論対応評価フレームワークから構成される。
- 参考スコア(独自算出の注目度): 8.085230376705887
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Large language models have advanced web agents, yet current agents lack personalization capabilities. Since users rarely specify every detail of their intent, practical web agents must be able to interpret ambiguous queries by inferring user preferences and contexts. To address this challenge, we present Persona2Web, the first benchmark for evaluating personalized web agents on the real open web, built upon the clarify-to-personalize principle, which requires agents to resolve ambiguity based on user history rather than relying on explicit instructions. Persona2Web consists of: (1) user histories that reveal preferences implicitly over long time spans, (2) ambiguous queries that require agents to infer implicit user preferences, and (3) a reasoning-aware evaluation framework that enables fine-grained assessment of personalization. We conduct extensive experiments across various agent architectures, backbone models, history access schemes, and queries with varying ambiguity levels, revealing key challenges in personalized web agent behavior. For reproducibility, our codes and datasets are publicly available at https://anonymous.4open.science/r/Persona2Web-73E8.
- Abstract(参考訳): 大きな言語モデルには高度なWebエージェントがあるが、現在のエージェントにはパーソナライズ機能が欠けている。
ユーザが意図するすべての詳細を特定できないため、実践的なWebエージェントは、ユーザの好みやコンテキストを推測することによって、あいまいなクエリを解釈できなければならない。
この課題に対処するため,実際のオープン Web 上でパーソナライズされた Web エージェントを評価するための最初のベンチマークである Persona2Web を提示する。
Persona2Web は,(1) 長期にわたる嗜好を暗黙的に明らかにするユーザ履歴,(2) 暗黙的な嗜好を推論するエージェントを必要とするあいまいなクエリ,(3) パーソナライゼーションのきめ細かい評価を可能にする推論対応評価フレームワークから構成される。
我々は様々なエージェント・アーキテクチャ、バックボーン・モデル、履歴アクセス・スキーム、様々なあいまいさレベルのクエリに対して広範な実験を行い、パーソナライズされたWebエージェントの振る舞いにおいて重要な課題を明らかにした。
再現性のために、コードとデータセットはhttps://anonymous.4open.science/r/Persona2Web-73E8で公開されています。
関連論文リスト
- Me-Agent: A Personalized Mobile Agent with Two-Level User Habit Learning for Enhanced Interaction [20.029487905328004]
学習可能で記憶に残るパーソナライズされたモバイルエージェントであるMe-Agentを提案する。
Me-Agentには2段階のユーザ習慣学習アプローチが組み込まれている。
Me-Agentは、競争力のある命令実行性能を維持しながら、パーソナライズにおける最先端のパフォーマンスを達成する。
論文 参考訳(メタデータ) (2026-01-28T01:44:19Z) - A Generative Framework for Personalized Sticker Retrieval [73.57899194210141]
我々はパーソナライズされたステッカー検索のための新しい生成フレームワークであるPEARLを提案する。
i) ユーザ固有のステッカー嗜好を符号化するために,識別的ユーザ表現を学習するための表現学習モデルを設計し, (ii) ユーザのクエリ意図に合致したステッカーを生成するために, 新たな意図認識学習目標を提案する。
オフライン評価とオンラインテストの両方による実証的な結果は、PEARLが最先端の手法を大幅に上回っていることを示している。
論文 参考訳(メタデータ) (2025-09-22T13:11:44Z) - PersonaAgent: When Large Language Model Agents Meet Personalization at Test Time [87.99027488664282]
PersonaAgentは、汎用的なパーソナライゼーションタスクに対処するために設計されたフレームワークである。
パーソナライズされたメモリモジュールとパーソナライズされたアクションモジュールを統合する。
テストタイムのユーザ嗜好アライメント戦略は、リアルタイムのユーザの嗜好アライメントを保証する。
論文 参考訳(メタデータ) (2025-06-06T17:29:49Z) - Personalized Query Auto-Completion for Long and Short-Term Interests with Adaptive Detoxification Generation [18.762185355073008]
本稿では,長期的かつ短期的な関心事からパーソナライズされた情報をキャプチャする新しいモデル(LaD)を提案する。
LaDでは、パーソナライズされた情報は、粗い粒度ときめ細かい粒度の両方で階層的にキャプチャされる。
私たちのモデルはKuaishou検索にデプロイされ、数億人のアクティブユーザーの主要なトラフィックを駆動しています。
論文 参考訳(メタデータ) (2025-05-27T09:58:42Z) - Large Language Models Empowered Personalized Web Agents [54.944908837494374]
Webエージェントは、従来のエージェントから、LLM(Large Language Models)ベースのWebエージェントへと進化してきた。
まず, LLMを活用したパーソナライズされたWebエージェントのタスクを定式化し, パーソナライズされたデータとユーザ指示を統合する。
我々はパーソナライズされたユーザメモリ拡張アライメント(PUMA)フレームワークを提案し、パーソナライズされたWebエージェントタスクにLLMを適用する。
論文 参考訳(メタデータ) (2024-10-22T17:54:45Z) - A Neural Topical Expansion Framework for Unstructured Persona-oriented
Dialogue Generation [52.743311026230714]
Persona Exploration and Exploitation (PEE)は、事前に定義されたユーザペルソナ記述を意味論的に相関したコンテンツで拡張することができる。
PEEはペルソナ探索とペルソナ搾取という2つの主要なモジュールで構成されている。
提案手法は, 自動評価と人的評価の両面で, 最先端のベースラインを上回っている。
論文 参考訳(メタデータ) (2020-02-06T08:24:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。