論文の概要: Benchmarking In-context Experiential Learning Through Repeated Product Recommendations
- arxiv url: http://arxiv.org/abs/2511.22130v1
- Date: Thu, 27 Nov 2025 05:48:51 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-01 19:47:55.412723
- Title: Benchmarking In-context Experiential Learning Through Repeated Product Recommendations
- Title(参考訳): 反復的製品レコメンデーションによる文脈内体験学習のベンチマーク
- Authors: Gilbert Yang, Yaqin Chen, Thomson Yen, Hongseok Namkoong,
- Abstract要約: 製品レコメンデーションコンテキストにおける文脈内体験学習の必要性を実証する。
実験学習・能動探索のためのベンチマーク(BELA)をキュレートする。
現在のフロンティアモデルは、エピソード全体で有意義な改善に苦慮している。
- 参考スコア(独自算出の注目度): 4.974691652259527
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: To reliably navigate ever-shifting real-world environments, agents must grapple with incomplete knowledge and adapt their behavior through experience. However, current evaluations largely focus on tasks that leave no ambiguity, and do not measure agents' ability to adaptively learn and reason through the experiences they accrued. We exemplify the need for this in-context experiential learning in a product recommendation context, where agents must navigate shifting customer preferences and product landscapes through natural language dialogue. We curate a benchmark for experiential learning and active exploration (BELA) that combines (1) rich real-world products from Amazon, (2) a diverse collection of user personas to represent heterogeneous yet latent preferences, and (3) a LLM user simulator powered by the persona to create rich interactive trajectories. We observe that current frontier models struggle to meaningfully improve across episodes, underscoring the need for agentic systems with strong in-context learning capabilities.
- Abstract(参考訳): 絶え間なく変化する現実世界の環境を確実にナビゲートするには、エージェントは不完全な知識を身につけ、経験を通じて行動に適応しなければならない。
しかしながら、現在の評価は、曖昧さを残さず、エージェントの適応的に学習し、彼らが獲得した経験を通じて推論する能力を測定することができないタスクに主に焦点をあてている。
商品レコメンデーションの文脈では、エージェントは自然言語対話を通じて、顧客の好みやプロダクトのランドスケープの変化をナビゲートする必要がある。
本研究では,(1)Amazonのリッチな実世界の製品,(2)不均一で潜伏した嗜好を表現する多様なユーザペルソナ,(3)ペルソナを利用したLCMユーザシミュレータを組み合わせることで,リッチなインタラクティブな軌跡を創出するBELA(Experiential Learning and Active Explorion)のベンチマークをキュレートする。
現在のフロンティアモデルは、強いコンテキスト内学習能力を持つエージェントシステムの必要性を強調し、エピソード間で有意義な改善に苦慮している。
関連論文リスト
- Agent Learning via Early Experience [93.83579011718858]
言語エージェントの長期的な目標は、彼ら自身の経験から学び、改善することであり、最終的には複雑な現実世界のタスクにおいて人間より優れています。
現在のエージェントのほとんどは、専門家データによる教師付き微調整に依存しており、スケールと一般化が不十分である。
本研究では,(1)環境力学における政策の基盤として収集された状態を利用するインプリシット・ワールド・モデリング,(2)エージェントが最適な行動から学習し,推論と意思決定を改善するための自己回帰という2つの手法について検討する。
論文 参考訳(メタデータ) (2025-10-09T17:59:17Z) - Building Self-Evolving Agents via Experience-Driven Lifelong Learning: A Framework and Benchmark [57.59000694149105]
本稿では、自己進化エージェントを構築するためのフレームワークである、経験駆動型生涯学習(ELL)を紹介する。
ELLは、Experience Exploration、Long-term Memory、Skill Learning、Knowledge Internalizationの4つのコア原則に基づいて構築されている。
また、学生の総合的な大学旅行をシミュレートするELLのベンチマークデータセットであるStuLifeを紹介した。
論文 参考訳(メタデータ) (2025-08-26T13:04:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。