論文の概要: AlignUSER: Human-Aligned LLM Agents via World Models for Recommender System Evaluation
- arxiv url: http://arxiv.org/abs/2601.00930v1
- Date: Fri, 02 Jan 2026 03:01:33 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-06 16:25:21.865136
- Title: AlignUSER: Human-Aligned LLM Agents via World Models for Recommender System Evaluation
- Title(参考訳): AlignuseR:リコメンダシステム評価のための世界モデルによる人為的LLMエージェント
- Authors: Nicolas Bougie, Gian Maria Marconi, Tony Yip, Narimasa Watanabe,
- Abstract要約: 人間のインタラクションから世界モデル駆動エージェントを学習するフレームワークであるAlignを紹介する。
実証に関する反事実的軌跡を生成し, LLMに人間の選択と判断を比較し, 準最適行動を特定し, 教訓を抽出するよう促す。
- 参考スコア(独自算出の注目度): 0.7031557790463293
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Evaluating recommender systems remains challenging due to the gap between offline metrics and real user behavior, as well as the scarcity of interaction data. Recent work explores large language model (LLM) agents as synthetic users, yet they typically rely on few-shot prompting, which yields a shallow understanding of the environment and limits their ability to faithfully reproduce user actions. We introduce AlignUSER, a framework that learns world-model-driven agents from human interactions. Given rollout sequences of actions and states, we formalize world modeling as a next state prediction task that helps the agent internalize the environment. To align actions with human personas, we generate counterfactual trajectories around demonstrations and prompt the LLM to compare its decisions with human choices, identify suboptimal actions, and extract lessons. The learned policy is then used to drive agent interactions with the recommender system. We evaluate AlignUSER across multiple datasets and demonstrate closer alignment with genuine humans than prior work, both at the micro and macro levels.
- Abstract(参考訳): オフラインメトリクスと実際のユーザの振る舞いのギャップと、インタラクションデータの不足のため、レコメンダシステムの評価は依然として難しい。
最近の研究は、大規模言語モデル(LLM)エージェントを合成ユーザとして探求しているが、通常、ほとんどショットプロンプトに依存しており、環境の理解が浅い上に、ユーザアクションを忠実に再現する能力が制限されている。
本稿では,人間のインタラクションから世界モデル駆動エージェントを学習するフレームワークであるAlignUSERを紹介する。
アクションと状態のロールアウトシーケンスが与えられた場合、エージェントが環境を内部化するのに役立つ次の状態予測タスクとして、世界モデリングを形式化する。
行動と人間のペルソナを整合させるため,実証に関する反実的軌跡を生成し,その決定を人間の選択と比較し,最適な行動を特定し,教訓を抽出する。
学習されたポリシーは、推奨システムとのエージェントインタラクションを促進するために使用される。
複数のデータセットにまたがってAlignUSERを評価し,マイクロレベルとマクロレベルの両方において,従来の作業よりも真の人間との密接な連携を示す。
関連論文リスト
- Sample-Efficient Online Learning in LM Agents via Hindsight Trajectory Rewriting [92.57796055887995]
本稿では,言語モデルエージェントの強化学習から後視体験のリプレイに適応するプロンプトフレームワークECHOを紹介する。
ECHOは失敗した試みで達成できた代替目標のために最適化された軌道を生成する。
我々は、テキストベースのナビゲーションと計画ベンチマークであるXMiniGridのステートフルバージョンと、協調的な情報収集企業シミュレーションであるPeopleJoinQAについて、ECHOを評価した。
論文 参考訳(メタデータ) (2025-10-11T18:11:09Z) - Personas within Parameters: Fine-Tuning Small Language Models with Low-Rank Adapters to Mimic User Behaviors [1.8352113484137629]
正確なレコメンデーションモデルを開発する上での長年の課題は、主にユーザインタラクションの複雑な性質のために、ユーザの振る舞いをシミュレートすることである。
本研究では, 凍結したLarge Language Models (LLMs) を用いてロバストなユーザ表現を抽出し, 微調整小言語モデル (SLMs) を用いたコスト効率, 資源効率のよいユーザエージェントをシミュレートする手法を提案する。
提案手法の有効性を実証し,本手法を用いて開発したユーザエージェントが,オフラインメトリクスとレコメンデータシステムの実環境性能のギャップを埋める可能性を示した。
論文 参考訳(メタデータ) (2025-08-18T22:14:57Z) - WorldCoder, a Model-Based LLM Agent: Building World Models by Writing Code and Interacting with the Environment [11.81398773711566]
我々は,環境とのインタラクションに基づいて,世界の知識を表現したPythonプログラムを構築するモデルベースエージェントを提案する。
我々は,グリッドワールド,タスクプランニングにおいて,我々のアプローチは深層RLに比べてサンプリング効率が良く,ReActスタイルのエージェントよりも計算効率が良く,コードを編集することで,その知識を環境間で伝達することができることを研究した。
論文 参考訳(メタデータ) (2024-02-19T16:39:18Z) - On Generative Agents in Recommendation [58.42840923200071]
Agent4Recは、Large Language Modelsに基づいたレコメンデーションのユーザーシミュレータである。
各エージェントは、ページ単位でパーソナライズされた推奨モデルと対話する。
論文 参考訳(メタデータ) (2023-10-16T06:41:16Z) - AgentCF: Collaborative Learning with Autonomous Language Agents for
Recommender Systems [112.76941157194544]
本稿では,エージェントベースの協調フィルタリングにより,レコメンデータシステムにおけるユーザとイテムのインタラクションをシミュレートするエージェントCFを提案する。
我々は、ユーザだけでなく、アイテムをエージェントとして、創造的に考慮し、両方のエージェントを同時に最適化する協調学習アプローチを開発します。
全体として、最適化されたエージェントは、ユーザ・イテム、ユーザ・ユーザ・ユーザ、アイテム・イテム、集合的インタラクションなど、フレームワーク内での多様なインタラクションの振る舞いを示す。
論文 参考訳(メタデータ) (2023-10-13T16:37:14Z) - User Behavior Simulation with Large Language Model based Agents [116.74368915420065]
LLMベースのエージェントフレームワークを提案し,実際のユーザ動作をシミュレートするサンドボックス環境を設計する。
実験結果から,本手法のシミュレーション行動は実人の行動に非常に近いことが判明した。
論文 参考訳(メタデータ) (2023-06-05T02:58:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。