論文の概要: AgentRecBench: Benchmarking LLM Agent-based Personalized Recommender Systems
- arxiv url: http://arxiv.org/abs/2505.19623v2
- Date: Wed, 28 May 2025 14:32:56 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-29 15:04:28.091098
- Title: AgentRecBench: Benchmarking LLM Agent-based Personalized Recommender Systems
- Title(参考訳): AgentRecBench: LLMエージェントベースのパーソナライズされたレコメンダシステムのベンチマーク
- Authors: Yu Shang, Peijie Liu, Yuwei Yan, Zijing Wu, Leheng Sheng, Yuanqing Yu, Chumeng Jiang, An Zhang, Fengli Xu, Yu Wang, Min Zhang, Yong Li,
- Abstract要約: エージェントレコメンデータシステムはLarge Language Models (LLM)を利用している
LLMの高度な推論とロールプレイング能力は、自律的で適応的な意思決定を可能にする。
この分野では、これらの手法を評価するための標準化された評価プロトコルが欠けている。
- 参考スコア(独自算出の注目度): 17.329692234349768
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The emergence of agentic recommender systems powered by Large Language Models (LLMs) represents a paradigm shift in personalized recommendations, leveraging LLMs' advanced reasoning and role-playing capabilities to enable autonomous, adaptive decision-making. Unlike traditional recommendation approaches, agentic recommender systems can dynamically gather and interpret user-item interactions from complex environments, generating robust recommendation strategies that generalize across diverse scenarios. However, the field currently lacks standardized evaluation protocols to systematically assess these methods. To address this critical gap, we propose: (1) an interactive textual recommendation simulator incorporating rich user and item metadata and three typical evaluation scenarios (classic, evolving-interest, and cold-start recommendation tasks); (2) a unified modular framework for developing and studying agentic recommender systems; and (3) the first comprehensive benchmark comparing 10 classical and agentic recommendation methods. Our findings demonstrate the superiority of agentic systems and establish actionable design guidelines for their core components. The benchmark environment has been rigorously validated through an open challenge and remains publicly available with a continuously maintained leaderboard~\footnote[2]{https://tsinghua-fib-lab.github.io/AgentSocietyChallenge/pages/overview.html}, fostering ongoing community engagement and reproducible research. The benchmark is available at: \hyperlink{https://huggingface.co/datasets/SGJQovo/AgentRecBench}{https://huggingface.co/datasets/SGJQovo/AgentRecBench}.
- Abstract(参考訳): 大規模言語モデル(LLM)を利用したエージェントレコメンデーションシステムの出現は、パーソナライズされたレコメンデーションのパラダイムシフトであり、LLMの高度な推論とロールプレイング機能を活用して、自律的で適応的な意思決定を可能にする。
従来のレコメンデーションアプローチとは異なり、エージェント的なレコメンデーションシステムは複雑な環境から動的にユーザとイテムのインタラクションを収集し、解釈し、多様なシナリオにまたがって一般化する堅牢なレコメンデーション戦略を生成することができる。
しかし、この分野にはこれらの手法を体系的に評価するための標準化された評価プロトコルが欠けている。
そこで本研究では,(1)リッチユーザとアイテムメタデータと3つの典型的な評価シナリオ(古典的,進化的,コールドスタート的推薦タスク)を取り入れたインタラクティブテキストレコメンデーションシミュレータ,(2)エージェントレコメンデーションシステムの開発と研究のための統一的なモジュール化フレームワーク,(3)古典的,エージェントレコメンデーションメソッドを比較検討した最初の総合的なベンチマークを提案する。
本研究は, エージェントシステムの優位性を実証し, コアコンポーネントの実用的な設計ガイドラインを確立した。
ベンチマーク環境はオープンな課題を通じて厳格に検証され、継続的に維持されているリーダボード~\footnote[2]{https://tsinghua-fib-lab.github.io/AgentSocietyChallenge/pages/overview.html}で公開され、継続的なコミュニティの関与と再現可能な研究が促進されている。
ベンチマークは以下の通りである。 \hyperlink{https://huggingface.co/datasets/SGJQovo/AgentRecBench}{https://huggingface.co/datasets/SGJQovo/AgentRecBench}。
関連論文リスト
- A Survey on LLM-powered Agents for Recommender Systems [16.463945811669245]
大規模言語モデル(LLM)を利用したエージェントは、自然言語の相互作用と解釈可能な推論を可能にすることによって、有望なアプローチを提供する。
この調査は、レコメンデータシステムにおけるLSMを利用したエージェントの新たな応用の体系的なレビューを提供する。
論文 参考訳(メタデータ) (2025-02-14T09:57:07Z) - LANE: Logic Alignment of Non-tuning Large Language Models and Online Recommendation Systems for Explainable Reason Generation [15.972926854420619]
大きな言語モデル(LLM)を活用することで、包括的なレコメンデーションロジック生成の新しい機会を提供する。
レコメンデーションタスクのための微調整LDMモデルは、計算コストと既存のシステムとのアライメントの問題を引き起こす。
本研究は,LLMとオンラインレコメンデーションシステムとの連携を,LLMのチューニングを伴わない効果的戦略LANEを提案する。
論文 参考訳(メタデータ) (2024-07-03T06:20:31Z) - On Generative Agents in Recommendation [58.42840923200071]
Agent4Recは、Large Language Modelsに基づいたレコメンデーションのユーザーシミュレータである。
各エージェントは、ページ単位でパーソナライズされた推奨モデルと対話する。
論文 参考訳(メタデータ) (2023-10-16T06:41:16Z) - MISSRec: Pre-training and Transferring Multi-modal Interest-aware
Sequence Representation for Recommendation [61.45986275328629]
逐次レコメンデーションのためのマルチモーダル事前学習・転送学習フレームワークであるMISSRecを提案する。
ユーザ側ではトランスフォーマーベースのエンコーダデコーダモデルを設計し、コンテキストエンコーダがシーケンスレベルのマルチモーダルユーザ興味を捉えることを学習する。
候補項目側では,ユーザ適応項目表現を生成するために動的融合モジュールを採用する。
論文 参考訳(メタデータ) (2023-08-22T04:06:56Z) - Recommender Systems with Generative Retrieval [58.454606442670034]
本稿では,対象候補の識別子を自己回帰的に復号する新たな生成検索手法を提案する。
そのために、各項目のセマンティックIDとして機能するために、意味論的に意味のあるコードワードを作成します。
提案手法を用いて学習した推薦システムは,様々なデータセット上での現在のSOTAモデルよりも大幅に優れていることを示す。
論文 参考訳(メタデータ) (2023-05-08T21:48:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。