論文の概要: ChainRec: An Agentic Recommender Learning to Route Tool Chains for Diverse and Evolving Interests
- arxiv url: http://arxiv.org/abs/2602.10490v1
- Date: Wed, 11 Feb 2026 03:50:36 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-12 21:44:01.441383
- Title: ChainRec: An Agentic Recommender Learning to Route Tool Chains for Diverse and Evolving Interests
- Title(参考訳): ChainRec: さまざまな利害関係者のためのツールチェーンをルートするエージェントレコメンダ学習
- Authors: Fuchun Li, Qian Li, Xingyu Gao, Bocheng Pan, Yang Wu, Jun Zhang, Huan Yu, Jie Jiang, Jinsheng Xiao, Hailong Shi,
- Abstract要約: ChainRecはエージェントレコメンデータで、プランナーを使用して推論ツールを動的に選択する。
AgentRecBenchをAmazon、Yelp、Goodreadsで実験したところ、ChainRecは強力なベースラインよりも一貫してAvg HR@1,3,5を改善している。
- 参考スコア(独自算出の注目度): 28.077112874506934
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Large language models (LLMs) are increasingly integrated into recommender systems, motivating recent interest in agentic and reasoning-based recommendation. However, most existing approaches still rely on fixed workflows, applying the same reasoning procedure across diverse recommendation scenarios. In practice, user contexts vary substantially-for example, in cold-start settings or during interest shifts, so an agent should adaptively decide what evidence to gather next rather than following a scripted process. To address this, we propose ChainRec, an agentic recommender that uses a planner to dynamically select reasoning tools. ChainRec builds a standardized Tool Agent Library from expert trajectories. It then trains a planner using supervised fine-tuning and preference optimization to dynamically select tools, decide their order, and determine when to stop. Experiments on AgentRecBench across Amazon, Yelp, and Goodreads show that ChainRec consistently improves Avg HR@{1,3,5} over strong baselines, with especially notable gains in cold-start and evolving-interest scenarios. Ablation studies further validate the importance of tool standardization and preference-optimized planning.
- Abstract(参考訳): 大規模言語モデル(LLM)はますますレコメンデーションシステムに統合され、エージェントや推論に基づくリコメンデーションへの関心が高まっている。
しかし、既存のほとんどのアプローチは固定されたワークフローに依存しており、様々なレコメンデーションシナリオで同じ推論手順を適用している。
実際には、ユーザコンテキストは、例えば、コールドスタート設定や利子シフトにおいて大きく異なるため、エージェントはスクリプト化されたプロセスに従うのではなく、次に収集すべき証拠を適応的に決定する必要がある。
この問題を解決するために、我々は、プランナーを使って推論ツールを動的に選択するエージェントレコメンデータChainRecを提案する。
ChainRecは専門家の軌跡から標準化されたツールエージェントライブラリを構築している。
次に、教師付き微調整と選好最適化を使用してプランナーを訓練し、動的にツールを選択し、順番を決め、いつ停止するかを決定する。
AgentRecBenchをAmazon、Yelp、Goodreadsで行った実験によると、ChainRecは強力なベースラインよりも一貫してAvg HR@{1,3,5}を改善しており、特にコールドスタートと進化する関心のあるシナリオで顕著に伸びている。
アブレーション研究は、ツール標準化と優先順位最適化計画の重要性をさらに検証している。
関連論文リスト
- RecNet: Self-Evolving Preference Propagation for Agentic Recommender Systems [109.9061591263748]
RecNetは、レコメンデータシステムのための自己進化的な好みの伝達フレームワークである。
関連ユーザやアイテム間で、リアルタイムの好み更新を積極的に伝達する。
逆相では、フィードバック駆動の伝搬最適化機構がマルチエージェント強化学習フレームワークをシミュレートする。
論文 参考訳(メタデータ) (2026-01-29T12:14:31Z) - AgentRecBench: Benchmarking LLM Agent-based Personalized Recommender Systems [17.329692234349768]
エージェントレコメンデータシステムはLarge Language Models (LLM)を利用している
LLMの高度な推論とロールプレイング能力は、自律的で適応的な意思決定を可能にする。
この分野では、これらの手法を評価するための標準化された評価プロトコルが欠けている。
論文 参考訳(メタデータ) (2025-05-26T07:45:11Z) - R$^2$ec: Towards Large Recommender Models with Reasoning [59.32598867813266]
R$2$ecは、本質的な推論能力を持つ統一された大型レコメンデータモデルである。
R$2$ecは、推論チェーン生成と効率的なアイテム予測の両方を単一のモデルでサポートするデュアルヘッドアーキテクチャを導入している。
注釈付き推論データの欠如を克服するため、強化学習フレームワークであるRecPOを設計する。
論文 参考訳(メタデータ) (2025-05-22T17:55:43Z) - ThinkRec: Thinking-based recommendation via LLM [19.398302729633397]
ThinkRec は LLM4Rec を System 1 から System 2 (レーショナルシステム) に移行する思考ベースのフレームワークである。
ThinkRecは、キーワードの要約でアイテムメタデータを拡張し、合成推論トレースを注入するシンクアクティベーションメカニズムを導入している。
ThinkRecは、ユーザの潜在機能に基づいて専門家モデルに重みを動的に割り当てることで、個々のユーザへの推論パスを適応させ、精度とパーソナライゼーションを向上させる。
論文 参考訳(メタデータ) (2025-05-21T04:25:18Z) - Preference Diffusion for Recommendation [50.8692409346126]
DMベースのレコメンデータに適した最適化対象であるPreferDiffを提案する。
PreferDiffは、BPRをログライクなランキング目標に変換することで、ユーザの好みをよりよく把握する。
これはDMベースのレコメンデーション向けに特別に設計された、パーソナライズされたランキングの損失である。
論文 参考訳(メタデータ) (2024-10-17T01:02:04Z) - On Generative Agents in Recommendation [58.42840923200071]
Agent4Recは、Large Language Modelsに基づいたレコメンデーションのユーザーシミュレータである。
各エージェントは、ページ単位でパーソナライズされた推奨モデルと対話する。
論文 参考訳(メタデータ) (2023-10-16T06:41:16Z) - MISSRec: Pre-training and Transferring Multi-modal Interest-aware
Sequence Representation for Recommendation [61.45986275328629]
逐次レコメンデーションのためのマルチモーダル事前学習・転送学習フレームワークであるMISSRecを提案する。
ユーザ側ではトランスフォーマーベースのエンコーダデコーダモデルを設計し、コンテキストエンコーダがシーケンスレベルのマルチモーダルユーザ興味を捉えることを学習する。
候補項目側では,ユーザ適応項目表現を生成するために動的融合モジュールを採用する。
論文 参考訳(メタデータ) (2023-08-22T04:06:56Z) - Meta-Wrapper: Differentiable Wrapping Operator for User Interest
Selection in CTR Prediction [97.99938802797377]
クリックスルー率(CTR)予測は、ユーザーが商品をクリックする確率を予測することを目的としており、リコメンデーションシステムにおいてますます重要になっている。
近年,ユーザの行動からユーザの興味を自動的に抽出する深層学習モデルが大きな成功を収めている。
そこで我々は,メタラッパー(Meta-Wrapper)と呼ばれるラッパー手法の枠組みに基づく新しい手法を提案する。
論文 参考訳(メタデータ) (2022-06-28T03:28:15Z) - Adaptive Sampling using POMDPs with Domain-Specific Considerations [9.670635276589248]
適応サンプリング問題に対するモンテカルロ木探索に基づく解法の改良について検討する。
本稿では,ロールアウトアロケーション,アクション探索アルゴリズム,計画コミットメントの改善を提案する。
一つの計画木から取られたアクションの数を増やすことにより,ロールアウト回数を大幅に削減できることを示す。
論文 参考訳(メタデータ) (2021-09-23T19:00:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。