論文の概要: RRCM: Ranking-Driven Retrieval over Collaborative and Meta Memories for LLM Recommendation
- arxiv url: http://arxiv.org/abs/2605.07129v1
- Date: Fri, 08 May 2026 02:07:30 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-11 19:43:38.737717
- Title: RRCM: Ranking-Driven Retrieval over Collaborative and Meta Memories for LLM Recommendation
- Title(参考訳): RRCM:LLMレコメンデーションのためのコラボレーションとメタメモリのランキング駆動検索
- Authors: Shijun Li, Wooseong Yang, Yu Wang, Tianxin Wei, Joydeep Ghosh,
- Abstract要約: 大規模言語モデル(LLM)は、次世代のレコメンデーションシステムにとって有望なパラダイムとして登場した。
LLMに基づくエージェントレコメンデーションのためのランキング駆動型検索・推論フレームワークRRCMを提案する。
- 参考スコア(独自算出の注目度): 14.301653810918713
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Large Language Models (LLMs) have emerged as a promising paradigm for next-generation recommender systems, offering strong semantic understanding and natural-language reasoning abilities. Despite recent progress, current LLM-based recommenders still face key challenges in constructing decision-relevant contexts from heterogeneous evidence. First, existing methods often rely on fixed context construction strategies: collaborative behavioral evidence and item-side metadata are typically incorporated through predefined prompts, static retrieval pipelines, or handcrafted injection mechanisms, making it difficult to determine what information is truly beneficial for each instance. Second, heterogeneous evidence introduces a severe context-efficiency bottleneck. Rich metadata and collaborative interaction records can quickly overwhelm the context window, while aggressive compression or heuristic filtering may discard fine-grained evidence critical for accurate recommendation. To address these challenges, we propose RRCM, a ranking-driven retrieval-and-reasoning framework over collaborative and metadata memories for LLM-based agentic recommendation. RRCM starts from a lightweight user-history context and learns whether to recommend directly, retrieve collaborative evidence, retrieve item metadata, or interleave both through reasoning. Both memories are represented in natural language and accessed through a unified retrieval interface, enabling flexible evidence acquisition without handcrafted CF injection or fixed retrieval rules. We optimize this memory-reading policy with an outcome-only ranking reward, instantiated using group relative policy optimization, so that retrieval decisions are directly driven by final top-k recommendation quality. Extensive experiments show that RRCM significantly outperforms traditional baselines and diverse LLM-based recommendation approaches.
- Abstract(参考訳): 大規模言語モデル(LLM)は、強力な意味理解と自然言語推論能力を提供する次世代レコメンデータシステムにとって有望なパラダイムとして登場した。
近年の進歩にもかかわらず、現在のLLMベースのレコメンデータは、異種証拠から意思決定関連コンテキストを構築する上で重要な課題に直面している。
協調的な振る舞いのエビデンスとアイテム側のメタデータは通常、事前に定義されたプロンプトや静的なパイプライン、手作りのインジェクションメカニズムを通じて組み込まれます。
第二に、異質な証拠は厳しい文脈効果のボトルネックをもたらす。
リッチなメタデータと協調的な相互作用記録は、文脈の窓を素早く圧倒し、攻撃的な圧縮やヒューリスティックなフィルタリングは、正確な推奨のために重要なきめ細かい証拠を捨てる可能性がある。
これらの課題に対処するために,LLMに基づくエージェント推奨のための協調記憶とメタデータ記憶を用いたランキング駆動型検索・推論フレームワークRRCMを提案する。
RRCMは、軽量なユーザ履歴コンテキストから始まり、直接推奨するか、協力的なエビデンスを検索するか、アイテムメタデータを検索するか、推論を通じて両方をインターリーブするかを学ぶ。
どちらの記憶も自然言語で表現され、統一された検索インタフェースを通じてアクセスされ、手作りのCF注入や固定された検索規則なしで柔軟なエビデンスを取得することができる。
我々は、グループ相対ポリシー最適化を用いて、結果のみのランキング報酬で、このメモリ読み込みポリシーを最適化し、検索決定が最終トップk推奨品質によって直接駆動されるようにした。
大規模な実験により、RRCMは従来のベースラインと多様なLLMベースのレコメンデーションアプローチを著しく上回っていることが示された。
関連論文リスト
- Retrieval Augmented Conversational Recommendation with Reinforcement Learning [43.40183980321253]
大規模言語モデル(LLM)は、言語理解と生成の強化された能力を示す。
本稿では,新たな2段階検索拡張会話推薦フレームワークであるRARを紹介する。
論文 参考訳(メタデータ) (2026-04-06T06:08:03Z) - Give Users the Wheel: Towards Promptable Recommendation Paradigm [21.39017335979666]
Decoupled Promptable Sequential Recommendation (DPR)は、従来のシーケンシャルバックボーンにPromptable Recommendationをサポートするためのモデルに依存しないフレームワークである。
DPRは、潜在ユーザ表現を検索空間内で直接変調する。
プロンプト誘導タスクにおいて、最先端のベースラインを著しく上回る。
論文 参考訳(メタデータ) (2026-02-21T18:41:28Z) - M-RAG: Making RAG Faster, Stronger, and More Efficient [15.147969102210759]
大規模言語モデルのための新しいチャンクフリー検索戦略であるM-RAGを提案する。
M-RAGは構造化されたk-v分解メタマーカーを軽量で意図に整合した検索キーで抽出する。
M-RAGは高い効率で解答フレンドリーな証拠を回収できることを示す。
論文 参考訳(メタデータ) (2026-01-06T15:14:54Z) - Rethinking On-policy Optimization for Query Augmentation [49.87723664806526]
本稿では,様々なベンチマークにおいて,プロンプトベースとRLベースのクエリ拡張の最初の体系的比較を示す。
そこで我々は,検索性能を最大化する擬似文書の生成を学習する,新しいハイブリッド手法 On-policy Pseudo-document Query Expansion (OPQE) を提案する。
論文 参考訳(メタデータ) (2025-10-20T04:16:28Z) - Towards Context-aware Reasoning-enhanced Generative Searching in E-commerce [61.03081096959132]
そこで本稿では,複雑な状況下でのテキストバウンダリングを改善するための,文脈対応推論強化型生成検索フレームワークを提案する。
提案手法は,強力なベースラインに比べて優れた性能を示し,検索に基づく推薦の有効性を検証した。
論文 参考訳(メタデータ) (2025-10-19T16:46:11Z) - Improving Context Fidelity via Native Retrieval-Augmented Reasoning [35.50952279309109]
大規模言語モデル(LLM)は、しばしば文脈の忠実さと闘い、提供された情報に基づいて質問に答えるときに矛盾する答えを生み出す。
提案するCAREは, LLMに対して, モデル独自の検索機能を用いて, 推論プロセス内での文脈内証拠を明示的に統合するように教える, 新たなネイティブ検索拡張推論フレームワークである。
提案手法では,限定ラベル付きエビデンスデータが必要であり,推論チェーン内の戦略的に検索されたインコンテキストトークンを通じて,検索精度と回答生成性能を著しく向上させる。
論文 参考訳(メタデータ) (2025-09-17T04:28:07Z) - Lightweight and Direct Document Relevance Optimization for Generative Information Retrieval [49.669503570350166]
生成情報検索(GenIR)は、文書識別子(ドシデント)生成タスクとして文書検索を定式化する有望なニューラル検索パラダイムである。
既存のGenIRモデルはトークンレベルのミスアライメントに悩まされており、次のトークンを予測するためにトレーニングされたモデルは、ドキュメントレベルの関連性を効果的にキャプチャできないことが多い。
本稿では,トークンレベルのドシデント生成と文書レベルのドシデンス推定をペアのランク付けによる直接最適化により整合するダイレクトドキュメントレバレンス最適化(DDRO)を提案する。
論文 参考訳(メタデータ) (2025-04-07T15:27:37Z) - Synergistic Interplay between Search and Large Language Models for
Information Retrieval [141.18083677333848]
InteRにより、RMはLLM生成した知識コレクションを使用してクエリの知識を拡張することができる。
InteRは、最先端手法と比較して総合的に優れたゼロショット検索性能を実現する。
論文 参考訳(メタデータ) (2023-05-12T11:58:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。