論文の概要: Reasoning-guided Collaborative Filtering with Language Models for Explainable Recommendation
- arxiv url: http://arxiv.org/abs/2602.05544v1
- Date: Thu, 05 Feb 2026 11:05:09 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-06 18:49:08.898322
- Title: Reasoning-guided Collaborative Filtering with Language Models for Explainable Recommendation
- Title(参考訳): 説明可能なレコメンデーションのための言語モデルを用いた推論誘導協調フィルタリング
- Authors: Fahad Anwaar, Adil Mehmood Khan, Muhammad Khalid, Usman Zia, Kezhi Wang,
- Abstract要約: RGCF-XRecは、推論誘導協調フィルタリング(CF)の知識を言語モデルに導入し、シーケンシャルなレコメンデーションを提供するハイブリッドフレームワークである。
Amazonのデータセット、Sports、Toys、Beautyで、642,503のユーザ-itemインタラクションを含む一貫した改善が示されている。
コールド・ウォーム・パフォーマンスのギャップを減らし、コールド・スタートで14.5%、ウォーム・スタートのシナリオで11.9%となる。
- 参考スコア(独自算出の注目度): 11.176352617829481
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Large Language Models (LLMs) exhibit potential for explainable recommendation systems but overlook collaborative signals, while prevailing methods treat recommendation and explanation as separate tasks, resulting in a memory footprint. We present RGCF-XRec, a hybrid framework that introduces reasoning-guided collaborative filtering (CF) knowledge into a language model to deliver explainable sequential recommendations in a single step. Theoretical grounding and empirical findings reveal that RGCF-XRec offers three key merits over leading CF-aware LLM-based methods: (1) reasoning-guided augmentation of CF knowledge through contextual prompting to discover latent preferences and interpretable reasoning paths; (2) an efficient scoring mechanism based on four dimensions: coherence, completeness, relevance, and consistency to mitigate noisy CF reasoning traces and retain high-quality explanations; (3) a unified representation learning network that encodes collaborative and semantic signals, enabling a structured prompt to condition the LLM for explainable sequential recommendation. RGCF-XRec demonstrates consistent improvements across Amazon datasets, Sports, Toys, and Beauty, comprising 642,503 user-item interactions. It improves HR@10 by 7.38\% in Sports and 4.59\% in Toys, along with ROUGE-L by 8.02\% and 3.49\%, respectively. It reduces the cold warm performance gap, achieving overall gains of 14.5\% in cold-start and 11.9\% in warm start scenarios, and enhances zero-shot HR@5 by 18.54\% in Beauty and 23.16\% in Toys, highlighting effective generalization and robustness. Moreover, RGCF-XRec achieves training efficiency with a lightweight LLaMA 3.2-3B backbone, ensuring scalability for real-world applications.
- Abstract(参考訳): 大きな言語モデル(LLM)は、説明可能なレコメンデーションシステムの可能性を示しているが、協調的なシグナルを見落としている。
RGCF-XRecは、推論誘導協調フィルタリング(CF)の知識を言語モデルに導入し、説明可能なシーケンシャルなレコメンデーションを単一のステップで提供するハイブリッドフレームワークである。
RGCF-XRecは,1)遅延選好や解釈可能な推論経路を発見するための文脈的刺激によるCF知識の推論誘導強化,2)コヒーレンス,完全性,妥当性,一貫性の4次元に基づく効率的な評価機構により,ノイズの多いCF推論のトレースを緩和し,高品質な説明を保持すること,(3)協調的および意味的な信号をエンコードする統一表現学習ネットワークにより,LCMに説明可能なシーケンシャルレコメンデーションを条件付けることができる。
RGCF-XRecはAmazonのデータセット、Sports、Toys、Beautyで一貫した改善を示し、642,503のユーザ-テムインタラクションで構成されている。
HR@10はスポーツでは7.38.%、トイでは4.59.%、ROUGE-Lは8.02.%、ROUGE-Lは3.49.%である。
コールド・ウォーム・パフォーマンスのギャップを減らし、コールド・スタートで14.5\%、ウォーム・スタート・シナリオで1.9\%、ゼロショットのHR@5を18.54\%、トイズで23.16\%、効果的な一般化とロバスト性を強調した。
さらに、RGCF-XRecは軽量のLLaMA 3.2-3Bバックボーンでトレーニング効率を向上し、現実世界のアプリケーションのスケーラビリティを確保する。
関連論文リスト
- RPO-RAG: Aligning Small LLMs with Relation-aware Preference Optimization for Knowledge Graph Question Answering [5.044093798902163]
RPO-RAGはKGベースのRAGフレームワークで、小型言語モデル用に設計された。
RPO-RAGは、情報監督信号を提供するクエリパスセマンティックサンプリング戦略を導入する。
KGQA(Knowledge Graph Question Answering)データセットの2つのベンチマークに関する大規模な実験は、RPO-RAGが小規模言語モデルと大規模言語モデルのパフォーマンスギャップを効果的に埋めることを示した。
論文 参考訳(メタデータ) (2026-01-27T05:46:32Z) - PaTaRM: Bridging Pairwise and Pointwise Signals via Preference-Aware Task-Adaptive Reward Modeling [19.258007121955924]
Preference-Aware Task-Aware Reward Model (PaTaRM) は、Rest-Aware rewardメカニズムと動的ルーリック適応を統合した統合フレームワークである。
PaTaRMは、IFEvalとInFoBenchベンチマークで平均13.6%改善され、下流RLHFのパフォーマンスが向上する。
論文 参考訳(メタデータ) (2025-10-28T09:43:47Z) - Teaching Language Models to Reason with Tools [73.21700643314917]
emphHint-Engineeringは、推論経路内の最適点に様々なヒントを戦略的に注入する新しいデータ合成戦略である。
CoRTは効率を大幅に向上させ、32Bモデルのトークン使用量を約30%削減し、1.5Bモデルのトークン使用量を50%削減した。
論文 参考訳(メタデータ) (2025-10-23T08:41:44Z) - LENS: Learning to Segment Anything with Unified Reinforced Reasoning [38.582392908238866]
LENSは拡張性のある強化学習フレームワークで、推論プロセスとセグメンテーションをエンドツーエンドで共同で最適化する。
LENSはRefCOCO、RefCOCO+、RefCOCOgのベンチマークで平均81.2%のcIoUを達成し、GLaMMという強力な微調整法を最大5.6%上回っている。
論文 参考訳(メタデータ) (2025-08-19T17:59:53Z) - Ring-lite: Scalable Reasoning via C3PO-Stabilized Reinforcement Learning for LLMs [51.21041884010009]
Ring-liteは、強化学習(RL)により最適化されたMixture-of-Experts(MoE)ベースの大規模言語モデルである
我々のアプローチは、挑戦的なベンチマーク上でのSOTA(State-of-the-art)の小規模推論モデルの性能と一致する。
論文 参考訳(メタデータ) (2025-06-17T17:12:34Z) - EfficientLLM: Efficiency in Large Language Models [64.3537131208038]
大規模言語モデル(LLM)は大きな進歩を導いてきたが、その増加とコンテキストウィンドウは計算、エネルギー、金銭的コストを禁止している。
本稿では,新しいベンチマークであるEfficientLLMを紹介する。
論文 参考訳(メタデータ) (2025-05-20T02:27:08Z) - Federated Fine-Tuning of LLMs: Framework Comparison and Research Directions [59.5243730853157]
Federated Learning(FL)は、分散プライベートデータセットを使用して、トレーニング済みの大規模言語モデル(LLM)を微調整するための、プライバシ保護ソリューションを提供する。
本稿では、知識蒸留(KD)とスプリットラーニング(SL)を統合し、これらの問題を緩和する3つの先進的連合LLM(FedLLM)フレームワークの比較分析を行う。
論文 参考訳(メタデータ) (2025-01-08T11:37:06Z) - Advancing LLM Reasoning Generalists with Preference Trees [119.57169648859707]
推論に最適化された大規模言語モデル(LLM)のスイートであるEulusを紹介する。
Eurusモデルは、様々なベンチマークでオープンソースのモデルの間で最先端の結果を得る。
論文 参考訳(メタデータ) (2024-04-02T16:25:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。