論文の概要: Intent-Guided Reasoning for Sequential Recommendation
- arxiv url: http://arxiv.org/abs/2512.14034v1
- Date: Tue, 16 Dec 2025 03:00:32 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-17 16:49:26.560287
- Title: Intent-Guided Reasoning for Sequential Recommendation
- Title(参考訳): シークエンシャルレコメンデーションのためのインテントガイド推論
- Authors: Yifan Shao, Peilin Zhou,
- Abstract要約: Intent-Guided Reasoning framework for Sequential Recommendationを提案する。
IGR-SRは、明確に抽出された高レベルインテントの推論プロセスをアンカーする。
実験によると、IGR-SRは最先端のベースラインよりも平均7.13%改善している。
- 参考スコア(独自算出の注目度): 8.76365815094262
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Sequential recommendation systems aim to capture users' evolving preferences from their interaction histories. Recent reasoningenhanced methods have shown promise by introducing deliberate, chain-of-thought-like processes with intermediate reasoning steps. However, these methods rely solely on the next target item as supervision, leading to two critical issues: (1) reasoning instability--the process becomes overly sensitive to recent behaviors and spurious interactions like accidental clicks, and (2) surface-level reasoning--the model memorizes item-to-item transitions rather than understanding intrinsic behavior patterns. To address these challenges, we propose IGR-SR, an Intent-Guided Reasoning framework for Sequential Recommendation that anchors the reasoning process to explicitly extracted high-level intents. Our framework comprises three key components: (1) a Latent Intent Distiller (LID) that efficiently extracts multi-faceted intents using a frozen encoder with learnable tokens, (2) an Intent-aware Deliberative Reasoner (IDR) that decouples reasoning into intent deliberation and decision-making via a dual-attention architecture, and (3) an Intent Consistency Regularization (ICR) that ensures robustness by enforcing consistent representations across different intent views. Extensive experiments on three public datasets demonstrate that IGR-SR achieves an average 7.13% improvement over state-of-the-art baselines. Critically, under 20% behavioral noise, IGR-SR degrades only 10.4% compared to 16.2% and 18.6% for competing methods, validating the effectiveness and robustness of intent-guided reasoning.
- Abstract(参考訳): 逐次レコメンデーションシステムは,インタラクション履歴からユーザの進化する好みを捉えることを目的としている。
最近の推論手法は、思考の連鎖のようなプロセスと中間的推論ステップを導入することで、将来性を示している。
しかし、これらの手法は次の対象項目のみを監督として頼りにしており、(1)不安定性の推論-プロセスは最近の行動に過度に敏感になり、そして(2)表面レベルでの推論-モデルは本質的な行動パターンを理解するのではなく、アイテム間遷移を記憶する。
これらの課題に対処するために、シークエンシャルレコメンデーションのためのIntent-Guided ReasoningフレームワークであるIGR-SRを提案する。
本フレームワークは,(1)凍結エンコーダと学習可能なトークンを用いた多面的インテントを効率的に抽出する潜入型ディレクタ(LID),(2)二重アテンションアーキテクチャによる推論と意思決定を分離するIDR(Intent-aware Deliberative Reasoner),(3)異なるインテントビューに対して一貫性のある表現を強制することによる堅牢性を保証するICR(Intent Consistency Regularization)の3つの重要なコンポーネントから構成される。
3つの公開データセットに対する大規模な実験は、IGR-SRが最先端のベースラインよりも平均7.13%改善していることを示している。
臨界的には、20%の行動ノイズの下では、IGR-SRは競合する手法の16.2%と18.6%と比較して10.4%しか分解せず、意図誘導推論の有効性と堅牢性を検証する。
関連論文リスト
- DTRec: Learning Dynamic Reasoning Trajectories for Sequential Recommendation [19.181171482637513]
DTRecは,シークエンシャルレコメンデーションのための動的推論軌道を,方向と深さの両方に沿って探索する,新規かつ効果的なフレームワークである。
この方向を導くために,人間の認知過程の自然な,進歩的な洗練をエミュレートする粗大な監督信号を提供する階層的プロセススーパービジョン(HPS)を開発した。
この深さを最適化するために,3つの指標を共同で監視することにより,推論ステップの数を動的に調整するアダプティブ・推論・ハルティング(ARH)機構を導入する。
論文 参考訳(メタデータ) (2025-12-16T03:04:43Z) - Generative Reasoning Recommendation via LLMs [48.45009951684554]
大規模言語モデル(LLM)は、生成的推論レコメンデーションモデル(GRRM)として機能する上で、根本的な課題に直面している。
本研究は,レコメンデーションタスクに対する統一的な理解・推論・予測方法を実現する,事前学習されたLLMを適用してGRRMを構築する方法について検討する。
本稿では,協調的セマンティックアライメント(Collaborative-Semantic Alignment),Reasoning Curriculum Activation(Reasoning Curriculum Activation),Sparse-Regularized Group Policy Optimization(Sparse-Regularized Group Policy Optimization)の3つのコンポーネントを統合するエンドツーエンドフレームワークであるGREAMを提案する。
論文 参考訳(メタデータ) (2025-10-23T17:59:31Z) - ConciseHint: Boosting Efficient Reasoning via Continuous Concise Hints during Generation [74.37307916314407]
提案するフレームワークはConciseHintと呼ばれ,推論モデルが簡潔に話すことを継続的に奨励する。
DeepSeek-R1 および Qwen-3 シリーズを含む最先端の LRM 実験により,本手法が簡潔な推論を効果的に生成できることが実証された。
論文 参考訳(メタデータ) (2025-06-23T16:20:44Z) - Retrieval is Not Enough: Enhancing RAG Reasoning through Test-Time Critique and Optimization [58.390885294401066]
Retrieval-augmented Generation (RAG) は知識基底型大規模言語モデル(LLM)を実現するためのパラダイムとして広く採用されている。
RAGパイプラインは、モデル推論が得られた証拠と整合性を維持するのに失敗することが多く、事実上の矛盾や否定的な結論につながる。
批判駆動アライメント(CDA)に基づく新しい反復的枠組みであるAlignRAGを提案する。
AlignRAG-autoは、動的に洗練を終了し、批判的な反復回数を事前に指定する必要がなくなる自律的な変種である。
論文 参考訳(メタデータ) (2025-04-21T04:56:47Z) - Coarse-to-Fine Process Reward Modeling for Mathematical Reasoning [20.686094849756937]
プロセス・リワード・モデル (Process Reward Model, PRM) は数学的推論において重要な役割を担い、高品質なプロセスデータを必要とする。
我々は,Large Language Models (LLM) が生成する推論ステップが,厳密なインクリメンタルな情報表示に失敗することが多く,冗長性が生じることを観察する。
本稿では,冗長なステップを検出するための簡易かつ効果的な粗大な戦略CFPRMを提案する。
論文 参考訳(メタデータ) (2025-01-23T12:44:45Z) - Ladder-of-Thought: Using Knowledge as Steps to Elevate Stance Detection [73.31406286956535]
姿勢検出タスクにLadder-of-Thought(LoT)を導入する。
LoTは、小さなLMに高品質な外部知識を同化させ、生成した中間的論理を精査するように指示する。
実験では, 姿勢検出タスクにおけるCoTのGPT-3.5よりも16%改善し, 10%向上した。
論文 参考訳(メタデータ) (2023-08-31T14:31:48Z) - Intent Contrastive Learning for Sequential Recommendation [86.54439927038968]
ユーザの意図を表現するために潜伏変数を導入し,クラスタリングにより潜伏変数の分布関数を学習する。
我々は,学習意図を対照的なSSLによってSRモデルに活用し,シーケンスのビューとそれに対応するインテントとの一致を最大化することを提案する。
4つの実世界のデータセットで実施された実験は、提案した学習パラダイムの優位性を示している。
論文 参考訳(メタデータ) (2022-02-05T09:24:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。