論文の概要: Implicit Reasoning for Large Language Model-based Generative Recommendation
- arxiv url: http://arxiv.org/abs/2606.14142v1
- Date: Fri, 12 Jun 2026 06:04:05 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-15 16:00:42.766019
- Title: Implicit Reasoning for Large Language Model-based Generative Recommendation
- Title(参考訳): 大規模言語モデルに基づく生成レコメンデーションのための命令推論
- Authors: Yinhan He, Liam Collins, Bhuvesh Kumar, Jundong Li, Neil Shah, Donald Loveland,
- Abstract要約: 大きな言語モデル(LLM)は、ジェネレーティブレコメンデーション(GR)のバックボーンとしてますます採用されている
GRのためにこの知識を確実に呼び出すことは 理解できない
GRに適した軽量な暗黙的推論パラダイムPauseRecを提案する。
- 参考スコア(独自算出の注目度): 58.39432342044054
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Large Language Models (LLMs) are increasingly adopted as backbones for Generative Recommendation (GR), promising access to pretrained world knowledge. Yet reliably invoking this knowledge for GR remains poorly understood. A key obstacle is that LLM-based GR typically represents items with Semantic IDs (SIDs), disrupting LLMs' natural-language reasoning interface because these tokens are unseen by the LLM during pretraining. Existing approaches address this with expensive multi-stage pipelines that ground SIDs and elicit explicit rationales, but offer limited insight into when and why each stage is necessary. In this work, we systematically decompose explicit reasoning training pipelines for LLM-based GR, revealing three key limitations: weakened world-knowledge verbalization, misalignment between SID and natural-language token embedding spaces, and sensitivity to rationale quality, all of which hurt explicit reasoning performance. To circumvent these issues, we propose PauseRec, a lightweight implicit reasoning paradigm tailored for GR. PauseRec is exceptionally practical, avoiding costly reasoning trace acquisition and reasoning alignment training, leading to a multitude of benefits: (1) it outperforms standard explicit CoT methods by up to 6.22%, (2) it reduces training cost by up to 65% GPU hours, and (3) it speeds up inference by up to 71.3%. These results position PauseRec as a lightweight alternative to explicit rationale generation, enabling more effective and efficient LLM-based GR.
- Abstract(参考訳): 大規模言語モデル(LLM)は、事前訓練された世界の知識へのアクセスを約束するジェネレーティブレコメンデーション(GR)のバックボーンとして、ますます採用されている。
しかし、GRのためにこの知識を確実に呼び出すことは、まだ理解されていない。
鍵となる障害は、LLMベースのGRが一般的にセマンティックID(SID)を持つアイテムを表現することである。
既存のアプローチでは、SIDを基盤として明確な論理を導き出す、高価なマルチステージパイプラインでこの問題に対処していますが、各ステージに必要なタイミングと理由について、限定的な洞察を提供しています。
本研究では,LLMに基づくGRのための明示的推論学習パイプラインを体系的に分解し,世界知識の言語化の弱化,SIDと自然言語トークンの埋め込み空間の整合性の相違,品質の合理化に対する感受性の3つの重要な制約を明らかにした。
これらの問題を回避するために,GRに適した暗黙的推論パラダイムであるPauseRecを提案する。
PauseRecは非常に実用的であり、トレース取得と推論アライメントトレーニングのコストを回避し、(1)標準のCoTメソッドを最大6.22%上回り、(2)トレーニングコストを最大65%削減し、(3)推論を最大71.3%高速化する。
これらの結果は、PauseRecを明示的合理生成の軽量な代替品として位置づけ、より効率的で効率的なLLMベースのGRを可能にした。
関連論文リスト
- Improving Implicit Discourse Relation Recognition with Natural Language Explanations from LLMs [6.696390269864987]
Implicit Discourse Relation Recognition (IDRR) は、深い意味理解を必要とするため、依然として困難な課題である。
大規模言語モデル(LLM)の最近の進歩は、深い言語理解と自然言語説明の生成において強力な推論能力を示している。
本稿では, LLMの推論能力を軽量IDRRモデルに抽出し, 性能と解釈性の両方を改善するための, 簡便かつ効果的な手法を提案する。
論文 参考訳(メタデータ) (2026-02-25T10:28:45Z) - Reinforced Latent Reasoning for LLM-based Recommendation [92.56166822197919]
大きな言語モデル(LLM)は、複雑な問題解決タスクにおいて印象的な推論能力を示している。
既存の手法は通常、明示的なチェーン・オブ・シント(CoT)データによる微調整に依存している。
本研究では, 明示的なCoT推論から, コンパクトで情報密度の高い潜伏推論へ移行する代替手法について検討する。
論文 参考訳(メタデータ) (2025-05-25T11:03:45Z) - GIVE: Structured Reasoning of Large Language Models with Knowledge Graph Inspired Veracity Extrapolation [108.2008975785364]
Graph Inspired Veracity Extrapolation (GIVE)は、パラメトリックメモリと非パラメトリックメモリを融合して、最小の外部入力で正確な推論を改善する新しい推論手法である。
GIVE は LLM エージェントをガイドして,最も関連する専門家データ (observe) を選択し,クエリ固有の発散思考 (reflect) に従事し,その情報を合成して最終的な出力 (speak) を生成する。
論文 参考訳(メタデータ) (2024-10-11T03:05:06Z) - FiDeLiS: Faithful Reasoning in Large Language Model for Knowledge Graph Question Answering [46.41364317172677]
大規模言語モデル(LLM)は、しばしば誤ったあるいは幻覚的な応答を生成することで挑戦される。
本稿では,知識グラフから得られた検証可能な推論ステップに回答を固定することで,LLM応答の事実性を改善するための統合フレームワークFiDeLiSを提案する。
トレーニング不要のフレームワークである本手法は,性能の向上だけでなく,異なるベンチマークにおける現実性や解釈可能性の向上にも寄与する。
論文 参考訳(メタデータ) (2024-05-22T17:56:53Z) - Rethinking with Retrieval: Faithful Large Language Model Inference [91.66406351103484]
我々は検索(RR)で再考する新しいポストプロセッシング手法を提案する。
RRは、チェーン・オブ・シークレット・プロンプトから得られた推論ステップに基づいて、関連する外部知識を検索する。
複雑な3つの推論課題に対する GPT-3 を用いた広範囲な実験により RR の有効性を評価する。
論文 参考訳(メタデータ) (2022-12-31T22:35:34Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。