論文の概要: HoloRec: Holistic Encoding and Interleaved Reasoning for Generative Recommendation
- arxiv url: http://arxiv.org/abs/2606.15331v1
- Date: Sat, 13 Jun 2026 14:52:03 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-16 16:21:33.364177
- Title: HoloRec: Holistic Encoding and Interleaved Reasoning for Generative Recommendation
- Title(参考訳): HoloRec: ジェネレーションレコメンデーションのためのホロスティックエンコーディングとインターリーブ推論
- Authors: Shuqi Zhao, Jingsong Su, Xiang Liu, Xingzhi Yao, Yiming Qiu, Huimu Wang, Liang Lin, Pengbo Mo, Mingming Li, Jiao Dai, Jizhong Han, Songlin Hu,
- Abstract要約: HoloRecは、表現、推論、生成を統一する内因性連鎖レコメンデーションメカニズムである。
複数のパブリックレコメンデーションデータセットの実験は、HoloRecがベースラインを一貫して上回っていることを示している。
- 参考スコア(独自算出の注目度): 57.802158017741824
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Generative recommendation models that formulate the task as sequence generation overcome the objective fragmentation problem of traditional cascade architectures, yet existing approaches still suffer from flat semantic representations lacking hierarchical structure for multi-step reasoning and an externally constructed chain-of-thought (CoT) that requires expensive annotations and remains disconnected from the generation objective. We propose HoloRec, an endogenous chain-of-thought recommendation mechanism that unifies representation, reasoning, and generation by constructing a hierarchical semantic encoding matrix via multi-granularity nested residual quantization optimized by a holistic reconstruction loss. HoloRec supports two inference modes: a non-thinking mode that uses lightweight multi-granularity supervised alignment for fast prediction, and a thinking mode that employs an interleaved reasoning scheme to generate CoT steps on the fly, directly embedding reasoning into the generation process without external data. Experiments on multiple public recommendation datasets demonstrate that HoloRec consistently outperforms baselines, with especially significant gains in sparse scenarios, and the thinking mode achieves better accuracy than the non-thinking mode with only modest inference overhead.
- Abstract(参考訳): シーケンス生成としてタスクを定式化する生成レコメンデーションモデルは、従来のカスケードアーキテクチャの客観的な断片化問題を克服するが、既存のアプローチは、多段階推論のための階層構造を持たないフラットな意味表現と、高価なアノテーションを必要とする外部構築されたチェーン・オブ・シント(CoT)に悩まされ、生成目的から切り離されている。
本稿では,多粒性ネスト型残留量子化による階層的意味的符号化行列の構築により,表現,推論,生成を統一する内在的チェーン・オブ・シント・レコメンデーション機構であるHoloRecを提案する。
HoloRecは2つの推論モードをサポートしている: 高速な予測のために軽量な多重粒度調整アライメントを使用する非思考モードと、インターリーブな推論スキームを使用して、その場でCoTステップを生成し、外部データなしで生成プロセスに推論を直接埋め込む思考モードである。
複数のパブリックレコメンデーションデータセットの実験では、HoloRecはベースラインを一貫して上回り、特にスパースシナリオでは顕著に向上し、思考モードは、控えめな推論オーバーヘッドしか持たない非思考モードよりも精度が高いことが示されている。
関連論文リスト
- DiffoR: A Unified Continuous Generative Framework for Universal Ordinal Regression [37.354096693649375]
正規回帰は、固有の順序でターゲット値を予測することを目的としている。
既存のパラダイムは、量子化アーティファクトとグローバルな順序的トポロジカルな知覚の欠如によって制約されている。
新たなパラダイムの下では,拡散モデルを用いて連続順序値の復元を行う統合フレームワークであるDiffORを導入する。
論文 参考訳(メタデータ) (2026-05-29T07:38:39Z) - Generative Recursive Reasoning [67.22973831501257]
Generative Recursive ReAsoning Models (GRAM) は、潜在的推論を確率論的多軌道に変換するフレームワークである。
GRAMは$p_(y mid x)$で条件推論をサポートし、固定または欠落した入力では$p_(x)$で条件生成を行う。
論文 参考訳(メタデータ) (2026-05-19T05:20:56Z) - Asymmetric Generative Recommendation via Multi-Expert Projection and Multi-Faceted Hierarchical Quantization [39.92412918837748]
AsymRecは、入力と出力の表現を分離する非対称な連続離散フレームワークである。
常に最先端のジェネレーティブ・レコメンデーターを平均15.8%上回っている。
論文 参考訳(メタデータ) (2026-05-14T07:55:43Z) - PLUME: Latent Reasoning Based Universal Multimodal Embedding [52.35354073629127]
ユニバーサルマルチモーダル埋め込み(UME)は、異種入力を単一のモデルで共有検索空間にマッピングする。
最近のアプローチでは、埋め込みを抽出する前に明確なチェーン・オブ・シント(CoT)論理を生成することにより、UMEを改善している。
PLUMEは,言語化されたCoTを連続的潜伏状態の短時間の自己回帰ロールアウトに置き換えることで,UMEを進化させる潜在的推論フレームワークである。
論文 参考訳(メタデータ) (2026-04-02T14:04:53Z) - Rethinking Generative Recommender Tokenizer: Recsys-Native Encoding and Semantic Quantization Beyond LLMs [17.944727019161878]
ReSIDは、情報保存とシーケンシャルな予測可能性の観点から学ぶことを推奨する、原則化されたSIDフレームワークである。
高いシーケンシャルおよびSIDベースの生成ベースラインを平均10%以上上回り、トークン化コストを最大122倍削減する。
論文 参考訳(メタデータ) (2026-02-02T17:00:04Z) - PRISM: Purified Representation and Integrated Semantic Modeling for Generative Sequential Recommendation [28.629759086187352]
本稿では,PRISMとPureified RepresentationとIntegrated Semantic Modelingを組み合わせた新しい生成レコメンデーションフレームワークを提案する。
PRISMは4つの実世界のデータセットで、最先端のベースラインを一貫して上回る。
論文 参考訳(メタデータ) (2026-01-23T08:50:16Z) - READER: Retrieval-Assisted Drafter for Efficient LLM Inference [0.0386965802948046]
自己回帰言語モデルはトークンシーケンスよりも分解された確率をインスタンス化するが、その厳密なシーケンシャルなデコーディングプロセスは、遅延推論に固有の低いバウンドを課す。
このボトルネックは、大規模生成モデルのスケーラブルなデプロイにおける中心的な障害として現れています。
本稿では,補助的ドラフトモデルのトレーニングを回避した投機的復号化フレームワークREADERを提案する。
論文 参考訳(メタデータ) (2025-08-12T16:47:48Z) - Constrained Auto-Regressive Decoding Constrains Generative Retrieval [71.71161220261655]
ジェネレーティブ検索は、従来の検索インデックスデータ構造を1つの大規模ニューラルネットワークに置き換えようとしている。
本稿では,制約とビームサーチという2つの本質的な視点から,制約付き自己回帰生成の固有の制約について検討する。
論文 参考訳(メタデータ) (2025-04-14T06:54:49Z) - Conditional Denoising Diffusion for Sequential Recommendation [62.127862728308045]
GAN(Generative Adversarial Networks)とVAE(VAE)の2つの顕著な生成モデル
GANは不安定な最適化に苦しむ一方、VAEは後続の崩壊と過度に平らな世代である。
本稿では,シーケンスエンコーダ,クロスアテンティブデノナイジングデコーダ,ステップワイズディフューザを含む条件付きデノナイジング拡散モデルを提案する。
論文 参考訳(メタデータ) (2023-04-22T15:32:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。