論文の概要: Unlocking the Power of Diffusion Models in Sequential Recommendation: A Simple and Effective Approach
- arxiv url: http://arxiv.org/abs/2505.19544v1
- Date: Mon, 26 May 2025 06:05:29 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-27 16:58:43.199748
- Title: Unlocking the Power of Diffusion Models in Sequential Recommendation: A Simple and Effective Approach
- Title(参考訳): 逐次レコメンデーションにおける拡散モデルの力を解き放つ:単純かつ効果的なアプローチ
- Authors: Jialei Chen, Yuanbo Xu, Yiheng Jiang,
- Abstract要約: 逐次レコメンデーションモデルに埋没崩壊を緩和する革新的なフレームワークであるADRecを提案する。
ADRecはトークンレベルの拡散を通じてトークン単位の分散をモデル化しながら、自動回帰を通じてトークン間依存性をキャプチャする。
推論中、ADRecは最後のトークンのみにデノナイジングプロセスを適用し、歴史的相互作用における意味のあるパターンが保存されることを保証する。
- 参考スコア(独自算出の注目度): 4.009940697668741
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: In this paper, we focus on the often-overlooked issue of embedding collapse in existing diffusion-based sequential recommendation models and propose ADRec, an innovative framework designed to mitigate this problem. Diverging from previous diffusion-based methods, ADRec applies an independent noise process to each token and performs diffusion across the entire target sequence during training. ADRec captures token interdependency through auto-regression while modeling per-token distributions through token-level diffusion. This dual approach enables the model to effectively capture both sequence dynamics and item representations, overcoming the limitations of existing methods. To further mitigate embedding collapse, we propose a three-stage training strategy: (1) pre-training the embedding weights, (2) aligning these weights with the ADRec backbone, and (3) fine-tuning the model. During inference, ADRec applies the denoising process only to the last token, ensuring that the meaningful patterns in historical interactions are preserved. Our comprehensive empirical evaluation across six datasets underscores the effectiveness of ADRec in enhancing both the accuracy and efficiency of diffusion-based sequential recommendation systems.
- Abstract(参考訳): 本稿では、既存の拡散型シーケンシャルレコメンデーションモデルに崩壊を埋め込むことがしばしば見過ごされる問題に焦点を当て、この問題を軽減するために設計された革新的なフレームワークであるADRecを提案する。
従来の拡散に基づく手法とは違い、ADRecは各トークンに独立したノイズ処理を適用し、トレーニング中にターゲットシーケンス全体にわたって拡散を行う。
ADRecはトークンレベルの拡散を通じてトークン単位の分散をモデル化しながら、自動回帰を通じてトークン間依存性をキャプチャする。
この2つのアプローチは、既存のメソッドの制限を克服して、シーケンスの動的性とアイテム表現の両方を効果的にキャプチャすることを可能にする。
埋込み崩壊を緩和するために,(1)埋込重量の事前訓練,(2)これら重量のADRecバックボーンとの整合,(3)微調整という3段階のトレーニング戦略を提案する。
推論中、ADRecは最後のトークンのみにデノナイジングプロセスを適用し、歴史的相互作用における意味のあるパターンが保存されることを保証する。
6つのデータセットにわたる包括的実証評価は、拡散に基づく逐次レコメンデーションシステムの精度と効率を両立させる上でのADRecの有効性を裏付けるものである。
関連論文リスト
- Preference-Based Alignment of Discrete Diffusion Models [14.874943508610857]
連続時間マルコフ連鎖として定式化された離散拡散モデルに対する直接選好最適化(DPO)の最初の適応である離散拡散DPO(D2-DPO)を導入する。
提案手法は, 参照分布に忠実さを保ちつつ, 選好データを用いて生成過程を直接微調整する新規な損失関数を導出する。
以上の結果から,D2-DPOは明示的な報酬モデルを必要としない制御された微調整が可能であり,強化学習によるアプローチの代替となることが示唆された。
論文 参考訳(メタデータ) (2025-03-11T11:07:35Z) - Score as Action: Fine-Tuning Diffusion Generative Models by Continuous-time Reinforcement Learning [9.025671446527694]
人間のフィードバックからの強化学習(RLHF)は、信頼できる生成AIモデルを構築する上で重要なステップとなっている。
本研究は、連続時間RLを用いた微動拡散モデルに対する規律付きアプローチを開発することを目的とする。
論文 参考訳(メタデータ) (2025-02-03T20:50:05Z) - Dual Conditional Diffusion Models for Sequential Recommendation [63.82152785755723]
シーケンスレコメンデーションのための二重条件拡散モデル(DCRec)を提案する。
DCRecは2つの条件を前と逆の拡散プロセスに埋め込むことで暗黙的および明示的な情報を統合する。
これによってモデルは、明示的なユーザ-イテムインタラクションを活用してレコメンデーションプロセスをガイドしながら、価値あるシーケンシャルおよびコンテキスト情報を保持することができる。
論文 参考訳(メタデータ) (2024-10-29T11:51:06Z) - The Edge-of-Reach Problem in Offline Model-Based Reinforcement Learning [31.8260779160424]
学習力学モデルの改善に伴い,一般的なアルゴリズムがどのように機能するかを検討する。
エッジ・オブ・リーチ問題に直接対処する単純で堅牢な手法であるReach-Aware Learning (RAVL)を提案する。
論文 参考訳(メタデータ) (2024-02-19T20:38:00Z) - Adaptive Training Meets Progressive Scaling: Elevating Efficiency in Diffusion Models [52.1809084559048]
TDCトレーニングと呼ばれる新しい2段階分割型トレーニング戦略を提案する。
タスクの類似性と難易度に基づいてタイムステップをグループ化し、高度にカスタマイズされた復調モデルを各グループに割り当て、拡散モデルの性能を向上させる。
2段階のトレーニングでは、各モデルを個別にトレーニングする必要がなくなるが、総トレーニングコストは、単一の統合されたデノナイジングモデルをトレーニングするよりもさらに低い。
論文 参考訳(メタデータ) (2023-12-20T03:32:58Z) - Enhancing Few-shot NER with Prompt Ordering based Data Augmentation [59.69108119752584]
本稿では,PODA(Prompt Ordering Based Data Augmentation)手法を提案する。
3つのパブリックNERデータセットの実験結果とさらなる分析により,本手法の有効性が示された。
論文 参考訳(メタデータ) (2023-05-19T16:25:43Z) - Diffusion Action Segmentation [63.061058214427085]
本稿では,このような反復的洗練の本質的な精神を共用した拡散モデルによる新しい枠組みを提案する。
このフレームワークでは、入力された映像の特徴を条件としてランダムノイズから行動予測を反復的に生成する。
論文 参考訳(メタデータ) (2023-03-31T10:53:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。