論文の概要: DiffGRM: Diffusion-based Generative Recommendation Model
- arxiv url: http://arxiv.org/abs/2510.21805v1
- Date: Tue, 21 Oct 2025 03:23:32 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-28 15:28:14.532376
- Title: DiffGRM: Diffusion-based Generative Recommendation Model
- Title(参考訳): DiffGRM:拡散に基づく生成レコメンデーションモデル
- Authors: Zhao Liu, Yichen Zhu, Yiqing Yang, Guoping Tang, Rui Huang, Qiang Luo, Xiao Lv, Ruiming Tang, Kun Gai, Guorui Zhou,
- Abstract要約: ジェネレーティブレコメンデーション(GR)は、トークン化器を介して各項目をn桁のセマンティックID(SID)として表現する新興パラダイムである。
自己回帰デコーダをマスク付き離散拡散モデル(MDM)に置き換える拡散ベースGRモデルDiffGRMを提案する。
実験では、複数のデータセットに対する強力な生成的および差別的推奨ベースラインよりも一貫した利得を示す。
- 参考スコア(独自算出の注目度): 63.35379395455103
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Generative recommendation (GR) is an emerging paradigm that represents each item via a tokenizer as an n-digit semantic ID (SID) and predicts the next item by autoregressively generating its SID conditioned on the user's history. However, two structural properties of SIDs make ARMs ill-suited. First, intra-item consistency: the n digits jointly specify one item, yet the left-to-right causality trains each digit only under its prefix and blocks bidirectional cross-digit evidence, collapsing supervision to a single causal path. Second, inter-digit heterogeneity: digits differ in semantic granularity and predictability, while the uniform next-token objective assigns equal weight to all digits, overtraining easy digits and undertraining hard digits. To address these two issues, we propose DiffGRM, a diffusion-based GR model that replaces the autoregressive decoder with a masked discrete diffusion model (MDM), thereby enabling bidirectional context and any-order parallel generation of SID digits for recommendation. Specifically, we tailor DiffGRM in three aspects: (1) tokenization with Parallel Semantic Encoding (PSE) to decouple digits and balance per-digit information; (2) training with On-policy Coherent Noising (OCN) that prioritizes uncertain digits via coherent masking to concentrate supervision on high-value signals; and (3) inference with Confidence-guided Parallel Denoising (CPD) that fills higher-confidence digits first and generates diverse Top-K candidates. Experiments show consistent gains over strong generative and discriminative recommendation baselines on multiple datasets, improving NDCG@10 by 6.9%-15.5%. Code is available at https://github.com/liuzhao09/DiffGRM.
- Abstract(参考訳): ジェネレーティブレコメンデーション(GR)は、トークンライザを介して各項目をn桁のセマンティックID(SID)として表現し、ユーザの履歴に基づいてSIDを自動回帰的に生成することで次の項目を予測する新興パラダイムである。
しかし、SIDの構造的性質は2つあるため、ARMは不適合である。
第一に、イテム内の一貫性:n桁は1つの項目を共同で指定するが、左から右への因果関係は各桁をその接頭辞の下にのみ訓練し、双方向のクロス桁の証拠をブロックし、単一の因果経路に監督を崩壊させる。
第2に、桁間の不均一性: 桁は意味的な粒度と予測可能性が異なるが、均一な次トーケンの目的は全ての桁に等しく重みを割り当て、容易な桁をオーバートレーニングし、ハードディジットを訓練する。
これら2つの問題に対処するため,自動回帰デコーダをマスク付き離散拡散モデル (MDM) に置き換えた拡散型GRモデルDiffGRMを提案する。
具体的には,(1)パラレルセマンティックエンコーディング(PSE)によるトークン化と桁ごとの情報バランスの両立,(2)コヒーレントマスキングによる不確実な桁の優先順位付けによる高価値信号の監視,(3)高信頼度桁を最初に満たし多様なトップK候補を生成する信頼誘導並列デノイング(CPD)による推論,の3つの側面でDiffGRMを調整する。
実験では、複数のデータセットに対する強力な生成的および差別的推奨ベースラインよりも一貫した利得を示し、NDCG@10を6.9%-15.5%改善した。
コードはhttps://github.com/liuzhao09/DiffGRM.comで入手できる。
関連論文リスト
- Exploiting Discriminative Codebook Prior for Autoregressive Image Generation [54.14166700058777]
トークンベースの自己回帰画像生成システムは、まずトークンインデックスのシーケンスをコードブックでトークン化し、次にこれらのシーケンスを自己回帰パラダイムでモデル化する。
自己回帰生成モデルはインデックス値のみに基づいて訓練されるが、豊富なトークン類似性情報を含むコードブックにエンコードされた前者は利用されない。
近年の研究では、トークン上に単純なk平均クラスタリングを行い、コードブックを減らした生成モデルのトレーニングを容易にすることで、これを先に組み込もうとしている。
k-meansの代替として、差別的コードブック先駆者(DCPE)を提案する。
論文 参考訳(メタデータ) (2025-08-14T15:00:00Z) - Generating Long Semantic IDs in Parallel for Recommendation [29.97624755406803]
セマンティックIDベースのリコメンデーションのための軽量フレームワークであるRPGを提案する。
我々は、マルチトークン予測損失を用いて、各トークンを独立して予測するようにモデルを訓練する。
実験の結果、セマンティックIDの長さを64にスケールアップすることで、RPGは生成ベースラインを上回ります。
論文 参考訳(メタデータ) (2025-06-06T06:20:37Z) - Adaptive Multi-Order Graph Regularized NMF with Dual Sparsity for Hyperspectral Unmixing [14.732511023726715]
3つの特徴を持つ適応多階グラフ正規化NMF法(MOGNMF)を提案する。
シミュレーションおよび実超スペクトルデータを用いた実験は,提案手法がより良い混合結果をもたらすことを示す。
論文 参考訳(メタデータ) (2025-03-25T01:44:02Z) - Distinguished Quantized Guidance for Diffusion-based Sequence Recommendation [7.6572888950554905]
拡散型シーケンスレコメンデーション(DiQDiff)のための分散量子ガイダンスを提案する。
DiQDiffは、ユーザ関心を理解するための堅牢なガイダンスを抽出し、DM内でパーソナライズされたユーザ関心のための優れたアイテムを生成することを目的としている。
先行するアプローチに対するDiQDiffの優れたレコメンデーション性能は、シーケンシャルなレコメンデーションタスクにおける有効性を示している。
論文 参考訳(メタデータ) (2025-01-29T14:20:42Z) - GEC-DePenD: Non-Autoregressive Grammatical Error Correction with
Decoupled Permutation and Decoding [52.14832976759585]
文法的誤り訂正(GEC)は、通常自己回帰的なシーケンス・ツー・シーケンスモデルで解決される重要なNLPタスクである。
本稿では, アーキテクチャを置換ネットワークに分離する, GEC に対する非自己回帰的アプローチを提案する。
GECの既知の非自己回帰手法よりもネットワークが向上することを示す。
論文 参考訳(メタデータ) (2023-11-14T14:24:36Z) - Enhancing Few-shot NER with Prompt Ordering based Data Augmentation [59.69108119752584]
本稿では,PODA(Prompt Ordering Based Data Augmentation)手法を提案する。
3つのパブリックNERデータセットの実験結果とさらなる分析により,本手法の有効性が示された。
論文 参考訳(メタデータ) (2023-05-19T16:25:43Z) - Object Segmentation by Mining Cross-Modal Semantics [68.88086621181628]
マルチモーダル特徴の融合と復号を導くために,クロスモーダル・セマンティックスをマイニングする手法を提案する。
具体的には,(1)全周減衰核融合(AF),(2)粗大デコーダ(CFD),(3)多層自己超越からなる新しいネットワークXMSNetを提案する。
論文 参考訳(メタデータ) (2023-05-17T14:30:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。