論文の概要: GenRec: A Preference-Oriented Generative Framework for Large-Scale Recommendation
- arxiv url: http://arxiv.org/abs/2604.14878v1
- Date: Thu, 16 Apr 2026 11:07:05 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-17 21:29:31.85955
- Title: GenRec: A Preference-Oriented Generative Framework for Large-Scale Recommendation
- Title(参考訳): GenRec: 大規模レコメンデーションのための推奨指向のジェネレーティブフレームワーク
- Authors: Yanyan Zou, Junbo Qi, Lunsong Huang, Yu Li, Kewei Xu, Jiabao Gao, Binglei Zhao, Xuanhua Yang, Sulong Xu, Shengjie Li,
- Abstract要約: 我々は、JD App上にデプロイされた嗜好指向の生成フレームワークであるGenRecを紹介する。
月のオンラインA/Bテストでは、GenRecは9.5%のクリック数の改善と8.7%のトランザクション数を達成した。
- 参考スコア(独自算出の注目度): 14.663434490160016
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Generative Retrieval (GR) offers a promising paradigm for recommendation through next-token prediction (NTP). However, scaling it to large-scale industrial systems introduces three challenges: (i) within a single request, the identical model inputs may produce inconsistent outputs due to the pagination request mechanism; (ii) the prohibitive cost of encoding long user behavior sequences with multi-token item representations based on semantic IDs, and (iii) aligning the generative policy with nuanced user preference signals. We present GenRec, a preference-oriented generative framework deployed on the JD App that addresses above challenges within a single decoder-only architecture. For training objective, we propose Page-wise NTP task, which supervises over an entire interaction page rather than each interacted item individually, providing denser gradient signal and resolving the one-to-many ambiguity of point-wise training. On the prefilling side, an asymmetric linear Token Merger compresses multi-token Semantic IDs in the prompt while preserving full-resolution decoding, reducing input length by ~2X with negligible accuracy loss. To further align outputs with user satisfaction, we introduce GRPO-SR, a reinforcement learning method that pairs Group Relative Policy Optimization with NLL regularization for training stability, and employs Hybrid Rewards combining a dense reward model with a relevance gate to mitigate reward hacking. In month-long online A/B tests serving production traffic, GenRec achieves 9.5% improvement in click count and 8.7% in transaction count over the existing pipeline.
- Abstract(参考訳): Generative Retrieval (GR) は、Next-token Prediction (NTP) を通じて推奨する有望なパラダイムを提供する。
しかし、大規模産業システムへのスケールアップには3つの課題が伴う。
i) 単一の要求において,同一のモデル入力は,ページネーション要求機構による不整合出力を発生させることができる。
(二 セマンティックIDに基づく複数項目表現による長期ユーザ行動系列の符号化の禁止コスト
三 生成方針を利用者選好の微妙な信号と整合させること。
我々は、JD App上にデプロイされた嗜好指向の生成フレームワークであるGenRecを、単一デコーダのみのアーキテクチャにおける上記の課題に対処する。
学習目的のために,ページワイズ NTP タスクを提案する。このタスクは,個々のインタラクション項目ではなく,インタラクションページ全体を監視し,より密度の高い勾配信号を提供し,ポイントワイズトレーニングの1対1の曖昧さを解消する。
プリフィル側では、非対称線形トーケンマーガーがプロンプト内のマルチトークンセマンティックIDを圧縮し、フル解像度の復号化を保ち、入力長を無視できる精度の損失で~2X削減する。
ユーザ満足度をさらに高めるために,グループ相対政策最適化とNLL正規化を組み合わせた強化学習手法GRPO-SRを導入し,高密度報酬モデルと関連ゲートを組み合わせたハイブリッドリワードを用いて報酬ハッキングを緩和する。
運用トラフィックを提供する1ヶ月のオンラインA/Bテストでは、GenRecは9.5%のクリック数の改善と8.7%のトランザクション数を達成した。
関連論文リスト
- $V_1$: Unifying Generation and Self-Verification for Parallel Reasoners [69.66089681814013]
$V_$は、効率的なペアワイドランキングを通じて生成と検証を統合するフレームワークである。
V_$-Inferはポイントワイド検証でPass@1を最大10%改善する。
V_$-PairRLは、標準のRLとポイントワイドのジョイントトレーニングよりも、テストタイムのスケーリングが7ドル--9%で向上する。
論文 参考訳(メタデータ) (2026-03-04T17:22:16Z) - GEMs: Breaking the Long-Sequence Barrier in Generative Recommendation with a Multi-Stream Decoder [54.64137490632567]
本稿では,長期的履歴からユーザのシーケンスをキャプチャする新しい統一フレームワークを提案する。
GEM(Generative Multi-streamer)は、ユーザのシーケンスを3つのストリームに分割する。
大規模産業データセットに対する大規模な実験により、GEMは推奨精度において最先端の手法を大幅に上回っていることが示された。
論文 参考訳(メタデータ) (2026-02-14T06:42:56Z) - RankGR: Rank-Enhanced Generative Retrieval with Listwise Direct Preference Optimization in Recommendation [36.297513746770456]
提案するRangGRは、リストワイズ直接選好最適化をレコメンデーションに組み込んだジェネレーティブ検索手法である。
IAPでは、新しいリストワイズ直接選好最適化戦略をGRに組み込んで、階層的ユーザの選好をより包括的に理解する。
トレーニングとデプロイメントにおいていくつかの実践的な改善を実現し、最終的には毎秒1万近いリクエストを処理可能なリアルタイムシステムを実現しています。
論文 参考訳(メタデータ) (2026-02-09T12:13:43Z) - Masked Diffusion Generative Recommendation [14.679550929790151]
ジェネレーティブレコメンデーション(GR)は、通常、連続アイテムの埋め込みをマルチレベルセマンティックID(SID)に量子化する。
MDGRはMasked Diffusion Generative Recommendationフレームワークで,コードブック,トレーニング,推論という3つの観点からGRパイプラインを再評価する。
論文 参考訳(メタデータ) (2026-01-27T11:39:02Z) - HiGR: Efficient Generative Slate Recommendation via Hierarchical Planning and Multi-Objective Preference Alignment [22.73838860623495]
HiGRは効率的な生成スレートレコメンデーションフレームワークであり、階層的計画とリストワイドな優先順位調整を統合している。
大規模な商用メディアプラットフォームの実験では、HiGRがオフライン評価とオンラインデプロイメントの両方で一貫した改善を実現しています。
論文 参考訳(メタデータ) (2025-12-31T11:16:24Z) - GReF: A Unified Generative Framework for Efficient Reranking via Ordered Multi-token Prediction [12.254397628788647]
ランク付けは、項目間のリスト内相関をモデル化する上で重要な役割を果たす。
最近の研究は2段階(ジェネレータ・評価器)パラダイムを踏襲している。
本稿では,2つの主要な課題に対処するため,GReF(Unified Generative Efficient Re rank Framework)を提案する。
論文 参考訳(メタデータ) (2025-10-29T06:54:42Z) - MiniOneRec: An Open-Source Framework for Scaling Generative Recommendation [44.05859062614669]
MiniOneRecは、最初の完全なオープンソースジェネレーティブレコメンデーションフレームワークである。
SID構築にまたがるエンドツーエンドワークフロー、教師付き微調整、レコメンデーション指向の強化学習を提供する。
実験の結果,モデルサイズの増加に伴い,トレーニングと評価の両方の損失が一貫した下降傾向を示した。
論文 参考訳(メタデータ) (2025-10-28T13:58:36Z) - DiffGRM: Diffusion-based Generative Recommendation Model [63.35379395455103]
ジェネレーティブレコメンデーション(GR)は、トークン化器を介して各項目をn桁のセマンティックID(SID)として表現する新興パラダイムである。
自己回帰デコーダをマスク付き離散拡散モデル(MDM)に置き換える拡散ベースGRモデルDiffGRMを提案する。
実験では、複数のデータセットに対する強力な生成的および差別的推奨ベースラインよりも一貫した利得を示す。
論文 参考訳(メタデータ) (2025-10-21T03:23:32Z) - MISSRec: Pre-training and Transferring Multi-modal Interest-aware
Sequence Representation for Recommendation [61.45986275328629]
逐次レコメンデーションのためのマルチモーダル事前学習・転送学習フレームワークであるMISSRecを提案する。
ユーザ側ではトランスフォーマーベースのエンコーダデコーダモデルを設計し、コンテキストエンコーダがシーケンスレベルのマルチモーダルユーザ興味を捉えることを学習する。
候補項目側では,ユーザ適応項目表現を生成するために動的融合モジュールを採用する。
論文 参考訳(メタデータ) (2023-08-22T04:06:56Z) - Recommender Systems with Generative Retrieval [58.454606442670034]
本稿では,対象候補の識別子を自己回帰的に復号する新たな生成検索手法を提案する。
そのために、各項目のセマンティックIDとして機能するために、意味論的に意味のあるコードワードを作成します。
提案手法を用いて学習した推薦システムは,様々なデータセット上での現在のSOTAモデルよりも大幅に優れていることを示す。
論文 参考訳(メタデータ) (2023-05-08T21:48:17Z) - Contrastive Self-supervised Sequential Recommendation with Robust
Augmentation [101.25762166231904]
Sequential Recommendation Describes a set of technique to model dynamic user behavior to order to predict future interaction in sequence user data。
データスパーシリティやノイズの多いデータなど、古くて新しい問題はまだ残っている。
逐次レコメンデーション(CoSeRec)のためのコントラスト型自己監督学習を提案する。
論文 参考訳(メタデータ) (2021-08-14T07:15:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。