Fugu-MT 論文翻訳(概要): Generative Recommendation for Large-Scale Advertising

論文の概要: Generative Recommendation for Large-Scale Advertising

arxiv url: http://arxiv.org/abs/2602.22732v1
Date: Thu, 26 Feb 2026 08:15:26 GMT
ステータス: 翻訳完了
システム内更新日: 2026-02-27 18:41:22.591453
Title: Generative Recommendation for Large-Scale Advertising
Title（参考訳）: 大規模広告のためのジェネレーティブレコメンデーション
Authors: Ben Xue, Dan Liu, Lixiang Wang, Mingjie Sun, Peng Wang, Pengfei Zhang, Shaoyun Shi, Tianyu Xu, Yunhao Sha, Zhiqiang Liu, Bo Kong, Bo Wang, Hang Yang, Jieting Xue, Junhao Wang, Shengyu Wang, Shuping Hui, Wencai Ye, Xiao Lin, Yongzhi Li, Yuhang Chen, Zhihui Yin, Quan Chen, Shiyang Wen, Wenjin Wu, Han Li, Guorui Zhou, Changcheng Li, Peng Jiang,
Abstract要約: 私たちは、アーキテクチャ、学習、サービスにまたがって共同設計された生産指向のジェネレーティブレコメンデータを紹介します。 GR4ADは4億人以上のユーザーがいるKuaishou広告システムに完全にデプロイされている。
参考スコア（独自算出の注目度）: 43.694084612630554
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Generative recommendation has recently attracted widespread attention in industry due to its potential for scaling and stronger model capacity. However, deploying real-time generative recommendation in large-scale advertising requires designs beyond large-language-model (LLM)-style training and serving recipes. We present a production-oriented generative recommender co-designed across architecture, learning, and serving, named GR4AD (Generative Recommendation for ADdvertising). As for tokenization, GR4AD proposes UA-SID (Unified Advertisement Semantic ID) to capture complicated business information. Furthermore, GR4AD introduces LazyAR, a lazy autoregressive decoder that relaxes layer-wise dependencies for short, multi-candidate generation, preserving effectiveness while reducing inference cost, which facilitates scaling under fixed serving budgets. To align optimization with business value, GR4AD employs VSL (Value-Aware Supervised Learning) and proposes RSPO (Ranking-Guided Softmax Preference Optimization), a ranking-aware, list-wise reinforcement learning algorithm that optimizes value-based rewards under list-level metrics for continual online updates. For online inference, we further propose dynamic beam serving, which adapts beam width across generation levels and online load to control compute. Large-scale online A/B tests show up to 4.2% ad revenue improvement over an existing DLRM-based stack, with consistent gains from both model scaling and inference-time scaling. GR4AD has been fully deployed in Kuaishou advertising system with over 400 million users and achieves high-throughput real-time serving.
Abstract（参考訳）: ジェネレーティブレコメンデーションは、スケーリングの可能性とモデルキャパシティの強化により、最近、業界で広く注目を集めている。しかし、大規模広告にリアルタイム生成レコメンデーションを配置するには、大規模言語モデル(LLM)スタイルのトレーニングやレシピの提供以上の設計が必要である。本稿では, GR4AD (Generative Recommendation for ADdvertising) という, アーキテクチャ, 学習, サービスにまたがる生産指向のジェネレーティブレコメンデーションを提案する。トークン化に関しては、GR4ADは複雑なビジネス情報を取得するためにUA-SID(Unified—Semantic ID)を提案する。さらに、GR4ADは遅延自動回帰デコーダであるLazyARを導入している。LazyARは、複数候補生成のための階層的依存関係を緩和し、推論コストを低減しつつ有効性を保ち、固定されたサービス予算下でのスケーリングを容易にする。ビジネス価値に最適化を合わせるため、GR4ADはVSL(Value-Aware Supervised Learning)を採用し、継続的なオンライン更新のためにリストレベルのメトリクスの下で価値に基づく報酬を最適化するランキングアウェア、リストワイド強化学習アルゴリズムであるRSPO(Ranking-Guided Softmax Preference Optimization)を提案する。オンライン推論では、生成レベルにまたがるビーム幅とオンライン負荷に適応して計算を制御する動的ビームサービスを提案する。大規模オンラインA/Bテストでは、既存のDLRMベースのスタックよりも4.2%の広告収入が向上し、モデルスケーリングと推論時間スケーリングの両方から一貫した利益を得ている。 GR4ADは4億人以上のユーザーを抱えるKuaishouの広告システムに完全にデプロイされており、高スループットのリアルタイム配信を実現している。

関連論文リスト

Learning to Reflect and Correct: Towards Better Decoding Trajectories for Large-Scale Generative Recommendation [14.679550929790151]
Generative Recommendation (GR) は大規模レコメンデーションシステムにおいて有望なパラダイムとなっている。本稿では,GRC(Generation-Reflection-Correction)プロセスに標準デコードを拡張するGRのための構造化反射補正フレームワークを提案する。本稿では,効率的なオンラインサービスを実現するために,高不確実性復号化により多くの補正予算を動的に割り当てる Entropy-Guided Reflection Scheduling (EGRS) 戦略を提案する。
論文参考訳（メタデータ） (2026-02-27T03:22:58Z)
Bringing Reasoning to Generative Recommendation Through the Lens of Cascaded Ranking [107.09842504618369]
ジェネレーティブ・レコメンデーション(GR)は、資源効率の高いレコメンデーションのために、FLOPSの利用率の高いエンド・ツー・エンドのアプローチとして期待されている。現在のGRモデルは,トークン生成が進むにつれてトークンレベルのバイアスがエスカレートする,重要なtextbfbias増幅問題に悩まされていることを示す。バイアス増幅問題に対処するためには、GR to 1) がより異質な情報を導入し、2) トークン生成ステップごとにより大きな計算資源を割り当てることが重要である。
論文参考訳（メタデータ） (2026-02-03T16:10:54Z)
WebAnchor: Anchoring Agent Planning to Stabilize Long-Horizon Web Reasoning [82.12501258760814]
大規模言語モデル(LLM)ベースのエージェントは、Web情報検索において強力な能力を示している。 Plan anchorは、長期にわたるWeb推論タスクにおいて、最初の推論ステップが下流の動作に不均等に影響を与えている場所です。計画と実行を分離する2段階のRLフレームワークであるAnchor-GRPOを提案する。
論文参考訳（メタデータ） (2026-01-06T16:36:40Z)
COFFEE: COdesign Framework for Feature Enriched Embeddings in Ads-Ranking Systems [2.1182747626493885]
本稿では,モデル推論やサービス複雑性を増大させることなく,ユーザアド表現を向上するための新しいフレームワークを提案する。提案手法は,AUCの面積を1.56倍から2倍に増やすことができる。
論文参考訳（メタデータ） (2026-01-06T08:29:12Z)
GPR: Towards a Generative Pre-trained One-Model Paradigm for Large-Scale Advertising Recommendation [38.48999566011862]
GPR(Generative Pre-trained Recommender)は,広告推薦をエンドツーエンド生成タスクとして再定義するワンモデルフレームワークである。統一表現、ネットワークアーキテクチャ、トレーニング戦略にまたがる3つの重要なイノベーションを紹介します。 GPRはTencent Weixin Channelsの広告システムに完全にデプロイされており、主要なビジネスメトリクスを大幅に改善している。
論文参考訳（メタデータ） (2025-11-13T09:50:53Z)
Multi-task Offline Reinforcement Learning for Online Advertising in Recommender Systems [54.709976343045824]
現在のオフライン強化学習(RL)手法は、スパース広告シナリオに適用した場合、重大な課題に直面している。 MTORLは,2つの主要な目標を対象とする,新しいマルチタスクオフラインRLモデルである。我々はマルチタスク学習を用いて行動と報酬をデコードし、同時にチャネルレコメンデーションと予算配分に対処する。
論文参考訳（メタデータ） (2025-06-29T05:05:13Z)
MTGR: Industrial-Scale Generative Recommendation Framework in Meituan [32.12374665716164]
この問題に対処するためにMTGR(Meituan Generative Recommendation)を提案する。 MTGRはユーザレベルの圧縮によってトレーニングと推論の高速化を実現し、効率的なスケーリングを実現する。この突破口は世界最大のフードデリバリープラットフォームであるMeituanに配備された。
論文参考訳（メタデータ） (2025-05-24T11:47:28Z)
Scaling New Frontiers: Insights into Large Recommendation Models [74.77410470984168]
MetaのジェネレーティブレコメンデーションモデルHSTUは、パラメータを数千億に拡張することでレコメンデーションシステムのスケーリング法則を説明している。我々は、これらのスケーリング法則の起源を探るため、包括的なアブレーション研究を行っている。大規模なレコメンデーションモデルの今後の方向性に関する洞察を提供する。
論文参考訳（メタデータ） (2024-12-01T07:27:20Z)
Continuous Input Embedding Size Search For Recommender Systems [60.89189829112067]
連続入力埋め込みサイズ探索(CIESS)は、任意の埋め込みサイズを選択可能な連続探索空間上で動作する新しいRLベースの手法である。 CIESSはモデルに依存しないため、様々な潜在因子RSに一般化できる。 2つの実世界のデータセットに関する実験では、異なるメモリ予算の下でCIESSの最先端のパフォーマンスが示されている。
論文参考訳（メタデータ） (2023-04-07T06:46:37Z)
Deep Reinforcement Learning-Based Product Recommender for Online Advertising [1.7778609937758327]
本稿では,オンライン広告のレコメンデータシステムを設計するために,価値ベースとポリシーベースのディープRLアルゴリズムを比較した。推奨項目のクリックスルーレート(CTR)を最大化する。
論文参考訳（メタデータ） (2021-01-30T23:05:04Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。