論文の概要: GPR: Towards a Generative Pre-trained One-Model Paradigm for Large-Scale Advertising Recommendation
- arxiv url: http://arxiv.org/abs/2511.10138v1
- Date: Fri, 14 Nov 2025 01:34:51 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-14 22:53:22.713069
- Title: GPR: Towards a Generative Pre-trained One-Model Paradigm for Large-Scale Advertising Recommendation
- Title(参考訳): GPR:大規模広告レコメンデーションのための1モデル一モデル生成パラダイムを目指して
- Authors: Jun Zhang, Yi Li, Yue Liu, Changping Wang, Yuan Wang, Yuling Xiong, Xun Liu, Haiyang Wu, Qian Li, Enming Zhang, Jiawei Sun, Xin Xu, Zishuai Zhang, Ruoran Liu, Suyuan Huang, Zhaoxin Zhang, Zhengkai Guo, Shuojin Yang, Meng-Hao Guo, Huan Yu, Jie Jiang, Shi-Min Hu,
- Abstract要約: GPR(Generative Pre-trained Recommender)は,広告推薦をエンドツーエンド生成タスクとして再定義するワンモデルフレームワークである。
統一表現、ネットワークアーキテクチャ、トレーニング戦略にまたがる3つの重要なイノベーションを紹介します。
GPRはTencent Weixin Channelsの広告システムに完全にデプロイされており、主要なビジネスメトリクスを大幅に改善している。
- 参考スコア(独自算出の注目度): 38.48999566011862
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: As an intelligent infrastructure connecting users with commercial content, advertising recommendation systems play a central role in information flow and value creation within the digital economy. However, existing multi-stage advertising recommendation systems suffer from objective misalignment and error propagation, making it difficult to achieve global optimality, while unified generative recommendation models still struggle to meet the demands of practical industrial applications. To address these issues, we propose GPR (Generative Pre-trained Recommender), the first one-model framework that redefines advertising recommendation as an end-to-end generative task, replacing the traditional cascading paradigm with a unified generative approach. To realize GPR, we introduce three key innovations spanning unified representation, network architecture, and training strategy. First, we design a unified input schema and tokenization method tailored to advertising scenarios, mapping both ads and organic content into a shared multi-level semantic ID space, thereby enhancing semantic alignment and modeling consistency across heterogeneous data. Second, we develop the Heterogeneous Hierarchical Decoder (HHD), a dual-decoder architecture that decouples user intent modeling from ad generation, achieving a balance between training efficiency and inference flexibility while maintaining strong modeling capacity. Finally, we propose a multi-stage joint training strategy that integrates Multi-Token Prediction (MTP), Value-Aware Fine-Tuning and the Hierarchy Enhanced Policy Optimization (HEPO) algorithm, forming a complete generative recommendation pipeline that unifies interest modeling, value alignment, and policy optimization. GPR has been fully deployed in the Tencent Weixin Channels advertising system, delivering significant improvements in key business metrics including GMV and CTCVR.
- Abstract(参考訳): ユーザと商用コンテンツを結ぶインテリジェントなインフラとして、広告推薦システムは、デジタル経済における情報フローと価値創造において中心的な役割を果たす。
しかし、既存の多段階広告レコメンデーションシステムは客観的なミスアライメントとエラーの伝播に悩まされており、グローバルな最適性を達成することは困難である。
これらの課題に対処するために,従来のカスケーディングパラダイムを統一的な生成アプローチに置き換え,広告推薦をエンドツーエンドの生成タスクとして再定義する最初のワンモデルフレームワークであるGPR(Generative Pre-trained Recommender)を提案する。
GPRを実現するために、統一表現、ネットワークアーキテクチャ、トレーニング戦略にまたがる3つの重要なイノベーションを紹介します。
まず、広告シナリオに適した統一された入力スキーマとトークン化手法を設計し、広告とオーガニックコンテンツの両方を共有マルチレベルセマンティックID空間にマッピングすることで、異種データ間のセマンティックアライメントとモデリング一貫性を向上する。
第2に、ユーザ意図を広告生成から切り離し、強力なモデリング能力を維持しつつ、トレーニング効率と推論柔軟性のバランスを保ちながら、ユーザ意図モデリングと広告生成を分離するデュアルデコーダアーキテクチャであるHHD(Heterogeneous Hierarchical Decoder)を開発した。
最後に、マルチトークン予測(MTP)、バリューアウェアファインタニング、階層拡張政策最適化(HEPO)アルゴリズムを統合し、関心モデリング、価値アライメント、ポリシー最適化を統一する完全な生成的レコメンデーションパイプラインを構築する多段階共同トレーニング戦略を提案する。
GPRはTencent Weixin Channelsの広告システムに完全にデプロイされており、GMVやCTCVRといった主要なビジネスメトリクスを大幅に改善している。
関連論文リスト
- Decoupled Multimodal Fusion for User Interest Modeling in Click-Through Rate Prediction [6.663141182602147]
ユーザ関心モデリングのためのIDベースの協調表現とマルチモーダル表現とのきめ細かい相互作用を可能にするために,Decoupled Multimodal Fusion (DMF)を提案する。
我々は、異なる埋め込み空間にまたがるセマンティックギャップをブリッジするターゲット認識機能を構築し、それらをサイド情報として活用し、ユーザ関心モデリングの有効性を高める。
DMFは国際的なeコマースプラットフォームの製品レコメンデーションシステムにデプロイされ、CTCVRの5.30%とGMVの7.43%の相対的な改善を実現している。
論文 参考訳(メタデータ) (2025-10-13T07:06:26Z) - A Unified Multi-Task Learning Framework for Generative Auto-Bidding with Validation-Aligned Optimization [51.27959658504722]
マルチタスク学習は、これらのタスクを共有表現を通じて共同でトレーニングするための、原則化されたフレームワークを提供する。
既存のマルチタスク最適化戦略は、主にトレーニングダイナミクスによって導かれ、不安定な入札環境ではよく一般化される。
本稿では,タスク毎のトレーニング勾配と保留有効度勾配のアライメントに基づいてタスク重みを適応的に割り当てる,バリデーション適応型マルチタスク最適化(VAMO)を提案する。
論文 参考訳(メタデータ) (2025-10-09T03:59:51Z) - RecLLM-R1: A Two-Stage Training Paradigm with Reinforcement Learning and Chain-of-Thought v1 [20.92548890511589]
本稿では,Large Language Models(LLM)を利用したレコメンデーションフレームワークであるRecLLM-R1を紹介する。
RecLLM-R1は、精度、多様性、新規性など、さまざまな評価指標において、既存のベースラインメソッドを大幅に上回っている。
論文 参考訳(メタデータ) (2025-06-24T01:39:34Z) - EGA-V2: An End-to-end Generative Framework for Industrial Advertising [19.927005856735445]
EGA-V2(End-to-End Generative Advertising)は、ユーザ興味、POI(point-of-interest)、クリエイティブジェネレーション、広告アロケーション、支払い最適化を体系的にモデル化する最初の統合フレームワークである。
当社の結果は、次世代産業広告システムへの道を開く、完全生成型広告ソリューションのパイオニアとしての可能性を浮き彫りにしている。
論文 参考訳(メタデータ) (2025-05-23T06:55:02Z) - Action is All You Need: Dual-Flow Generative Ranking Network for Recommendation [25.30922374657862]
本稿では,相互作用モデリングの最適化にデュアルフロー機構を用いるDual-Flow Generative Ranking Network (DFGR)を提案する。
DFGRは、元のユーザ行動シーケンスを、アクション情報の信頼性に基づいて、実際のフローと偽のフローに複製する。
この設計は、MetaのHSTUベースのモデルと比較して、計算オーバーヘッドを低減し、トレーニング効率と推論性能の両方を改善する。
論文 参考訳(メタデータ) (2025-05-22T14:58:53Z) - MMaDA: Multimodal Large Diffusion Language Models [61.13527224215318]
マルチモーダル拡散基礎モデルの新たなクラスであるMMaDAを紹介する。
テキスト推論、マルチモーダル理解、テキスト・ツー・イメージ生成など、さまざまな領域で優れたパフォーマンスを実現するように設計されている。
論文 参考訳(メタデータ) (2025-05-21T17:59:05Z) - Unleash LLMs Potential for Recommendation by Coordinating Twin-Tower Dynamic Semantic Token Generator [60.07198935747619]
動的セマンティック・インデックス・パラダイムを採用した最初の生成型RSであるTTDS(Twin-Tower Dynamic Semantic Recommender)を提案する。
より具体的には、ツイン・トワー・セマンティック・トークン・ジェネレータをLLMベースのレコメンデータに統合する動的知識融合フレームワークを初めて提案する。
提案したTTDSレコメンデータは,平均19.41%のヒットレート,20.84%のNDCG測定値を実現している。
論文 参考訳(メタデータ) (2024-09-14T01:45:04Z) - Optimization-Inspired Learning with Architecture Augmentations and
Control Mechanisms for Low-Level Vision [74.9260745577362]
本稿では,GDC(Generative, Discriminative, and Corrective)の原則を集約する,最適化に着想を得た統合学習フレームワークを提案する。
フレキシブルな組み合わせで最適化モデルを効果的に解くために,3つのプロパゲーティブモジュールを構築した。
低レベル視覚タスクにおける実験は、GDCの有効性と適応性を検証する。
論文 参考訳(メタデータ) (2020-12-10T03:24:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。