論文の概要: An Efficient Embedding Based Ad Retrieval with GPU-Powered Feature Interaction
- arxiv url: http://arxiv.org/abs/2511.22460v1
- Date: Thu, 27 Nov 2025 13:48:37 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-01 19:47:55.590292
- Title: An Efficient Embedding Based Ad Retrieval with GPU-Powered Feature Interaction
- Title(参考訳): GPUによる特徴間相互作用を用いた効率的な埋め込み型広告検索
- Authors: Yifan Lei, Jiahua Luo, Tingyu Jiang, Bo Zhang, Lifeng Wang, Dapeng Liu, Zhaoren Wu, Haijie Gu, Huan Yu, Jie Jiang,
- Abstract要約: 大規模広告レコメンデーションシステムにおいて、検索は重要な要素として機能し、その後のランキングとレコメンデーションのために、巨大な広告インベントリからユーザ行動に関連する候補広告のサブセットを効率的に選択することを目的としている。
デュアルトウワーネットワークでモデル化された埋め込み型検索(EBR)法は,検索効率と精度の両立に広く用いられている。
本稿では,計算コストを大幅に削減しつつ,検索精度を大幅に向上させるために,デュアルトウワーネットワークのためのGPUによる効率的な特徴相互作用を提案する。
- 参考スコア(独自算出の注目度): 11.328559370304134
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In large-scale advertising recommendation systems, retrieval serves as a critical component, aiming to efficiently select a subset of candidate ads relevant to user behaviors from a massive ad inventory for subsequent ranking and recommendation. The Embedding-Based Retrieval (EBR) methods modeled by the dual-tower network are widely used in the industry to maintain both retrieval efficiency and accuracy. However, the dual-tower model has significant limitations: the embeddings of users and ads interact only at the final inner product computation, resulting in insufficient feature interaction capabilities. Although DNN-based models with both user and ad as input features, allowing for early-stage interaction between these features, are introduced in the ranking stage to mitigate this issue, they are computationally infeasible for the retrieval stage. To bridge this gap, this paper proposes an efficient GPU-based feature interaction for the dual-tower network to significantly improve retrieval accuracy while substantially reducing computational costs. Specifically, we introduce a novel compressed inverted list designed for GPU acceleration, enabling efficient feature interaction computation at scale. To the best of our knowledge, this is the first framework in the industry to successfully implement Wide and Deep in a retrieval system. We apply this model to the real-world business scenarios in Tencent Advertising, and experimental results demonstrate that our method outperforms existing approaches in offline evaluation and has been successfully deployed to Tencent's advertising recommendation system, delivering significant online performance gains. This improvement not only validates the effectiveness of the proposed method, but also provides new practical guidance for optimizing large-scale ad retrieval systems.
- Abstract(参考訳): 大規模広告レコメンデーションシステムにおいて、検索は重要な要素として機能し、その後のランキングとレコメンデーションのために、巨大な広告インベントリからユーザ行動に関連する候補広告のサブセットを効率的に選択することを目的としている。
デュアルトウワーネットワークでモデル化された埋め込み型検索(EBR)法は,検索効率と精度の両立に広く用いられている。
ユーザと広告の埋め込みは、最終的な内部製品計算でのみ相互作用し、結果として機能の相互作用が不十分になる。
ユーザと広告の両方を入力として持つDNNベースのモデルは、これらの特徴間の早期の相互作用を可能にするが、この問題を軽減するためにランキングステージに導入されているが、検索段階では計算不可能である。
このギャップを埋めるため,本論文では,計算コストを大幅に削減しつつ,検索精度を大幅に向上させるために,デュアルトウワーネットワークのためのGPUベースの効率的な特徴相互作用を提案する。
具体的には、GPUアクセラレーション用に設計された圧縮逆リストを導入し、大規模に効率的な機能相互作用計算を可能にした。
我々の知る限りでは、このフレームワークは検索システムにおいてワイド・アンド・ディープをうまく実装した業界初のフレームワークです。
このモデルをTencent Advertisingの現実世界のビジネスシナリオに適用し、実験結果により、当社の手法が既存のオフライン評価手法よりも優れており、Tencentの広告レコメンデーションシステムにデプロイされ、オンラインのパフォーマンスが大幅に向上していることが実証された。
この改良は,提案手法の有効性を検証するだけでなく,大規模広告検索システムの最適化のための新たな実用的なガイダンスを提供する。
関連論文リスト
- WebLeaper: Empowering Efficiency and Efficacy in WebAgent via Enabling Info-Rich Seeking [60.35109192765302]
情報検索は、自律的な推論と意思決定を可能にする中核的な能力である。
我々は、高カバレッジなISタスクを構築し、効率的なソリューショントラジェクトリを生成するためのフレームワークであるWebLeaperを提案する。
本手法は,強いベースラインに対する有効性と効率性の向上を継続的に達成する。
論文 参考訳(メタデータ) (2025-10-28T17:51:42Z) - EGA-V1: Unifying Online Advertising with End-to-End Learning [17.943921299281207]
EGA-V1は、オンライン広告ランキングを一つのモデルとして統一するエンドツーエンドの生成アーキテクチャである。
EGA-V1はカスケードステージを1つのモデルに置き換え、完全な候補広告コーパスから最適な広告シーケンスを直接生成する。
論文 参考訳(メタデータ) (2025-05-26T09:33:54Z) - On the Role of Feedback in Test-Time Scaling of Agentic AI Workflows [71.92083784393418]
エージェントAI(自律的な計画と行動を行うシステム)は広く普及しているが、複雑なタスクにおけるタスクの成功率は低いままである。
推論時のアライメントは、サンプリング、評価、フィードバックの3つのコンポーネントに依存します。
本稿では,様々な形態の批判から抽出されたフィードバックを繰り返し挿入するIterative Agent Decoding(IAD)を紹介する。
論文 参考訳(メタデータ) (2025-04-02T17:40:47Z) - Hierarchical Structured Neural Network: Efficient Retrieval Scaling for Large Scale Recommendation [16.21377996349377]
複雑なユーザインタラクションとアイテムインタラクションを学習するための,効率的なディープニューラルネットワークモデルである階層構造ニューラルネットワーク(HSNN)を導入する。
HSNNは、一般的な手法に比べてオフライン評価の大幅な改善を実現している。
論文 参考訳(メタデータ) (2024-08-13T05:53:46Z) - Learning Fair Ranking Policies via Differentiable Optimization of
Ordered Weighted Averages [55.04219793298687]
本稿では,学習からランクへの学習ループに,効率よく解ける公正ランキングモデルを組み込む方法について述べる。
特に,本論文は,OWA目標の制約された最適化を通じてバックプロパゲーションを行う方法を示す最初のものである。
論文 参考訳(メタデータ) (2024-02-07T20:53:53Z) - Beyond Two-Tower Matching: Learning Sparse Retrievable
Cross-Interactions for Recommendation [80.19762472699814]
2-towerモデルは、産業アプリケーションに広くデプロイされている推奨のための一般的なマッチングフレームワークである。
機能間相互作用の制限と、オンラインサービスにおける精度の低下など、主な課題が2つある。
我々は,高度な機能相互作用だけでなく,効率的な検索もサポートするSparCodeという新しいマッチングパラダイムを提案する。
論文 参考訳(メタデータ) (2023-11-30T03:13:36Z) - Building an Efficient and Effective Retrieval-based Dialogue System via
Mutual Learning [27.04857039060308]
検索システムを構築するために,両世界の長所を組み合わせることを提案する。
従来の機能ベースの事前検索モデルを置き換えるために、高速なバイエンコーダを使用します。
我々は、相互学習を通じて、事前検索モデルと再評価モデルとを同時に訓練する。
論文 参考訳(メタデータ) (2021-10-01T01:32:33Z) - Towards a Better Tradeoff between Effectiveness and Efficiency in
Pre-Ranking: A Learnable Feature Selection based Approach [12.468550800027808]
現実世界の検索、レコメンデーション、広告システムでは、多段階ランキングアーキテクチャが一般的である。
本論文では,対話型アーキテクチャを備えた複雑なモデルをサポートする新しい事前ランク付け手法を提案する。
本手法は,学習可能な特徴選択手法を用いることで,有効性と効率のトレードオフを向上する。
論文 参考訳(メタデータ) (2021-05-17T09:48:15Z) - Adversarial Feature Augmentation and Normalization for Visual
Recognition [109.6834687220478]
最近のコンピュータビジョンの進歩は、分類モデルの一般化能力を改善するために、逆データ拡張を利用する。
本稿では,中間的特徴埋め込みにおける敵対的拡張を提唱する効率的かつ効率的な代替手法を提案する。
代表的なバックボーンネットワークを用いて,多様な視覚認識タスクにまたがる提案手法を検証する。
論文 参考訳(メタデータ) (2021-03-22T20:36:34Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。