論文の概要: HIT Model: A Hierarchical Interaction-Enhanced Two-Tower Model for Pre-Ranking Systems
- arxiv url: http://arxiv.org/abs/2505.19849v1
- Date: Mon, 26 May 2025 11:35:04 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-27 16:58:43.38807
- Title: HIT Model: A Hierarchical Interaction-Enhanced Two-Tower Model for Pre-Ranking Systems
- Title(参考訳): HITモデル: 階層的相互作用強化型プレランキングシステムのための2towerモデル
- Authors: Haoqiang Yang, Congde Yuan, Kun Bai, Mengzhuo Guo, Wei Yang, Chao Zhou,
- Abstract要約: 一般的な2towerアーキテクチャは、ドメイン間の相互作用と粗い類似度メトリクスに悩まされている。
本稿では,2つのキーコンポーネントで2towerパラダイムを拡張した新しいアーキテクチャを提案する。
HITモデルはTencentのオンラインディスプレイ広告システムにうまく展開されている。
- 参考スコア(独自算出の注目度): 9.100242205591224
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Online display advertising platforms rely on pre-ranking systems to efficiently filter and prioritize candidate ads from large corpora, balancing relevance to users with strict computational constraints. The prevailing two-tower architecture, though highly efficient due to its decoupled design and pre-caching, suffers from cross-domain interaction and coarse similarity metrics, undermining its capacity to model complex user-ad relationships. In this study, we propose the Hierarchical Interaction-Enhanced Two-Tower (HIT) model, a new architecture that augments the two-tower paradigm with two key components: $\textit{generators}$ that pre-generate holistic vectors incorporating coarse-grained user-ad interactions through a dual-generator framework with a cosine-similarity-based generation loss as the training objective, and $\textit{multi-head representers}$ that project embeddings into multiple latent subspaces to capture fine-grained, multi-faceted user interests and multi-dimensional ad attributes. This design enhances modeling effectiveness without compromising inference efficiency. Extensive experiments on public datasets and large-scale online A/B testing on Tencent's advertising platform demonstrate that HIT significantly outperforms several baselines in relevance metrics, yielding a $1.66\%$ increase in Gross Merchandise Volume and a $1.55\%$ improvement in Return on Investment, alongside similar serving latency to the vanilla two-tower models. The HIT model has been successfully deployed in Tencent's online display advertising system, serving billions of impressions daily. The code is available at https://anonymous.4open.science/r/HIT_model-5C23.
- Abstract(参考訳): オンラインディスプレイ広告プラットフォームは、大規模なコーパスから候補者広告を効率よくフィルタリングし、優先順位付けするために、事前のシステムに依存しており、厳格な計算制約のあるユーザとの関係性のバランスを取っている。
一般的な2towerアーキテクチャは、疎結合な設計と事前キャッシュのために非常に効率的であるが、ドメイン間の相互作用と粗い類似性メトリクスに悩まされており、複雑なユーザとアドリレーションをモデル化する能力が損なわれている。
本研究では、階層的相互作用強化型2tower(HIT)モデルを提案する。これは、2towerパラダイムを2つのキーコンポーネントで強化する新しいアーキテクチャである: $\textit{generators}$ トレーニング目的として、コサイン類似性に基づく生成損失を持つデュアルジェネレータフレームワークによる粗粒度ユーザアドインタラクションを組み込んだ包括的ベクター、$\textit{multi-head representationers}$ プロジェクトを複数の潜在サブスペースに埋め込んで、細粒度で多面的なユーザ関心と多次元広告属性をキャプチャする。
この設計は推論効率を損なうことなくモデリング効率を向上させる。
Tencentの広告プラットフォーム上での公開データセットと大規模なオンラインA/Bテストに関する大規模な実験は、HITが関係メトリクスのベースラインを著しく上回り、Gross Merchandise Volumeが1.66\%、Return on Investmentが1.55\%、バニラ2towerモデルに類似したサービス遅延が1.55\%となっていることを示している。
HITモデルはTencentのオンラインディスプレイ広告システムで成功し、毎日何十億ものインプレッションを提供している。
コードはhttps://anonymous.4open.science/r/HIT_model-5C23で公開されている。
関連論文リスト
- Towards Scalable Modeling of Compressed Videos for Efficient Action Recognition [6.168286187549952]
提案するハイブリッドなエンドツーエンドフレームワークは,3つの重要な概念にまたがって学習を分解し,推論コストを先行技術に対して330倍に削減する。
実験により,本手法は最先端のビデオ認識性能を実現する軽量なアーキテクチャを実現することが示された。
論文 参考訳(メタデータ) (2025-03-17T21:13:48Z) - Unleashing the Potential of Two-Tower Models: Diffusion-Based Cross-Interaction for Large-Scale Matching [25.672699790866726]
2towerモデルは、幅広いアプリケーション領域にわたる産業規模のマッチング段階で広く採用されている。
マッチングパラダイム内での"クロスインタラクションデカップリングアーキテクチャ"を提案する。
論文 参考訳(メタデータ) (2025-02-28T03:40:37Z) - FuXi-$α$: Scaling Recommendation Model with Feature Interaction Enhanced Transformer [81.12174905444229]
近年の進歩は、大規模レコメンデーションモデルに逐次レコメンデーションモデルを拡張することが効果的な戦略であることを示している。
これらの問題に対処するために、FuXi-$alpha$と呼ばれる新しいモデルを提案する。
我々のモデルは既存のモデルよりも優れており、モデルのサイズが大きくなるにつれてその性能は継続的に向上する。
論文 参考訳(メタデータ) (2025-02-05T09:46:54Z) - Exploiting Distribution Constraints for Scalable and Efficient Image Retrieval [1.6874375111244329]
最先端の画像検索システムは、データセットごとに特定のニューラルネットワークをトレーニングする。
オフザシェルフのファンデーションモデルは、データセット固有のモデルに匹敵するパフォーマンスを達成するには不足している。
本稿では,基本モデルの性能を著しく向上するAE-SVC(Strong Variance Constraints)を用いたオートエンコーダを提案する。
論文 参考訳(メタデータ) (2024-10-09T16:05:16Z) - A Lightweight Feature Fusion Architecture For Resource-Constrained Crowd
Counting [3.5066463427087777]
クラウドカウントモデルの汎用性を高めるために,2つの軽量モデルを導入する。
これらのモデルは、MobileNetとMobileViTという2つの異なるバックボーンを持ちながら、同じダウンストリームアーキテクチャを維持している。
隣接特徴融合を利用して、事前学習モデル(PTM)から多様な特徴を抽出し、その後、シームレスにこれらの特徴を組み合わせる。
論文 参考訳(メタデータ) (2024-01-11T15:13:31Z) - Beyond Two-Tower Matching: Learning Sparse Retrievable
Cross-Interactions for Recommendation [80.19762472699814]
2-towerモデルは、産業アプリケーションに広くデプロイされている推奨のための一般的なマッチングフレームワークである。
機能間相互作用の制限と、オンラインサービスにおける精度の低下など、主な課題が2つある。
我々は,高度な機能相互作用だけでなく,効率的な検索もサポートするSparCodeという新しいマッチングパラダイムを提案する。
論文 参考訳(メタデータ) (2023-11-30T03:13:36Z) - Dissecting Multimodality in VideoQA Transformer Models by Impairing Modality Fusion [54.33764537135906]
VideoQA Transformerモデルは標準ベンチマークで競合性能を示す。
これらのモデルはビデオとテキストからリッチなマルチモーダル構造とダイナミックスを一緒に捉えていますか?
彼らはバイアスと刺激的な特徴を利用して高いスコアを達成していますか?
論文 参考訳(メタデータ) (2023-06-15T06:45:46Z) - VFed-SSD: Towards Practical Vertical Federated Advertising [53.08038962443853]
本稿では,2つの制限を緩和する半教師付き分割蒸留フレームワーク VFed-SSD を提案する。
具体的には,垂直分割された未ラベルデータを利用する自己教師型タスクMatchedPair Detection (MPD) を開発する。
当社のフレームワークは,デプロイコストの最小化と大幅なパフォーマンス向上を図った,リアルタイム表示広告のための効率的なフェデレーション強化ソリューションを提供する。
論文 参考訳(メタデータ) (2022-05-31T17:45:30Z) - Efficient Person Search: An Anchor-Free Approach [86.45858994806471]
パーソンサーチは、クエリーの人物を、リアルで切り刻まれていない画像から、同時にローカライズし、識別することを目的としている。
この目標を達成するために、最先端モデルは通常、Faster R-CNNのような2段階検出器にre-idブランチを追加する。
本研究では,この課題に対処するためのアンカーフリーな手法を提案する。
論文 参考訳(メタデータ) (2021-09-01T07:01:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。