論文の概要: Rec4Ad: A Free Lunch to Mitigate Sample Selection Bias for Ads CTR
Prediction in Taobao
- arxiv url: http://arxiv.org/abs/2306.03527v1
- Date: Tue, 6 Jun 2023 09:22:52 GMT
- ステータス: 処理完了
- システム内更新日: 2023-06-07 16:24:19.883595
- Title: Rec4Ad: A Free Lunch to Mitigate Sample Selection Bias for Ads CTR
Prediction in Taobao
- Title(参考訳): Rec4Ad: タオバオにおける広告CTR予測のためのサンプル選択バイアスを緩和するフリーランチ
- Authors: Jingyue Gao, Shuguang Han, Han Zhu, Siran Yang, Yuning Jiang, Jian Xu,
Bo Zheng
- Abstract要約: 広告CTRモデルのサンプル選択バイアスを軽減するために,フリーランチとしてレコメンデーションサンプルを活用することを提案する(Rec4Ad)。
Rec4Adは、最大5.6%のCTRと+2.9%のRPMを持ち、主要なビジネス指標でかなりの利益を得ている。
- 参考スコア(独自算出の注目度): 24.43583745735832
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Click-Through Rate (CTR) prediction serves as a fundamental component in
online advertising. A common practice is to train a CTR model on advertisement
(ad) impressions with user feedback. Since ad impressions are purposely
selected by the model itself, their distribution differs from the inference
distribution and thus exhibits sample selection bias (SSB) that affects model
performance. Existing studies on SSB mainly employ sample re-weighting
techniques which suffer from high variance and poor model calibration. Another
line of work relies on costly uniform data that is inadequate to train
industrial models. Thus mitigating SSB in industrial models with a
uniform-data-free framework is worth exploring. Fortunately, many platforms
display mixed results of organic items (i.e., recommendations) and sponsored
items (i.e., ads) to users, where impressions of ads and recommendations are
selected by different systems but share the same user decision rationales.
Based on the above characteristics, we propose to leverage recommendations
samples as a free lunch to mitigate SSB for ads CTR model (Rec4Ad). After
elaborating data augmentation, Rec4Ad learns disentangled representations with
alignment and decorrelation modules for enhancement. When deployed in Taobao
display advertising system, Rec4Ad achieves substantial gains in key business
metrics, with a lift of up to +6.6\% CTR and +2.9\% RPM.
- Abstract(参考訳): CTR(Click-Through Rate)予測は、オンライン広告の基本的な構成要素である。
一般的なプラクティスは、広告(ad)インプレッションのCTRモデルをユーザフィードバックでトレーニングすることである。
広告インプレッションはモデル自身によって意図的に選択されるため、その分布は推論分布と異なり、モデル性能に影響を与えるサンプル選択バイアス(ssb)を示す。
SSBに関する既存の研究は、主に高ばらつきと低モデルの校正に苦しむサンプル再重み付け技術を用いている。
別の作業は、産業モデルを訓練するのに不適切なコストの均一なデータに依存している。
したがって、一様データフリーフレームワークによる産業モデルにおけるSSBの緩和は検討に値する。
幸いなことに、多くのプラットフォームは、さまざまなシステムによって広告やレコメンデーションの印象が選択されるが、同じユーザ決定の根拠を共有する、有機アイテム(レコメンデーション)とスポンサードアイテム(広告)の混合結果をユーザに表示する。
以上の特徴から,広告CTRモデル(Rec4Ad)のSSBを緩和するために,推奨サンプルをフリーランチとして活用することを提案する。
データを拡張した後、Rec4Adはアライメントとデコレーションモジュールによるアンタングル表現を学習し、拡張する。
タオバオのディスプレイ広告システムに展開すると、Rec4Adは最大で+6.6.%のCTRと+2.9.%のRPMを持ち、主要なビジネス指標でかなりの利益を上げている。
関連論文リスト
- Unbiased Filtering Of Accidental Clicks in Verizon Media Native
Advertising [1.6717433307723157]
我々は、クリックのいくつかが短寿命であることに気付いた場合、クリックスルー率(CTR)を予測することの課題に焦点を当てる。
偶然クリックすると、ユーザーと広告の間に親和性はほとんどなく、類似ユーザーが広告をクリックすると予測するのは不正確だ。
本稿では,偶発クリックの発生確率に基づいて,偶発クリックの正の重みを全ての負の事象(スキップ)に分配する手法を提案する。
論文 参考訳(メタデータ) (2023-12-08T12:54:30Z) - Improving a Named Entity Recognizer Trained on Noisy Data with a Few
Clean Instances [55.37242480995541]
クリーンなインスタンスの小さなセットから,ノイズの多いNERデータを誘導することで,ノイズを発生させる手法を提案する。
メインのNERモデルとともに、判別器モデルをトレーニングし、その出力を使用してサンプルの重み付けを校正します。
クラウドソーシングと遠隔監視データセットの結果から,提案手法は少ないガイダンスセットで継続的に性能を向上させることができることが示された。
論文 参考訳(メタデータ) (2023-10-25T17:23:37Z) - COPR: Consistency-Oriented Pre-Ranking for Online Advertising [27.28920707332434]
オンライン広告のための一貫性指向のプレグレードフレームワークを提案する。
チャンクベースのサンプリングモジュールとプラグアンドプレイのランクアライメントモジュールを使用して、ECPMでランク付けされた結果の一貫性を明示的に最適化する。
Taobaoのディスプレイ広告システムに展開すると、最大で+12.3%のCTRと+5.6%のRPMを実現している。
論文 参考訳(メタデータ) (2023-06-06T09:08:40Z) - Selecting Learnable Training Samples is All DETRs Need in Crowded
Pedestrian Detection [72.97320260601347]
混雑した歩行者検出では, サンプル選択法が不適切であるため, DETRの性能は相変わらず不満足である。
制約誘導ラベル割り当てスキーム(CGLA)からなる群集歩行者のサンプル選択を提案する。
実験の結果,提案したSSCPは推論のオーバーヘッドを発生させることなく,ベースラインを効果的に改善することがわかった。
論文 参考訳(メタデータ) (2023-05-18T08:28:01Z) - Towards Robust Visual Question Answering: Making the Most of Biased
Samples via Contrastive Learning [54.61762276179205]
我々は,ビザドサンプルを最大限に活用することで,ロバストなVQAモデルを構築するための新しいコントラスト学習手法 MMBS を提案する。
具体的には、元のトレーニングサンプルからスプリアス相関に関連する情報を排除し、比較学習のための正のサンプルを構築する。
我々は,OODデータセットのVQA-CP v2において,IDデータセットのVQA v2上での堅牢なパフォーマンスを維持しながら,競争性能を達成することで,コントリビューションを検証した。
論文 参考訳(メタデータ) (2022-10-10T11:05:21Z) - Rethinking Position Bias Modeling with Knowledge Distillation for CTR
Prediction [8.414183573280779]
本研究では,位置バイアスの影響を緩和し,位置情報を活用してCTR予測を改善する知識蒸留フレームワークを提案する。
提案手法は現実世界のオンライン広告システムに展開され、世界最大の電子商取引プラットフォームの1つで主要なトラフィックを提供する。
論文 参考訳(メタデータ) (2022-04-01T07:58:38Z) - CausalMTA: Eliminating the User Confounding Bias for Causal Multi-touch
Attribution [16.854552780506822]
ユーザの好みの影響を排除するために,CausalMTAを提案する。
CaulMTAは最先端手法よりも優れた予測性能を実現する。
また、異なる広告チャンネル間で有意義な属性クレジットを生成する。
論文 参考訳(メタデータ) (2021-12-21T01:59:16Z) - Rethinking InfoNCE: How Many Negative Samples Do You Need? [54.146208195806636]
半定量的理論フレームワークを用いて, InfoNCE に最適化された負のサンプル数について検討した。
トレーニングの有効性関数を最大化する$K$値を用いて,最適負サンプリング比を推定する。
論文 参考訳(メタデータ) (2021-05-27T08:38:29Z) - Probabilistic and Variational Recommendation Denoising [56.879165033014026]
暗黙のフィードバックから学ぶことは、推奨システムの適用において最も一般的なケースの1つである。
本稿では,暗黙のフィードバックに対する確率的・変動的推薦を提案する。
提案したDPIとDVAEを4つの最先端レコメンデーションモデルに適用し、3つのデータセットで実験を行う。
論文 参考訳(メタデータ) (2021-05-20T08:59:44Z) - One for More: Selecting Generalizable Samples for Generalizable ReID
Model [92.40951770273972]
本稿では,選択したサンプルを損失関数として一般化する1対3の学習目標を提案する。
提案した1対3のサンプルは,ReIDトレーニングフレームワークにシームレスに統合できる。
論文 参考訳(メタデータ) (2020-12-10T06:37:09Z) - Learning Classifiers under Delayed Feedback with a Time Window
Assumption [16.269923100433235]
遅延フィードバック(emphDF学習)下でのバイナリ分類器の訓練の検討
最初は陰性なサンプルを受け取り、その後、いくつかのサンプルは正に変化する。
遅延したフィードバックのため、正と負のサンプルのナイーブな分類はバイアス付き分類器を返す。
論文 参考訳(メタデータ) (2020-09-28T06:20:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。