論文の概要: Real Negatives Matter: Continuous Training with Real Negatives for
Delayed Feedback Modeling
- arxiv url: http://arxiv.org/abs/2104.14121v1
- Date: Thu, 29 Apr 2021 05:37:34 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-30 21:47:36.018021
- Title: Real Negatives Matter: Continuous Training with Real Negatives for
Delayed Feedback Modeling
- Title(参考訳): real negatives matter:遅延フィードバックモデリングのためのreal negativesによる継続的トレーニング
- Authors: Siyu Gu, Xiang-Rong Sheng, Ying Fan, Guorui Zhou, Xiaoqiang Zhu
- Abstract要約: 本稿では,リアルネガティブ(DEFER)を用いた遅延フィードバックモデルを提案する。
実際の負の摂取は、観察された特徴分布が実際の分布と同等であることを保証し、バイアスを低減する。
DEFERはAlibabaのディスプレイ広告システムにデプロイされており、いくつかのシナリオでCVRが6.4%改善されている。
- 参考スコア(独自算出の注目度): 10.828167195122072
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: One of the difficulties of conversion rate (CVR) prediction is that the
conversions can delay and take place long after the clicks. The delayed
feedback poses a challenge: fresh data are beneficial to continuous training
but may not have complete label information at the time they are ingested into
the training pipeline. To balance model freshness and label certainty, previous
methods set a short waiting window or even do not wait for the conversion
signal. If conversion happens outside the waiting window, this sample will be
duplicated and ingested into the training pipeline with a positive label.
However, these methods have some issues. First, they assume the observed
feature distribution remains the same as the actual distribution. But this
assumption does not hold due to the ingestion of duplicated samples. Second,
the certainty of the conversion action only comes from the positives. But the
positives are scarce as conversions are sparse in commercial systems. These
issues induce bias during the modeling of delayed feedback. In this paper, we
propose DElayed FEedback modeling with Real negatives (DEFER) method to address
these issues. The proposed method ingests real negative samples into the
training pipeline. The ingestion of real negatives ensures the observed feature
distribution is equivalent to the actual distribution, thus reducing the bias.
The ingestion of real negatives also brings more certainty information of the
conversion. To correct the distribution shift, DEFER employs importance
sampling to weigh the loss function. Experimental results on industrial
datasets validate the superiority of DEFER. DEFER have been deployed in the
display advertising system of Alibaba, obtaining over 6.0% improvement on CVR
in several scenarios. The code and data in this paper are now open-sourced
{https://github.com/gusuperstar/defer.git}.
- Abstract(参考訳): コンバージョンレート(cvr)予測の難しさの1つは、コンバージョンがクリック後に遅延し、起きる可能性があることである。
新鮮なデータは継続的トレーニングには有益ですが、トレーニングパイプラインに入力された時点では、完全なラベル情報を持っていない場合もあります。
モデルの鮮度とラベルの確実性をバランスさせるため、以前の方法は短い待ち窓を設定したり、変換信号を待たなかったりする。
待機ウィンドウの外で変換が発生した場合、このサンプルは複製され、正のラベルでトレーニングパイプラインに取り込みます。
しかし、これらの方法にはいくつかの問題がある。
まず、観測された特徴分布は実際の分布と同じであると仮定する。
しかし、この仮定は重複サンプルの摂取によって成立しない。
第二に、変換作用の確実性は正からのみ生じる。
しかし、商業システムでは変換が不足しているため、ポジティブは少ない。
これらの問題は、遅延したフィードバックのモデリング中にバイアスを引き起こす。
本稿では,これらの問題に対処するため,Real negatives (DEFER) 法によるdelayed FEedbackモデリングを提案する。
提案手法は実際の負のサンプルをトレーニングパイプラインに取り込みます。
実際の負の取り込みは、観測された特徴分布が実際の分布と等価であることを保証する。
真の負の摂取は、変換に関するより確かな情報をもたらす。
分散シフトを修正するために、DeFERは損失関数の重み付けに重要サンプリングを用いる。
産業データセットの実験結果から,DEFERの優位性を検証した。
DEFERはAlibabaのディスプレイ広告システムにデプロイされており、いくつかのシナリオでCVRが6.0%改善している。
この論文のコードとデータは、https://github.com/gusuperstar/defer.git} としてオープンソース化された。
関連論文リスト
- DOTA: Distributional Test-Time Adaptation of Vision-Language Models [52.98590762456236]
トレーニングフリーテスト時動的アダプタ(TDA)は、この問題に対処するための有望なアプローチである。
単体テスト時間適応法(Dota)の簡易かつ効果的な方法を提案する。
Dotaは継続的にテストサンプルの分布を推定し、モデルがデプロイメント環境に継続的に適応できるようにします。
論文 参考訳(メタデータ) (2024-09-28T15:03:28Z) - Freshness or Accuracy, Why Not Both? Addressing Delayed Feedback via
Dynamic Graph Neural Networks [23.952923773407043]
遅延フィードバック問題は、変換率を予測する上で最も困難な課題の1つである。
動的グラフニューラルネットワーク(DGDFEM)による遅延フィードバックモデリングを提案する。
データパイプラインの作成、動的グラフの構築、CVR予測モデルのトレーニングという3つのステージが含まれている。
論文 参考訳(メタデータ) (2023-08-15T23:49:07Z) - Making Pre-trained Language Models both Task-solvers and
Self-calibrators [52.98858650625623]
プレトレーニング言語モデル(PLM)は、様々な現実世界のシステムのバックボーンとして機能する。
以前の研究は、余分なキャリブレーションタスクを導入することでこの問題を緩和できることを示している。
課題に対処するためのトレーニングアルゴリズムLM-TOASTを提案する。
論文 参考訳(メタデータ) (2023-07-21T02:51:41Z) - Consistent Diffusion Models: Mitigating Sampling Drift by Learning to be
Consistent [97.64313409741614]
本稿では, モデルが生成したデータ上での予測が時間とともに一定であることを示す, 両立性特性を強制することを提案する。
CIFAR-10の条件および非条件生成とAFHQとFFHQのベースライン改良について,本研究の新たな訓練目標が得られた。
論文 参考訳(メタデータ) (2023-02-17T18:45:04Z) - Asymptotically Unbiased Estimation for Delayed Feedback Modeling via
Label Correction [14.462884375151045]
遅延したフィードバックは、オンライン広告の変換率予測に不可欠である。
これまでの遅延したフィードバックモデリング手法は、正確なラベルを待ち、新鮮なフィードバックを消費する間のトレードオフのバランスをとる。
提案手法は, 即効性, 偽陰性, 実陰性, 遅延正サンプルの重み付けをそれぞれ補正することを目的として, 非バイアス推定を用いた遅延フィードバックモデリング(DEFUSE)を提案する。
論文 参考訳(メタデータ) (2022-02-14T03:31:09Z) - Tracking the risk of a deployed model and detecting harmful distribution
shifts [105.27463615756733]
実際には、デプロイされたモデルのパフォーマンスが大幅に低下しないという、良心的なシフトを無視することは理にかなっている。
我々は,警告を発射する有効な方法は,(a)良性な警告を無視しながら有害なシフトを検知し,(b)誤報率を増大させることなく,モデル性能の連続的なモニタリングを可能にすることを論じる。
論文 参考訳(メタデータ) (2021-10-12T17:21:41Z) - Training on Test Data with Bayesian Adaptation for Covariate Shift [96.3250517412545]
ディープニューラルネットワークは、信頼できない不確実性推定で不正確な予測を行うことが多い。
分布シフトの下でのラベルなし入力とモデルパラメータとの明確に定義された関係を提供するベイズモデルを導出する。
本手法は精度と不確実性の両方を向上することを示す。
論文 参考訳(メタデータ) (2021-09-27T01:09:08Z) - Capturing Delayed Feedback in Conversion Rate Prediction via
Elapsed-Time Sampling [29.77426549280091]
コンバージョンレート(CVR)予測は、デジタルディスプレイ広告において最も重要なタスクの1つである。
Elapsed-Time Smpling Delayed Feedback Model (ES-DFM) を提案する。
論文 参考訳(メタデータ) (2020-12-06T12:20:50Z) - Learning Classifiers under Delayed Feedback with a Time Window
Assumption [16.269923100433235]
遅延フィードバック(emphDF学習)下でのバイナリ分類器の訓練の検討
最初は陰性なサンプルを受け取り、その後、いくつかのサンプルは正に変化する。
遅延したフィードバックのため、正と負のサンプルのナイーブな分類はバイアス付き分類器を返す。
論文 参考訳(メタデータ) (2020-09-28T06:20:24Z) - Evaluating Prediction-Time Batch Normalization for Robustness under
Covariate Shift [81.74795324629712]
我々は予測時間バッチ正規化と呼び、共変量シフト時のモデル精度とキャリブレーションを大幅に改善する。
予測時間バッチ正規化は、既存の最先端アプローチに相補的な利点をもたらし、ロバスト性を向上させることを示します。
この手法は、事前トレーニングと併用して使用すると、さまざまな結果が得られるが、より自然なタイプのデータセットシフトでは、パフォーマンスが良くないようだ。
論文 参考訳(メタデータ) (2020-06-19T05:08:43Z) - A Feedback Shift Correction in Predicting Conversion Rates under Delayed
Feedback [6.38500614968955]
ディスプレイ広告では、広告を表示する価値を推定するために、変換率を予測することが不可欠である。
クリックと結果の変換の間には、比較的長い時間がかかる。
遅延したフィードバックのため、トレーニング期間中の肯定的なインスタンスには負のラベルが付けられている。
論文 参考訳(メタデータ) (2020-02-06T02:05:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。