論文の概要: Asymptotically Unbiased Estimation for Delayed Feedback Modeling via
Label Correction
- arxiv url: http://arxiv.org/abs/2202.06472v1
- Date: Mon, 14 Feb 2022 03:31:09 GMT
- ステータス: 処理完了
- システム内更新日: 2022-02-15 17:12:23.452243
- Title: Asymptotically Unbiased Estimation for Delayed Feedback Modeling via
Label Correction
- Title(参考訳): ラベル補正による遅延フィードバックモデリングの漸近的非バイアス推定
- Authors: Yu Chen, Jiaqi Jin, Hui Zhao, Pengjie Wang, Guojun Liu, Jian Xu and Bo
Zheng
- Abstract要約: 遅延したフィードバックは、オンライン広告の変換率予測に不可欠である。
これまでの遅延したフィードバックモデリング手法は、正確なラベルを待ち、新鮮なフィードバックを消費する間のトレードオフのバランスをとる。
提案手法は, 即効性, 偽陰性, 実陰性, 遅延正サンプルの重み付けをそれぞれ補正することを目的として, 非バイアス推定を用いた遅延フィードバックモデリング(DEFUSE)を提案する。
- 参考スコア(独自算出の注目度): 14.462884375151045
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Alleviating the delayed feedback problem is of crucial importance for the
conversion rate(CVR) prediction in online advertising. Previous delayed
feedback modeling methods using an observation window to balance the trade-off
between waiting for accurate labels and consuming fresh feedback. Moreover, to
estimate CVR upon the freshly observed but biased distribution with fake
negatives, the importance sampling is widely used to reduce the distribution
bias. While effective, we argue that previous approaches falsely treat fake
negative samples as real negative during the importance weighting and have not
fully utilized the observed positive samples, leading to suboptimal
performance.
In this work, we propose a new method, DElayed Feedback modeling with
UnbiaSed Estimation, (DEFUSE), which aim to respectively correct the importance
weights of the immediate positive, the fake negative, the real negative, and
the delay positive samples at finer granularity. Specifically, we propose a
two-step optimization approach that first infers the probability of fake
negatives among observed negatives before applying importance sampling. To
fully exploit the ground-truth immediate positives from the observed
distribution, we further develop a bi-distribution modeling framework to
jointly model the unbiased immediate positives and the biased delay
conversions. Experimental results on both public and our industrial datasets
validate the superiority of DEFUSE. Codes are available at
https://github.com/ychen216/DEFUSE.git.
- Abstract(参考訳): 遅延したフィードバック問題を緩和することは、オンライン広告における変換率(CVR)予測において重要である。
正確なラベル待ちと新鮮なフィードバックのトレードオフのバランスをとるためにオブザーバーウィンドウを用いた以前の遅延フィードバックモデリング手法。
さらに, 偽陰性分布を用いてCVRを推定するためには, 分布バイアスを低減するために重要サンプリングが広く用いられている。
効果はあるものの, 従来の手法では偽陰性標本を重み付けにおいて真陰性扱いし, 検出された正のサンプルを十分に活用していないため, 準最適性能が得られた。
本研究では,非バイアス推定を用いた遅延フィードバックモデル (DEFUSE) を提案する。これは, 即効性, 偽陰性, 実陰性, 遅延正の重み付けを, より微細な粒度でそれぞれ補正することを目的としている。
具体的には、まず、重要サンプリングを適用する前に、観測された負の偽陰性の確率を推定する2段階最適化手法を提案する。
観測された分布から地中即応を十分に活用するために、偏りのない即応と偏りのある遅延変換を共同でモデル化する二分散モデリングフレームワークを更に開発する。
公立および工業用両方のデータセットの実験結果から,DEFUSEの優位性を検証した。
コードはhttps://github.com/ychen216/defuse.gitで入手できる。
関連論文リスト
- Contrastive Learning with Negative Sampling Correction [52.990001829393506]
PUCL(Positive-Unlabeled Contrastive Learning)という新しいコントラスト学習手法を提案する。
PUCLは生成した負のサンプルをラベルのないサンプルとして扱い、正のサンプルからの情報を用いて、対照的な損失のバイアスを補正する。
PUCLは一般的なコントラスト学習問題に適用でき、様々な画像やグラフの分類タスクにおいて最先端の手法より優れている。
論文 参考訳(メタデータ) (2024-01-13T11:18:18Z) - Mitigating Pooling Bias in E-commerce Search via False Negative Estimation [25.40402675846542]
Bias-mitigating Hard Negative Smplingは、偽陰性の特定と調整に適した新しいネガティブサンプリング戦略である。
検索実験により,BHNSがeコマースの実用化に有効であることが確認された。
論文 参考訳(メタデータ) (2023-11-11T00:22:57Z) - DPR: An Algorithm Mitigate Bias Accumulation in Recommendation feedback
loops [41.21024436158042]
フィードバックループと未知の露出メカニズムが推奨品質とユーザエクスペリエンスに与える影響について検討した。
本研究では,動的再重み付けを用いてクロスエフェクトを緩和する非バイアスアルゴリズムである動的パーソナライズランキング(textbfDPR)を提案する。
提案手法は,フィードバックループと未知の露出機構の負の効果を緩和するものである。
論文 参考訳(メタデータ) (2023-11-10T04:36:00Z) - Your Negative May not Be True Negative: Boosting Image-Text Matching
with False Negative Elimination [62.18768931714238]
提案手法は, サンプリングによる新規な偽陰性除去 (FNE) 戦略である。
その結果,提案した偽陰性除去戦略の優位性が示された。
論文 参考訳(メタデータ) (2023-08-08T16:31:43Z) - Generating Negative Samples for Sequential Recommendation [83.60655196391855]
逐次レコメンデーション(SR)のための負のサンプル(イテム)を生成することを提案する。
アイテムに対する現在のSRモデルの学習されたユーザの好みに基づいて、各タイムステップで負の項目をサンプリングする。
4つの公開データセットの実験は、SRに高品質な負のサンプルを提供することの重要性を検証する。
論文 参考訳(メタデータ) (2022-08-07T05:44:13Z) - Rethinking InfoNCE: How Many Negative Samples Do You Need? [54.146208195806636]
半定量的理論フレームワークを用いて, InfoNCE に最適化された負のサンプル数について検討した。
トレーニングの有効性関数を最大化する$K$値を用いて,最適負サンプリング比を推定する。
論文 参考訳(メタデータ) (2021-05-27T08:38:29Z) - Real Negatives Matter: Continuous Training with Real Negatives for
Delayed Feedback Modeling [10.828167195122072]
本稿では,リアルネガティブ(DEFER)を用いた遅延フィードバックモデルを提案する。
実際の負の摂取は、観察された特徴分布が実際の分布と同等であることを保証し、バイアスを低減する。
DEFERはAlibabaのディスプレイ広告システムにデプロイされており、いくつかのシナリオでCVRが6.4%改善されている。
論文 参考訳(メタデータ) (2021-04-29T05:37:34Z) - Capturing Delayed Feedback in Conversion Rate Prediction via
Elapsed-Time Sampling [29.77426549280091]
コンバージョンレート(CVR)予測は、デジタルディスプレイ広告において最も重要なタスクの1つである。
Elapsed-Time Smpling Delayed Feedback Model (ES-DFM) を提案する。
論文 参考訳(メタデータ) (2020-12-06T12:20:50Z) - Positive-Congruent Training: Towards Regression-Free Model Updates [87.25247195148187]
画像分類において、サンプルワイドの不整合は「負のフリップ」として現れる
新しいモデルは、古い(参照)モデルによって正しく分類されたテストサンプルの出力を誤って予測する。
そこで本研究では,PC トレーニングのための簡易なアプローチである Focal Distillation を提案する。
論文 参考訳(メタデータ) (2020-11-18T09:00:44Z) - Understanding Negative Sampling in Graph Representation Learning [87.35038268508414]
最適化目標と結果のばらつきを決定するためには, 正のサンプリングと同様に負のサンプリングが重要であることを示す。
我々は,自己コントラスト近似による正の分布を近似し,メトロポリス・ハスティングスによる負のサンプリングを高速化するメトロポリス・ハスティングス(MCNS)を提案する。
提案手法は,リンク予測,ノード分類,パーソナライズドレコメンデーションを含む,下流グラフ学習タスクをカバーする5つのデータセットに対して評価する。
論文 参考訳(メタデータ) (2020-05-20T06:25:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。