論文の概要: Enhanced Doubly Robust Learning for Debiasing Post-click Conversion Rate
Estimation
- arxiv url: http://arxiv.org/abs/2105.13623v1
- Date: Fri, 28 May 2021 06:59:49 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-31 13:26:40.005975
- Title: Enhanced Doubly Robust Learning for Debiasing Post-click Conversion Rate
Estimation
- Title(参考訳): ダブルロバスト学習によるクリック後変換率推定
- Authors: Siyuan Guo, Lixin Zou, Yiding Liu, Wenwen Ye, Suqi Cheng, Shuaiqiang
Wang, Hechang Chen, Dawei Yin, Yi Chang
- Abstract要約: クリック後の変換は、ユーザの好みを示す強いシグナルであり、レコメンデーションシステムを構築する上で有益である。
現在、ほとんどの既存の手法は、対実学習を利用してレコメンデーションシステムを破壊している。
本稿では,MRDR推定のための新しい二重学習手法を提案し,誤差計算を一般的なCVR推定に変換する。
- 参考スコア(独自算出の注目度): 29.27760413892272
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Post-click conversion, as a strong signal indicating the user preference, is
salutary for building recommender systems. However, accurately estimating the
post-click conversion rate (CVR) is challenging due to the selection bias,
i.e., the observed clicked events usually happen on users' preferred items.
Currently, most existing methods utilize counterfactual learning to debias
recommender systems. Among them, the doubly robust (DR) estimator has achieved
competitive performance by combining the error imputation based (EIB) estimator
and the inverse propensity score (IPS) estimator in a doubly robust way.
However, inaccurate error imputation may result in its higher variance than the
IPS estimator. Worse still, existing methods typically use simple
model-agnostic methods to estimate the imputation error, which are not
sufficient to approximate the dynamically changing model-correlated target
(i.e., the gradient direction of the prediction model). To solve these
problems, we first derive the bias and variance of the DR estimator. Based on
it, a more robust doubly robust (MRDR) estimator has been proposed to further
reduce its variance while retaining its double robustness. Moreover, we propose
a novel double learning approach for the MRDR estimator, which can convert the
error imputation into the general CVR estimation. Besides, we empirically
verify that the proposed learning scheme can further eliminate the high
variance problem of the imputation learning. To evaluate its effectiveness,
extensive experiments are conducted on a semi-synthetic dataset and two
real-world datasets. The results demonstrate the superiority of the proposed
approach over the state-of-the-art methods. The code is available at
https://github.com/guosyjlu/MRDR-DL.
- Abstract(参考訳): クリック後の変換は、ユーザの好みを示す強いシグナルであり、レコメンデーションシステムを構築する上で有益である。
しかし、クリック後変換率(cvr)を正確に推定することは、選択バイアス、すなわち観察されたクリック後のイベントがユーザーの好みのアイテムに発生するため難しい。
現在、ほとんどの既存の手法は、対実学習を利用してレコメンデーションシステムを破壊している。
その内、二重頑健な(DR)推定器は、誤差計算に基づく(EIB)推定器と逆確率スコア(IPS)推定器を二重頑健な方法で組み合わせて競合性能を達成している。
しかし、不正確な誤り計算はIPS推定器よりも高いばらつきをもたらす可能性がある。
さらに悪いことに、既存の手法は単純なモデルに依存しない手法を使ってインプテーションエラーを推定するが、これは動的に変化するモデル相関対象(すなわち予測モデルの勾配方向)を近似するには不十分である。
これらの問題を解決するために,まず, dr推定器のバイアスと分散を導出する。
これに基づいて、より頑健な二重剛性(MRDR)推定器が提案され、その二重剛性を維持しながら、その分散をさらに減少させる。
さらに,MRDR推定器に対する新しい二重学習手法を提案し,誤差計算を一般的なCVR推定に変換する。
さらに,提案手法により,命令型学習の高分散問題をさらに解消することができることを実証的に検証した。
その効果を評価するために、半合成データセットと2つの実世界のデータセットで広範な実験を行う。
その結果,最先端手法に対する提案手法の優位性が示された。
コードはhttps://github.com/guosyjlu/MRDR-DLで公開されている。
関連論文リスト
- Debiased Recommendation with Noisy Feedback [41.38490962524047]
収集データ中のMNARとOMEから予測モデルの非バイアス学習に対する交差点脅威について検討する。
まず, OME-EIB, OME-IPS, OME-DR推定器を設計する。
論文 参考訳(メタデータ) (2024-06-24T23:42:18Z) - A Generalized Doubly Robust Learning Framework for Debiasing Post-Click
Conversion Rate Prediction [23.340584290411208]
クリック後変換率(CVR)予測は、ユーザの興味を見つけ、プラットフォーム収益を増やすための重要なタスクである。
現在、Doublely robust(DR)学習アプローチは、CVR予測を損なうための最先端のパフォーマンスを実現している。
本稿では,DR損失のバイアスを制御し,バイアスと分散を柔軟にバランスするDR-BIASとDR-MSEの2つの新しいDR手法を提案する。
論文 参考訳(メタデータ) (2022-11-12T15:09:23Z) - Rethinking Missing Data: Aleatoric Uncertainty-Aware Recommendation [59.500347564280204]
本稿では, Aleatoric Uncertainty-aware Recommendation (AUR) フレームワークを提案する。
AURは、新しい不確実性推定器と通常のレコメンデータモデルで構成されている。
誤ラベルの可能性がペアの可能性を反映しているため、AURは不確実性に応じてレコメンデーションを行う。
論文 参考訳(メタデータ) (2022-09-22T04:32:51Z) - Multiple Robust Learning for Recommendation [13.06593469196849]
推薦システムでは、収集されたデータに様々なバイアスが存在することが一般的な問題である。
本稿では,不偏性を実現するために,複数の候補計算モデルと確率モデルを利用するマルチロバスト (MR) 推定器を提案する。
論文 参考訳(メタデータ) (2022-07-09T13:15:56Z) - Debiasing Learning for Membership Inference Attacks Against Recommender
Systems [79.48353547307887]
学習されたレコメンデータシステムは、トレーニングデータに関する情報を不注意に漏洩させ、プライバシー侵害につながる可能性がある。
我々は,推薦者システムによるプライバシー上の脅威を,会員推定のレンズを通して調査する。
本稿では,4つの主要コンポーネントを持つリコメンダシステム(DL-MIA)フレームワークに対する,メンバシップ推論攻撃に対するバイアス学習を提案する。
論文 参考訳(メタデータ) (2022-06-24T17:57:34Z) - StableDR: Stabilized Doubly Robust Learning for Recommendation on Data
Missing Not at Random [16.700598755439685]
二重ロバスト (DR) 法は不安定であり, 偏差, 分散, 一般化が極めて小さい。
本稿では,外挿への依存度を弱める2重頑健(StableDR)学習手法を提案する。
さらに,本論文では,不規則性,妥当性,予測モデルを周期的に更新する新しいStableDRの学習手法を提案する。
論文 参考訳(メタデータ) (2022-05-10T07:04:53Z) - Cross Pairwise Ranking for Unbiased Item Recommendation [57.71258289870123]
我々はCPR(Cross Pairwise Ranking)という新しい学習パラダイムを開発する。
CPRは、露出メカニズムを知らずに不偏の推奨を達成する。
理論的には、この方法が学習に対するユーザ/イテムの適合性の影響を相殺することを証明する。
論文 参考訳(メタデータ) (2022-04-26T09:20:27Z) - Doubly Robust Collaborative Targeted Learning for Recommendation on Data
Missing Not at Random [6.563595953273317]
推薦システムでは、受信したフィードバックデータが常にランダムではない(MNAR)。
本稿では,エラー計算(EIB)法と二重頑健(DR)法の両方の利点を効果的に捉えるbf DR-TMLEを提案する。
我々はまた、bf DR-TMLE-TLと呼ばれるDR-TMLEのための新しいRCT非協調目標学習アルゴリズムを提案する。
論文 参考訳(メタデータ) (2022-03-19T06:48:50Z) - Doubly Robust Distributionally Robust Off-Policy Evaluation and Learning [59.02006924867438]
オフ政治評価と学習(OPE/L)は、オフラインの観察データを使用してより良い意思決定を行う。
近年の研究では、分散ロバストなOPE/L (DROPE/L) が提案されているが、この提案は逆正則重み付けに依存している。
KL分散不確実性集合を用いたDROPE/Lの最初のDRアルゴリズムを提案する。
論文 参考訳(メタデータ) (2022-02-19T20:00:44Z) - Learning to Estimate Without Bias [57.82628598276623]
ガウスの定理は、重み付き最小二乗推定器は線形モデルにおける線形最小分散アンバイアスド推定(MVUE)であると述べている。
本稿では、バイアス制約のあるディープラーニングを用いて、この結果を非線形設定に拡張する第一歩を踏み出す。
BCEの第二の動機は、同じ未知の複数の推定値が平均化されてパフォーマンスが向上するアプリケーションにおいてである。
論文 参考訳(メタデータ) (2021-10-24T10:23:51Z) - Machine learning for causal inference: on the use of cross-fit
estimators [77.34726150561087]
より優れた統計特性を得るために、二重ローバストなクロスフィット推定器が提案されている。
平均因果効果(ACE)に対する複数の推定器の性能評価のためのシミュレーション研究を行った。
機械学習で使用する場合、二重確率のクロスフィット推定器は、バイアス、分散、信頼区間のカバレッジで他のすべての推定器よりも大幅に優れていた。
論文 参考訳(メタデータ) (2020-04-21T23:09:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。