論文の概要: Entire Space Counterfactual Learning: Tuning, Analytical Properties and
Industrial Applications
- arxiv url: http://arxiv.org/abs/2210.11039v1
- Date: Thu, 20 Oct 2022 06:19:50 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-21 13:11:49.740358
- Title: Entire Space Counterfactual Learning: Tuning, Analytical Properties and
Industrial Applications
- Title(参考訳): 全空間の反事実学習:調律、分析特性、産業応用
- Authors: Hao Wang, Zhichao Chen, Jiajun Fan, Yuxin Huang, Weiming Liu, Xinggao
Liu
- Abstract要約: クリック後変換率(CVR)の推定は、長い間、サンプル選択バイアスとデータ空間の問題に悩まされてきた。
本稿では,全空間対物マルチタスクモデル (ESCM$2$) を提案する。
- 参考スコア(独自算出の注目度): 5.9460659646670875
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: As a basic research problem for building effective recommender systems,
post-click conversion rate (CVR) estimation has long been plagued by sample
selection bias and data sparsity issues. To address the data sparsity issue,
prevalent methods based on entire space multi-task model leverage the
sequential pattern of user actions, i.e. exposure $\rightarrow$ click
$\rightarrow$ conversion to construct auxiliary learning tasks. However, they
still fall short of guaranteeing the unbiasedness of CVR estimates. This paper
theoretically demonstrates two defects of these entire space multi-task models:
(1) inherent estimation bias (IEB) for CVR estimation, where the CVR estimate
is inherently higher than the ground truth; (2) potential independence priority
(PIP) for CTCVR estimation, where the causality from click to conversion might
be overlooked. This paper further proposes a principled method named entire
space counterfactual multi-task model (ESCM$^2$), which employs a
counterfactual risk minimizer to handle both IEB and PIP issues at once. To
demonstrate the effectiveness of the proposed method, this paper explores its
parameter tuning in practice, derives its analytic properties, and showcases
its effectiveness in industrial CVR estimation, where ESCM$^2$ can effectively
alleviate the intrinsic IEB and PIP issues and outperform baseline models.
- Abstract(参考訳): 効果的なレコメンデーションシステムを構築するための基本的な研究課題として、クリック後変換率(CVR)の推定は、長い間サンプル選択バイアスやデータ空間の問題に悩まされてきた。
データスパーシティ問題に対処するために、スペースマルチタスクモデル全体に基づく一般的なメソッドは、ユーザアクションのシーケンシャルなパターン(例えば、expert $\rightarrow$click $\rightarrow$ conversionを利用して補助学習タスクを構築する。
しかし、CVR推定の不偏性を保証するには至っていない。
本稿では,(1)cvr推定が基礎的真理よりも本質的に高いcvr推定のための固有推定バイアス (ieb) ,(2)クリックから変換までの因果関係を見落としうるctcvr推定のための潜在的独立優先度 (pip) の2つの欠陥を理論的に示す。
本稿ではさらに,ieb問題とpip問題の両方を同時処理する反事実リスク最小化器を用いた,全空間反事実マルチタスクモデル(escm$^2$)を提案する。
提案手法の有効性を実証するため,本論文では,本手法のパラメータチューニングを行い,その解析特性を導出し,escm$^2$が内在するiebおよびpip問題やベースラインモデルよりも優れる産業用cvr推定法の有効性を示す。
関連論文リスト
- Online non-parametric likelihood-ratio estimation by Pearson-divergence
functional minimization [55.98760097296213]
iid 観測のペア $(x_t sim p, x'_t sim q)$ が時間の経過とともに観測されるような,オンラインな非パラメトリック LRE (OLRE) のための新しいフレームワークを提案する。
本稿では,OLRE法の性能に関する理論的保証と,合成実験における実証的検証について述べる。
論文 参考訳(メタデータ) (2023-11-03T13:20:11Z) - On the Theory of Risk-Aware Agents: Bridging Actor-Critic and Economics [0.7655800373514546]
リスク対応強化学習アルゴリズムは、さまざまな継続的なタスクにおいて、リスクニュートラルなアルゴリズムよりも優れていた。
これらのアルゴリズムが採用する悲観的目的の理論的基礎は、まだ確立されていない。
本稿では,2つのアクターネットワークを特徴とするリスク認識型モデルフリーアルゴリズムとして,Dual Actor-Critic (DAC)を提案する。
論文 参考訳(メタデータ) (2023-10-30T13:28:06Z) - Consensus-Adaptive RANSAC [104.87576373187426]
本稿では,パラメータ空間の探索を学習する新しいRANSACフレームワークを提案する。
注意機構は、ポイント・ツー・モデル残差のバッチで動作し、軽量のワンステップ・トランスフォーマーで見いだされたコンセンサスを考慮するために、ポイント・ツー・モデル推定状態を更新する。
論文 参考訳(メタデータ) (2023-07-26T08:25:46Z) - Uncertainty-Aware Instance Reweighting for Off-Policy Learning [63.31923483172859]
本研究では,不確実性を考慮した逆確率スコア推定器 (UIPS) を提案する。
実世界の3つのレコメンデーションデータセットを用いた実験結果から,提案したUIPS推定器の有効サンプル効率が示された。
論文 参考訳(メタデータ) (2023-03-11T11:42:26Z) - A Generalized Doubly Robust Learning Framework for Debiasing Post-Click
Conversion Rate Prediction [23.340584290411208]
クリック後変換率(CVR)予測は、ユーザの興味を見つけ、プラットフォーム収益を増やすための重要なタスクである。
現在、Doublely robust(DR)学習アプローチは、CVR予測を損なうための最先端のパフォーマンスを実現している。
本稿では,DR損失のバイアスを制御し,バイアスと分散を柔軟にバランスするDR-BIASとDR-MSEの2つの新しいDR手法を提案する。
論文 参考訳(メタデータ) (2022-11-12T15:09:23Z) - Value-Consistent Representation Learning for Data-Efficient
Reinforcement Learning [105.70602423944148]
本稿では,意思決定に直接関連のある表現を学習するための,VCR(Value-Consistent Expression Learning)という新しい手法を提案する。
この想像された状態と環境によって返される実状態とを一致させる代わりに、VCRは両方の状態に$Q$-valueヘッドを適用し、2つのアクション値の分布を得る。
検索不要なRLアルゴリズムに対して,提案手法が新たな最先端性能を実現することが実証された。
論文 参考訳(メタデータ) (2022-06-25T03:02:25Z) - ESCM$^2$: Entire Space Counterfactual Multi-Task Model for Post-Click
Conversion Rate Estimation [14.346868328637115]
ESMM(Entire Space Multi-task Model)ファミリーのメソッドは、データ空間の問題に対処するために、ユーザアクションのシーケンシャルなパターンを活用する。
ESMMは、独立推定バイアス(IEB)と潜在的独立優先性(PIP)の問題に悩まされている。
我々は,正則化器として反現実的リスクミミライザを用いる,Entire Space Counterfactual Multi-task Modelling (ESCM$2$) という原理的アプローチを考案した。
論文 参考訳(メタデータ) (2022-04-03T08:12:27Z) - Leveraging Unlabeled Data to Predict Out-of-Distribution Performance [63.740181251997306]
実世界の機械学習デプロイメントは、ソース(トレーニング)とターゲット(テスト)ディストリビューションのミスマッチによって特徴づけられる。
本研究では,ラベル付きソースデータとラベルなしターゲットデータのみを用いて,対象領域の精度を予測する手法を検討する。
本稿では,モデルの信頼度をしきい値として学習し,精度をラベルなし例のごく一部として予測する実践的手法である平均閾値保持信頼度(ATC)を提案する。
論文 参考訳(メタデータ) (2022-01-11T23:01:12Z) - Enhanced Doubly Robust Learning for Debiasing Post-click Conversion Rate
Estimation [29.27760413892272]
クリック後の変換は、ユーザの好みを示す強いシグナルであり、レコメンデーションシステムを構築する上で有益である。
現在、ほとんどの既存の手法は、対実学習を利用してレコメンデーションシステムを破壊している。
本稿では,MRDR推定のための新しい二重学習手法を提案し,誤差計算を一般的なCVR推定に変換する。
論文 参考訳(メタデータ) (2021-05-28T06:59:49Z) - Exploiting Submodular Value Functions For Scaling Up Active Perception [60.81276437097671]
アクティブな知覚タスクでは、エージェントは1つ以上の隠れ変数の不確実性を減少させる感覚行動を選択することを目的としている。
部分的に観測可能なマルコフ決定過程(POMDP)は、そのような問題に対する自然なモデルを提供する。
エージェントが利用できるセンサーの数が増えるにつれて、POMDP計画の計算コストは指数関数的に増加する。
論文 参考訳(メタデータ) (2020-09-21T09:11:36Z) - LT4REC:A Lottery Ticket Hypothesis Based Multi-task Practice for Video
Recommendation System [2.7174057828883504]
クリックスルーレート予測(CTR)とクリック後変換レート予測(CVR)は、すべての産業ランキングシステムにおいて重要な役割を果たす。
本稿では,マルチタスク学習における宝くじをベースとしたスパース学習の導入により,CVRを新たな手法でモデル化する。
Tencentビデオのレコメンデーションシステムのトラフィックログから収集されたデータセットの実験は、CVRモデルのスパース共有が競合する手法を大幅に上回ることを示した。
論文 参考訳(メタデータ) (2020-08-22T16:48:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。