論文の概要: ESCM$^2$: Entire Space Counterfactual Multi-Task Model for Post-Click
Conversion Rate Estimation
- arxiv url: http://arxiv.org/abs/2204.05125v1
- Date: Sun, 3 Apr 2022 08:12:27 GMT
- ステータス: 処理完了
- システム内更新日: 2022-04-17 07:08:09.501076
- Title: ESCM$^2$: Entire Space Counterfactual Multi-Task Model for Post-Click
Conversion Rate Estimation
- Title(参考訳): escm$^2$: クリック後変換率推定のための空間偽のマルチタスクモデル
- Authors: Hao Wang, Tai-Wei Chang, Tianqiao Liu, Jianmin Huang, Zhichao Chen,
Chao Yu, Ruopeng Li, Wei Chu
- Abstract要約: ESMM(Entire Space Multi-task Model)ファミリーのメソッドは、データ空間の問題に対処するために、ユーザアクションのシーケンシャルなパターンを活用する。
ESMMは、独立推定バイアス(IEB)と潜在的独立優先性(PIP)の問題に悩まされている。
我々は,正則化器として反現実的リスクミミライザを用いる,Entire Space Counterfactual Multi-task Modelling (ESCM$2$) という原理的アプローチを考案した。
- 参考スコア(独自算出の注目度): 14.346868328637115
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Accurate estimation of post-click conversion rate is critical for building
recommender systems, which has long been confronted with sample selection bias
and data sparsity issues. Methods in the Entire Space Multi-task Model (ESMM)
family leverage the sequential pattern of user actions, i.e.
$impression\rightarrow click \rightarrow conversion$ to address data sparsity
issue. However, they still fail to ensure the unbiasedness of CVR estimates. In
this paper, we theoretically demonstrate that ESMM suffers from the following
two problems: (1) Inherent Estimation Bias (IEB), where the estimated CVR of
ESMM is inherently higher than the ground truth; (2) Potential Independence
Priority (PIP) for CTCVR estimation, where there is a risk that the ESMM
overlooks the causality from click to conversion. To this end, we devise a
principled approach named Entire Space Counterfactual Multi-task Modelling
(ESCM$^2$), which employs a counterfactual risk miminizer as a regularizer in
ESMM to address both IEB and PIP issues simultaneously. Extensive experiments
on offline datasets and online environments demonstrate that our proposed
ESCM$^2$ can largely mitigate the inherent IEB and PIP issues and achieve
better performance than baseline models.
- Abstract(参考訳): クリック後の変換率の正確な推定は、サンプル選択バイアスやデータのスパーシティの問題に直面してきたレコメンダシステムの構築に不可欠である。
スペース全体のマルチタスクモデル(esmm)のメソッドは、データのスパーシティ問題に対処するために$impression\rightarrow click \rightarrow conversion$という、ユーザアクションのシーケンシャルなパターンを利用する。
しかし、彼らは依然としてCVR推定の不偏性を保証することに失敗している。
本稿では,(1) ESMM の CVR が本質的に基礎的真理よりも高い不連続推定バイアス (IEB) ,(2) CTCVR 推定における潜在的独立優先性 (PIP) ,(2) ESMM がクリックから変換への因果性を見落としているリスクがある,という2つの問題を理論的に証明する。
この目的のために、ESMMの正則化器として反ファクトリスクミミライザを用いたEntire Space Counterfactual Multi-task Modelling (ESCM$^2$) を考案し、IEBとPIPの両問題に同時に対処する。
オフラインデータセットとオンライン環境に関する大規模な実験により、提案したESCM$^2$は、固有のIPBとPIPの問題を大幅に軽減し、ベースラインモデルよりも優れたパフォーマンスを実現することができることを示した。
関連論文リスト
- SureMap: Simultaneous Mean Estimation for Single-Task and Multi-Task Disaggregated Evaluation [75.56845750400116]
分散評価(disaggregated evaluation) -- 異なるサブポピュレーション上での機械学習モデルのパフォーマンスの推定 - は、AIシステムのパフォーマンスとグループフェアネスを評価する上で、中核的なタスクである。
ブラックボックスモデルの評価において,マルチタスクとシングルタスクの双方に対して高い推定精度を持つSureMapを開発した。
提案手法は, ウェル・チョーゼンを用いた最大後部推定と, スタインの非バイアスリスク推定(SURE)によるクロスバリデーションフリーチューニングを併用する。
論文 参考訳(メタデータ) (2024-11-14T17:53:35Z) - Near-Optimal Dynamic Regret for Adversarial Linear Mixture MDPs [63.47351876442425]
本研究は,完全情報フィードバックの下で,相変わらずの相変わらずの線形混合MDPについて検討した。
本稿では,占領率に基づく手法と政策に基づく手法の利点を組み合わせた新しいアルゴリズムを提案する。
我々のアルゴリズムは$widetildemathcalO(d sqrtH3 K + sqrtHK(H + barP_K$)$ dynamic regret, ここで$d$は特徴次元である。
論文 参考訳(メタデータ) (2024-11-05T13:55:52Z) - Pairwise Ranking Loss for Multi-Task Learning in Recommender Systems [8.824514065551865]
オンライン広告システムでは、Click-Through Rate (CTR) や Conversion Rate (CVR) といったタスクが同時に MTL 問題として扱われることが多い。
本研究では,変換に対応する露光ラベルを決定指標とみなす。
モデル予測間でのtextbfairtextbfwise textbf ranking(PWiseR)損失を計算し、タスク固有の損失を新たに導入する。
論文 参考訳(メタデータ) (2024-06-04T09:52:41Z) - DFedADMM: Dual Constraints Controlled Model Inconsistency for
Decentralized Federated Learning [52.83811558753284]
分散学習(DFL)は、中央サーバーを捨て、分散通信ネットワークを確立する。
既存のDFL手法は依然として、局所的な矛盾と局所的な過度なオーバーフィッティングという2つの大きな課題に悩まされている。
論文 参考訳(メタデータ) (2023-08-16T11:22:36Z) - ESMC: Entire Space Multi-Task Model for Post-Click Conversion Rate via
Parameter Constraint [38.561040267729105]
本稿では,制約実験によるクリック後変換率の空間マルチタスクモデルを提案する。
我々は,「Exposure_click_in-shop action」と「in-shop action_purchase」を個別に扱う。
論文 参考訳(メタデータ) (2023-07-18T12:25:40Z) - Double Pessimism is Provably Efficient for Distributionally Robust
Offline Reinforcement Learning: Generic Algorithm and Robust Partial Coverage [15.858892479232656]
頑健なオフライン強化学習(ロバストオフラインRL)について検討する。
我々は、Douubly Pessimistic Model-based Policy Optimization(P2MPO$)と呼ばれる汎用アルゴリズムフレームワークを提案する。
P2MPO$は$tildemathcalO(n-1/2)$コンバーゼンスレートで、$n$はデータセットサイズである。
論文 参考訳(メタデータ) (2023-05-16T17:58:05Z) - Entire Space Counterfactual Learning: Tuning, Analytical Properties and
Industrial Applications [5.9460659646670875]
クリック後変換率(CVR)の推定は、長い間、サンプル選択バイアスとデータ空間の問題に悩まされてきた。
本稿では,全空間対物マルチタスクモデル (ESCM$2$) を提案する。
論文 参考訳(メタデータ) (2022-10-20T06:19:50Z) - Consistent Training and Decoding For End-to-end Speech Recognition Using
Lattice-free MMI [67.13999010060057]
本稿では,LF-MMI基準をE2E ASRフレームワークに統合する新たな手法を提案する。
LF-MMI基準の導入は、一貫して大きなパフォーマンス改善をもたらすことが実験的に示唆されている。
論文 参考訳(メタデータ) (2021-12-05T07:30:17Z) - Predicting Status of Pre and Post M&A Deals Using Machine Learning and
Deep Learning Techniques [0.0]
リスク仲裁または合併仲裁は、M&A取引の成功を推測する投資戦略である。
事前の取引状況の予測は、リスク仲裁者にとって非常に重要である。
本稿では,買収成功予測問題に対するMLとDLに基づく手法を提案する。
論文 参考訳(メタデータ) (2021-08-05T21:26:45Z) - Adaptive Stochastic ADMM for Decentralized Reinforcement Learning in
Edge Industrial IoT [106.83952081124195]
強化学習 (Reinforcement Learning, RL) は, 意思決定および最適制御プロセスのための有望な解法として広く研究されている。
本稿では,Adaptive ADMM (asI-ADMM)アルゴリズムを提案する。
実験の結果,提案アルゴリズムは通信コストやスケーラビリティの観点から技術状況よりも優れており,複雑なIoT環境に適応できることがわかった。
論文 参考訳(メタデータ) (2021-06-30T16:49:07Z) - Iterative Feature Matching: Toward Provable Domain Generalization with
Logarithmic Environments [55.24895403089543]
ドメインの一般化は、限られた数のトレーニング環境からのデータで、目に見えないテスト環境でうまく機能することを目的としています。
我々は,O(logd_s)$環境のみを見た後に一般化する予測器を高確率で生成することを保証する反復的特徴マッチングに基づく新しいアルゴリズムを提案する。
論文 参考訳(メタデータ) (2021-06-18T04:39:19Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。