論文の概要: Stabilized Doubly Robust Learning for Recommendation on Data Missing Not
at Random
- arxiv url: http://arxiv.org/abs/2205.04701v1
- Date: Tue, 10 May 2022 07:04:53 GMT
- ステータス: 処理完了
- システム内更新日: 2022-05-12 17:48:31.432183
- Title: Stabilized Doubly Robust Learning for Recommendation on Data Missing Not
at Random
- Title(参考訳): ランダムでないデータに対するレコメンデーションのための安定化2倍強固な学習
- Authors: Haoxuan Li, Chunyuan Zheng, Xiao-Hua Zhou, Peng Wu
- Abstract要約: レコメンデーションシステムでは、ユーザはいつでも好きなアイテムを選んで評価する。
本稿では,2重頑健性を維持しつつ,上記の制約に対処する安定化2重頑健性(SDR)推定器を提案する。
さらに,より安定かつ正確な予測を達成し,計算,妥当性,予測モデルを周期的に更新する新しいSDR学習手法を提案する。
- 参考スコア(独自算出の注目度): 5.916742159203741
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In recommender systems, users always choose favorite items to rate, which
results in data missing not at random and poses a great challenge for unbiased
evaluation and learning of prediction models. Currently, the doubly robust (DR)
method and its variants have been widely studied and demonstrate superior
performance. However, we show that DR methods are unstable to extremely small
propensities and rely on extrapolations, resulting in sub-optimal performances.
In this paper, we propose a stabilized doubly robust (SDR) estimator to address
the above limitations while retaining double robustness. Theoretical analysis
shows that SDR has bounded bias, variance and generalization error bound under
inaccurate imputed errors and arbitrarily small propensities. In addition, we
propose a novel learning approach for SDR that updates the imputation,
propensity, and prediction models cyclically, achieving more stable and
accurate predictions. Extensive experiments show that our approach
significantly outperforms the existing methods.
- Abstract(参考訳): 推薦システムでは、ユーザは常に好んで評価するアイテムを選択するが、結果としてデータがランダムに失われることはなく、予測モデルのバイアスのない評価と学習には大きな課題となる。
現在、二重ロバスト(DR)法とその変種は広く研究され、優れた性能を示している。
しかし,DR法は極めて小さな確率に対して不安定であり,外挿に頼っていることが示される。
本稿では,2重頑健性を維持しつつ,上記の制約に対処する安定化2重頑健性(SDR)推定器を提案する。
理論的解析により、SDRは不正確な不正確な不正確な誤りと任意に小さな確率の下で有界バイアス、分散、一般化誤差を持つことが示された。
さらに,より安定かつ正確な予測を達成し,計算,妥当性,予測モデルを周期的に更新する新しいSDR学習手法を提案する。
広範な実験により,提案手法が既存の手法を大きく上回ることがわかった。
関連論文リスト
- CDR: Conservative Doubly Robust Learning for Debiased Recommendation [23.90593406172408]
Doubly Robust Learning (DR)はその顕著な性能とロバスト性のために大きな注目を集めている。
この問題に対処するため、本研究は、その平均と分散を精査することによって、命令をフィルタリングする保守的二重ロバスト戦略(CDR)を提案する。
論文 参考訳(メタデータ) (2023-08-13T08:10:56Z) - Conservative Prediction via Data-Driven Confidence Minimization [70.93946578046003]
機械学習の安全性クリティカルな応用においては、モデルが保守的であることが望ましいことが多い。
本研究では,不確実性データセットに対する信頼性を最小化するデータ駆動信頼性最小化フレームワークを提案する。
論文 参考訳(メタデータ) (2023-06-08T07:05:36Z) - Toward Reliable Human Pose Forecasting with Uncertainty [51.628234388046195]
我々は、複数のモデルを含む人間のポーズ予測のためのオープンソースのライブラリを開発し、複数のデータセットをサポートする。
我々は、パフォーマンスを高め、より良い信頼をもたらすために、問題の2つの不確実性を考案する。
論文 参考訳(メタデータ) (2023-04-13T17:56:08Z) - Reliability-Aware Prediction via Uncertainty Learning for Person Image
Retrieval [51.83967175585896]
UALは、データ不確実性とモデル不確実性を同時に考慮し、信頼性に配慮した予測を提供することを目的としている。
データ不確実性はサンプル固有のノイズを捕捉する」一方、モデル不確実性はサンプルの予測に対するモデルの信頼を表現している。
論文 参考訳(メタデータ) (2022-10-24T17:53:20Z) - Rethinking Missing Data: Aleatoric Uncertainty-Aware Recommendation [59.500347564280204]
本稿では, Aleatoric Uncertainty-aware Recommendation (AUR) フレームワークを提案する。
AURは、新しい不確実性推定器と通常のレコメンデータモデルで構成されている。
誤ラベルの可能性がペアの可能性を反映しているため、AURは不確実性に応じてレコメンデーションを行う。
論文 参考訳(メタデータ) (2022-09-22T04:32:51Z) - Multiple Robust Learning for Recommendation [13.06593469196849]
推薦システムでは、収集されたデータに様々なバイアスが存在することが一般的な問題である。
本稿では,不偏性を実現するために,複数の候補計算モデルと確率モデルを利用するマルチロバスト (MR) 推定器を提案する。
論文 参考訳(メタデータ) (2022-07-09T13:15:56Z) - Doubly Robust Collaborative Targeted Learning for Recommendation on Data
Missing Not at Random [6.563595953273317]
推薦システムでは、受信したフィードバックデータが常にランダムではない(MNAR)。
本稿では,エラー計算(EIB)法と二重頑健(DR)法の両方の利点を効果的に捉えるbf DR-TMLEを提案する。
我々はまた、bf DR-TMLE-TLと呼ばれるDR-TMLEのための新しいRCT非協調目標学習アルゴリズムを提案する。
論文 参考訳(メタデータ) (2022-03-19T06:48:50Z) - Doubly Robust Distributionally Robust Off-Policy Evaluation and Learning [59.02006924867438]
オフ政治評価と学習(OPE/L)は、オフラインの観察データを使用してより良い意思決定を行う。
近年の研究では、分散ロバストなOPE/L (DROPE/L) が提案されているが、この提案は逆正則重み付けに依存している。
KL分散不確実性集合を用いたDROPE/Lの最初のDRアルゴリズムを提案する。
論文 参考訳(メタデータ) (2022-02-19T20:00:44Z) - Enhanced Doubly Robust Learning for Debiasing Post-click Conversion Rate
Estimation [29.27760413892272]
クリック後の変換は、ユーザの好みを示す強いシグナルであり、レコメンデーションシステムを構築する上で有益である。
現在、ほとんどの既存の手法は、対実学習を利用してレコメンデーションシステムを破壊している。
本稿では,MRDR推定のための新しい二重学習手法を提案し,誤差計算を一般的なCVR推定に変換する。
論文 参考訳(メタデータ) (2021-05-28T06:59:49Z) - Understanding and Mitigating the Tradeoff Between Robustness and
Accuracy [88.51943635427709]
逆行訓練は、堅牢なエラーを改善するために、摂動でトレーニングセットを増強する。
拡張摂動が最適線形予測器からノイズのない観測を行う場合であっても,標準誤差は増大する可能性がある。
論文 参考訳(メタデータ) (2020-02-25T08:03:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。