論文の概要: StableDR: Stabilized Doubly Robust Learning for Recommendation on Data
Missing Not at Random
- arxiv url: http://arxiv.org/abs/2205.04701v3
- Date: Wed, 23 Aug 2023 18:42:36 GMT
- ステータス: 処理完了
- システム内更新日: 2023-08-25 19:00:48.925013
- Title: StableDR: Stabilized Doubly Robust Learning for Recommendation on Data
Missing Not at Random
- Title(参考訳): StableDR: ランダムではなくデータの欠落を推奨する2倍のロバスト学習
- Authors: Haoxuan Li, Chunyuan Zheng, Peng Wu
- Abstract要約: 二重ロバスト (DR) 法は不安定であり, 偏差, 分散, 一般化が極めて小さい。
本稿では,外挿への依存度を弱める2重頑健(StableDR)学習手法を提案する。
さらに,本論文では,不規則性,妥当性,予測モデルを周期的に更新する新しいStableDRの学習手法を提案する。
- 参考スコア(独自算出の注目度): 16.700598755439685
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In recommender systems, users always choose the favorite items to rate, which
leads to data missing not at random and poses a great challenge for unbiased
evaluation and learning of prediction models. Currently, the doubly robust (DR)
methods have been widely studied and demonstrate superior performance. However,
in this paper, we show that DR methods are unstable and have unbounded bias,
variance, and generalization bounds to extremely small propensities. Moreover,
the fact that DR relies more on extrapolation will lead to suboptimal
performance. To address the above limitations while retaining double
robustness, we propose a stabilized doubly robust (StableDR) learning approach
with a weaker reliance on extrapolation. Theoretical analysis shows that
StableDR has bounded bias, variance, and generalization error bound
simultaneously under inaccurate imputed errors and arbitrarily small
propensities. In addition, we propose a novel learning approach for StableDR
that updates the imputation, propensity, and prediction models cyclically,
achieving more stable and accurate predictions. Extensive experiments show that
our approaches significantly outperform the existing methods.
- Abstract(参考訳): 推薦システムでは、ユーザは常に評価対象の項目を選択する。これはデータがランダムに失われず、予測モデルのバイアスのない評価と学習には大きな課題となる。
現在、二重ロバスト(dr)法は広く研究され、優れた性能を示している。
しかし,本論文ではDR法が不安定であり,非有界バイアス,分散,一般化が極めて小さな確率に限定されていることを示す。
さらに、DRが外挿に依存しているという事実は、最適以下の性能をもたらす。
ダブルロバスト性を維持しつつ,上記の制約に対処するために,外挿に依存しない安定化2重ロバスト(stabledr)学習手法を提案する。
理論的解析により、stabledr は不正確な不正確な誤差と任意に小さい確率の下で同時に束縛された有界バイアス、分散、一般化誤差を持つことが示されている。
さらに,より安定かつ正確な予測を達成し,計算,妥当性,予測モデルを循環的に更新する,StableDRの新しい学習手法を提案する。
広範な実験により,我々のアプローチは既存の手法を大きく上回ることがわかった。
関連論文リスト
- CDR: Conservative Doubly Robust Learning for Debiased Recommendation [23.90593406172408]
Doubly Robust Learning (DR)はその顕著な性能とロバスト性のために大きな注目を集めている。
この問題に対処するため、本研究は、その平均と分散を精査することによって、命令をフィルタリングする保守的二重ロバスト戦略(CDR)を提案する。
論文 参考訳(メタデータ) (2023-08-13T08:10:56Z) - Conservative Prediction via Data-Driven Confidence Minimization [70.93946578046003]
機械学習の安全性クリティカルな応用においては、モデルが保守的であることが望ましいことが多い。
本研究では,不確実性データセットに対する信頼性を最小化するデータ駆動信頼性最小化フレームワークを提案する。
論文 参考訳(メタデータ) (2023-06-08T07:05:36Z) - Toward Reliable Human Pose Forecasting with Uncertainty [51.628234388046195]
我々は、複数のモデルを含む人間のポーズ予測のためのオープンソースのライブラリを開発し、複数のデータセットをサポートする。
我々は、パフォーマンスを高め、より良い信頼をもたらすために、問題の2つの不確実性を考案する。
論文 参考訳(メタデータ) (2023-04-13T17:56:08Z) - Reliability-Aware Prediction via Uncertainty Learning for Person Image
Retrieval [51.83967175585896]
UALは、データ不確実性とモデル不確実性を同時に考慮し、信頼性に配慮した予測を提供することを目的としている。
データ不確実性はサンプル固有のノイズを捕捉する」一方、モデル不確実性はサンプルの予測に対するモデルの信頼を表現している。
論文 参考訳(メタデータ) (2022-10-24T17:53:20Z) - Rethinking Missing Data: Aleatoric Uncertainty-Aware Recommendation [59.500347564280204]
本稿では, Aleatoric Uncertainty-aware Recommendation (AUR) フレームワークを提案する。
AURは、新しい不確実性推定器と通常のレコメンデータモデルで構成されている。
誤ラベルの可能性がペアの可能性を反映しているため、AURは不確実性に応じてレコメンデーションを行う。
論文 参考訳(メタデータ) (2022-09-22T04:32:51Z) - Multiple Robust Learning for Recommendation [13.06593469196849]
推薦システムでは、収集されたデータに様々なバイアスが存在することが一般的な問題である。
本稿では,不偏性を実現するために,複数の候補計算モデルと確率モデルを利用するマルチロバスト (MR) 推定器を提案する。
論文 参考訳(メタデータ) (2022-07-09T13:15:56Z) - Doubly Robust Collaborative Targeted Learning for Recommendation on Data
Missing Not at Random [6.563595953273317]
推薦システムでは、受信したフィードバックデータが常にランダムではない(MNAR)。
本稿では,エラー計算(EIB)法と二重頑健(DR)法の両方の利点を効果的に捉えるbf DR-TMLEを提案する。
我々はまた、bf DR-TMLE-TLと呼ばれるDR-TMLEのための新しいRCT非協調目標学習アルゴリズムを提案する。
論文 参考訳(メタデータ) (2022-03-19T06:48:50Z) - Doubly Robust Distributionally Robust Off-Policy Evaluation and Learning [59.02006924867438]
オフ政治評価と学習(OPE/L)は、オフラインの観察データを使用してより良い意思決定を行う。
近年の研究では、分散ロバストなOPE/L (DROPE/L) が提案されているが、この提案は逆正則重み付けに依存している。
KL分散不確実性集合を用いたDROPE/Lの最初のDRアルゴリズムを提案する。
論文 参考訳(メタデータ) (2022-02-19T20:00:44Z) - Enhanced Doubly Robust Learning for Debiasing Post-click Conversion Rate
Estimation [29.27760413892272]
クリック後の変換は、ユーザの好みを示す強いシグナルであり、レコメンデーションシステムを構築する上で有益である。
現在、ほとんどの既存の手法は、対実学習を利用してレコメンデーションシステムを破壊している。
本稿では,MRDR推定のための新しい二重学習手法を提案し,誤差計算を一般的なCVR推定に変換する。
論文 参考訳(メタデータ) (2021-05-28T06:59:49Z) - Understanding and Mitigating the Tradeoff Between Robustness and
Accuracy [88.51943635427709]
逆行訓練は、堅牢なエラーを改善するために、摂動でトレーニングセットを増強する。
拡張摂動が最適線形予測器からノイズのない観測を行う場合であっても,標準誤差は増大する可能性がある。
論文 参考訳(メタデータ) (2020-02-25T08:03:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。