論文の概要: CDR: Conservative Doubly Robust Learning for Debiased Recommendation
- arxiv url: http://arxiv.org/abs/2308.08461v2
- Date: Thu, 17 Aug 2023 05:30:03 GMT
- ステータス: 処理完了
- システム内更新日: 2023-08-21 21:58:30.180945
- Title: CDR: Conservative Doubly Robust Learning for Debiased Recommendation
- Title(参考訳): CDR:デバイアスドレコメンデーションのための保守的二重ロバスト学習
- Authors: ZiJie Song, JiaWei Chen, Sheng Zhou, QiHao Shi, Yan Feng, Chun Chen
and Can Wang
- Abstract要約: Doubly Robust Learning (DR)はその顕著な性能とロバスト性のために大きな注目を集めている。
この問題に対処するため、本研究は、その平均と分散を精査することによって、命令をフィルタリングする保守的二重ロバスト戦略(CDR)を提案する。
- 参考スコア(独自算出の注目度): 23.90593406172408
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In recommendation systems (RS), user behavior data is observational rather
than experimental, resulting in widespread bias in the data. Consequently,
tackling bias has emerged as a major challenge in the field of recommendation
systems. Recently, Doubly Robust Learning (DR) has gained significant attention
due to its remarkable performance and robust properties. However, our
experimental findings indicate that existing DR methods are severely impacted
by the presence of so-called Poisonous Imputation, where the imputation
significantly deviates from the truth and becomes counterproductive.
To address this issue, this work proposes Conservative Doubly Robust strategy
(CDR) which filters imputations by scrutinizing their mean and variance.
Theoretical analyses show that CDR offers reduced variance and improved tail
bounds.In addition, our experimental investigations illustrate that CDR
significantly enhances performance and can indeed reduce the frequency of
poisonous imputation.
- Abstract(参考訳): レコメンデーションシステム(RS)では、ユーザー行動データは実験よりも観察的であり、データに広範なバイアスをもたらす。
その結果、バイアスに取り組むことは、レコメンデーションシステムの分野で大きな課題となっている。
近年,Doubly Robust Learning (DR) が注目されている。
しかし,本研究の結果から,既存のDR法はいわゆるPisonous Imputationの存在によって深刻な影響を受けていることが示唆された。
この問題に対処するため、本研究では、その平均と分散を精査し、計算をフィルタリングする保守的二重ロバスト戦略(CDR)を提案する。
理論的解析により,CDRはばらつきを低減し,尾部境界が改善していることが明らかとなった。また,本研究では,CDRが性能を著しく向上し,有毒なインキュベーションの頻度を低減できることを示す実験的検討を行った。
関連論文リスト
- Controlling Risk of Retrieval-augmented Generation: A Counterfactual Prompting Framework [77.45983464131977]
我々は、RAGモデルの予測が誤りであり、現実のアプリケーションにおいて制御不能なリスクをもたらす可能性がどの程度あるかに焦点を当てる。
本研究は,RAGの予測に影響を及ぼす2つの重要な潜伏要因を明らかにする。
我々は,これらの要因をモデルに誘導し,その応答に与える影響を解析する,反実的プロンプトフレームワークを開発した。
論文 参考訳(メタデータ) (2024-09-24T14:52:14Z) - Generalized Encouragement-Based Instrumental Variables for Counterfactual Regression [33.869488994843394]
本稿では,条件平均処理効果(CATE)を促進度の変化を用いて同定するための新しい理論とアルゴリズムを提案する。
本稿では、観察データと奨励データの両方を活用することで、因果効果を効果的に推定するために、Encouragement-based Counterfactual Regression (EnCounteR) と呼ばれる一般化IV推定器を提案する。
論文 参考訳(メタデータ) (2024-08-10T04:21:04Z) - How to Train Your DRAGON: Diverse Augmentation Towards Generalizable
Dense Retrieval [80.54532535622988]
教師付き検索とゼロショット検索の両方において高い精度を達成するために、一般化可能な高密度検索を訓練できることが示される。
多様な拡張で訓練された高密度レトリバーであるDRAGONは、教師付きおよびゼロショット評価の両方において最先端の有効性を実現する最初のBERTベースサイズのDRである。
論文 参考訳(メタデータ) (2023-02-15T03:53:26Z) - A Generalized Doubly Robust Learning Framework for Debiasing Post-Click
Conversion Rate Prediction [23.340584290411208]
クリック後変換率(CVR)予測は、ユーザの興味を見つけ、プラットフォーム収益を増やすための重要なタスクである。
現在、Doublely robust(DR)学習アプローチは、CVR予測を損なうための最先端のパフォーマンスを実現している。
本稿では,DR損失のバイアスを制御し,バイアスと分散を柔軟にバランスするDR-BIASとDR-MSEの2つの新しいDR手法を提案する。
論文 参考訳(メタデータ) (2022-11-12T15:09:23Z) - StableDR: Stabilized Doubly Robust Learning for Recommendation on Data
Missing Not at Random [16.700598755439685]
二重ロバスト (DR) 法は不安定であり, 偏差, 分散, 一般化が極めて小さい。
本稿では,外挿への依存度を弱める2重頑健(StableDR)学習手法を提案する。
さらに,本論文では,不規則性,妥当性,予測モデルを周期的に更新する新しいStableDRの学習手法を提案する。
論文 参考訳(メタデータ) (2022-05-10T07:04:53Z) - Cross Pairwise Ranking for Unbiased Item Recommendation [57.71258289870123]
我々はCPR(Cross Pairwise Ranking)という新しい学習パラダイムを開発する。
CPRは、露出メカニズムを知らずに不偏の推奨を達成する。
理論的には、この方法が学習に対するユーザ/イテムの適合性の影響を相殺することを証明する。
論文 参考訳(メタデータ) (2022-04-26T09:20:27Z) - Doubly Robust Collaborative Targeted Learning for Recommendation on Data
Missing Not at Random [6.563595953273317]
推薦システムでは、受信したフィードバックデータが常にランダムではない(MNAR)。
本稿では,エラー計算(EIB)法と二重頑健(DR)法の両方の利点を効果的に捉えるbf DR-TMLEを提案する。
我々はまた、bf DR-TMLE-TLと呼ばれるDR-TMLEのための新しいRCT非協調目標学習アルゴリズムを提案する。
論文 参考訳(メタデータ) (2022-03-19T06:48:50Z) - Doubly Robust Distributionally Robust Off-Policy Evaluation and Learning [59.02006924867438]
オフ政治評価と学習(OPE/L)は、オフラインの観察データを使用してより良い意思決定を行う。
近年の研究では、分散ロバストなOPE/L (DROPE/L) が提案されているが、この提案は逆正則重み付けに依存している。
KL分散不確実性集合を用いたDROPE/Lの最初のDRアルゴリズムを提案する。
論文 参考訳(メタデータ) (2022-02-19T20:00:44Z) - Assessment of Treatment Effect Estimators for Heavy-Tailed Data [70.72363097550483]
ランダム化制御試験(RCT)における治療効果の客観的評価における中心的な障害は、その性能をテストするための基礎的真理(または検証セット)の欠如である。
この課題に対処するための新しいクロスバリデーションのような方法論を提供する。
本手法は,Amazonサプライチェーンに実装された709RCTに対して評価を行った。
論文 参考訳(メタデータ) (2021-12-14T17:53:01Z) - Causal Inference Q-Network: Toward Resilient Reinforcement Learning [57.96312207429202]
観測干渉を有する弾力性のあるDRLフレームワークを検討する。
本稿では、因果推論Q-network (CIQ) と呼ばれる因果推論に基づくDRLアルゴリズムを提案する。
実験の結果,提案手法は観測干渉に対して高い性能と高反発性を実現することができた。
論文 参考訳(メタデータ) (2021-02-18T23:50:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。