論文の概要: Information Theoretic Counterfactual Learning from Missing-Not-At-Random
Feedback
- arxiv url: http://arxiv.org/abs/2009.02623v2
- Date: Sat, 17 Oct 2020 13:54:54 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-21 08:12:52.451270
- Title: Information Theoretic Counterfactual Learning from Missing-Not-At-Random
Feedback
- Title(参考訳): 欠落非ランダムフィードバックによる情報理論的反事実学習
- Authors: Zifeng Wang and Xi Chen and Rui Wen and Shao-Lun Huang and Ercan E.
Kuruoglu and Yefeng Zheng
- Abstract要約: 本研究では,非ランダムなデータを扱うための情報理論反事実情報ボトルネック(CVIB)を構築した。
タスク対応の相互情報用語を原情報のボトルネックであるラグランジアンを実物と反物に分離することにより、対照的な情報損失を導出する。
実世界のデータセットに対する実証的な評価は、CVIBが浅層モデルと深層モデルの両方を大幅に強化することを示している。
- 参考スコア(独自算出の注目度): 34.62042315265005
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Counterfactual learning for dealing with missing-not-at-random data (MNAR) is
an intriguing topic in the recommendation literature since MNAR data are
ubiquitous in modern recommender systems. Missing-at-random (MAR) data, namely
randomized controlled trials (RCTs), are usually required by most previous
counterfactual learning methods for debiasing learning. However, the execution
of RCTs is extraordinarily expensive in practice. To circumvent the use of
RCTs, we build an information-theoretic counterfactual variational information
bottleneck (CVIB), as an alternative for debiasing learning without RCTs. By
separating the task-aware mutual information term in the original information
bottleneck Lagrangian into factual and counterfactual parts, we derive a
contrastive information loss and an additional output confidence penalty, which
facilitates balanced learning between the factual and counterfactual domains.
Empirical evaluation on real-world datasets shows that our CVIB significantly
enhances both shallow and deep models, which sheds light on counterfactual
learning in recommendation that goes beyond RCTs.
- Abstract(参考訳): MNARデータは現代のレコメンデーションシステムで広く使われているので、MNARはレコメンデーション文献の中で興味深いトピックである。
ランダム(mar)データ、すなわちランダム化制御試行(rcts)は、通常、以前のデバイアス学習のための反事実学習法によって要求される。
しかし、実際にはrctsの実行は非常に高価である。
rctsの使用を回避するために,rctsを使わずに脱バイアス学習の代替として,情報理論的な反事実変動情報ボトルネック(cvib)を構築する。
元の情報ボトルネックラグランジアンにおけるタスクアウェアな相互情報項を、事実的および非事実的部分に分割することにより、対照的情報損失と追加的な出力信頼度ペナルティを導出し、事実的および反事実的ドメイン間のバランスの取れた学習を促進する。
実世界のデータセットに対する経験的評価は、我々のcvibが浅層モデルと深層モデルの両方を著しく強化していることを示している。
関連論文リスト
- An MRP Formulation for Supervised Learning: Generalized Temporal Difference Learning Models [20.314426291330278]
従来の統計的学習では、データポイントは独立して同じ分布(d)であると仮定される。
本稿では、データポイントを相互接続したものとして認識し、データモデリングにマルコフ報酬プロセス(MRP)を用いる、対照的な視点を示す。
我々は、強化学習(RL)における政治政策評価問題として、典型的教師付き学習を再構成し、一般化時間差学習アルゴリズム(TD)を解法として導入する。
論文 参考訳(メタデータ) (2024-04-23T21:02:58Z) - Learning from Teaching Regularization: Generalizable Correlations Should be Easy to Imitate [40.5601980891318]
一般化は依然として機械学習における中心的な課題である。
本稿では,ニューラルネットワークを一般化するための新しい正規化手法であるLearning from Teaching (LoT)を提案する。
LoTはこの概念を運用し、補助的な学生学習者によるメインモデルの一般化を改善する。
論文 参考訳(メタデータ) (2024-02-05T07:05:17Z) - Noisy Correspondence Learning with Self-Reinforcing Errors Mitigation [63.180725016463974]
クロスモーダル検索は、実際は精力的な、十分に整合した大規模データセットに依存している。
我々は、新しい雑音対応学習フレームワーク、textbfSelf-textbfReinforcing textbfErrors textbfMitigation(SREM)を導入する。
論文 参考訳(メタデータ) (2023-12-27T09:03:43Z) - STEERING: Stein Information Directed Exploration for Model-Based
Reinforcement Learning [111.75423966239092]
遷移モデルの現在の推定値と未知の最適値との間の積分確率距離(IPM)の観点から探索インセンティブを提案する。
KSDに基づく新しいアルゴリズムを開発した。 textbfSTEin information dirtextbfEcted Explor for model-based textbfReinforcement Learntextbfing。
論文 参考訳(メタデータ) (2023-01-28T00:49:28Z) - Mutual Information Learned Classifiers: an Information-theoretic
Viewpoint of Training Deep Learning Classification Systems [9.660129425150926]
クロスエントロピー損失は、重度のオーバーフィッティング動作を示すモデルを見つけるのに容易である。
本稿では,既存のDNN分類器のクロスエントロピー損失最小化が,基礎となるデータ分布の条件エントロピーを本質的に学習することを証明する。
ラベルと入力の相互情報を学習することで、DNN分類器を訓練する相互情報学習フレームワークを提案する。
論文 参考訳(メタデータ) (2022-10-03T15:09:19Z) - Doubly Robust Collaborative Targeted Learning for Recommendation on Data
Missing Not at Random [6.563595953273317]
推薦システムでは、受信したフィードバックデータが常にランダムではない(MNAR)。
本稿では,エラー計算(EIB)法と二重頑健(DR)法の両方の利点を効果的に捉えるbf DR-TMLEを提案する。
我々はまた、bf DR-TMLE-TLと呼ばれるDR-TMLEのための新しいRCT非協調目標学習アルゴリズムを提案する。
論文 参考訳(メタデータ) (2022-03-19T06:48:50Z) - Learning Bias-Invariant Representation by Cross-Sample Mutual
Information Minimization [77.8735802150511]
対象タスクが誤用したバイアス情報を除去するために,クロスサンプル対逆脱バイアス法(CSAD)を提案する。
相関測定は, 対向的偏り評価において重要な役割を担い, クロスサンプル型相互情報推定器によって行われる。
我々は,提案手法の最先端手法に対する利点を検証するために,公開データセットの徹底的な実験を行った。
論文 参考訳(メタデータ) (2021-08-11T21:17:02Z) - Towards Accurate Knowledge Transfer via Target-awareness Representation
Disentanglement [56.40587594647692]
本稿では,TRED(Target-Awareness Representation Disentanglement)の概念を取り入れた新しいトランスファー学習アルゴリズムを提案する。
TREDは、対象のタスクに関する関連する知識を元のソースモデルから切り離し、ターゲットモデルを微調整する際、レギュレータとして使用する。
各種実世界のデータセットを用いた実験により,本手法は標準微調整を平均2%以上安定的に改善することが示された。
論文 参考訳(メタデータ) (2020-10-16T17:45:08Z) - Provably Efficient Causal Reinforcement Learning with Confounded
Observational Data [135.64775986546505]
オフラインで収集されたデータセット(観測データ)を組み込んで、オンライン環境でのサンプル効率を改善する方法について検討する。
提案手法は,観測データを効率よく組み込んだ,分解された楽観的値反復 (DOVI) アルゴリズムを提案する。
論文 参考訳(メタデータ) (2020-06-22T14:49:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。