論文の概要: Causal Transfer Random Forest: Combining Logged Data and Randomized
Experiments for Robust Prediction
- arxiv url: http://arxiv.org/abs/2010.08710v2
- Date: Thu, 14 Jan 2021 16:29:07 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-06 09:10:32.547547
- Title: Causal Transfer Random Forest: Combining Logged Data and Randomized
Experiments for Robust Prediction
- Title(参考訳): 因果移動ランダムフォレスト:ロバスト予測のためのログデータとランダム化実験を組み合わせる
- Authors: Shuxi Zeng, Murat Ali Bayir, Joesph J.Pfeiffer III, Denis Charles,
Emre Kiciman
- Abstract要約: 本稿では,既存のトレーニングデータとランダム化実験から得られた少量のデータを組み合わせてモデルを訓練するCTRFについて述べる。
我々は,Bing Adsプラットフォームにおける合成データ実験と実世界の実験の両方を用いてCTRFを評価する。
- 参考スコア(独自算出の注目度): 8.736551469632758
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: It is often critical for prediction models to be robust to distributional
shifts between training and testing data. From a causal perspective, the
challenge is to distinguish the stable causal relationships from the unstable
spurious correlations across shifts. We describe a causal transfer random
forest (CTRF) that combines existing training data with a small amount of data
from a randomized experiment to train a model which is robust to the feature
shifts and therefore transfers to a new targeting distribution. Theoretically,
we justify the robustness of the approach against feature shifts with the
knowledge from causal learning. Empirically, we evaluate the CTRF using both
synthetic data experiments and real-world experiments in the Bing Ads platform,
including a click prediction task and in the context of an end-to-end
counterfactual optimization system. The proposed CTRF produces robust
predictions and outperforms most baseline methods compared in the presence of
feature shifts.
- Abstract(参考訳): 予測モデルがトレーニングとテストデータ間の分散シフトに頑健であることは、しばしば重要である。
因果関係の観点からは、安定した因果関係とシフト間の不安定な急激な相関を区別することが課題である。
本稿では,既存のトレーニングデータとランダム化実験から得た少量のデータを組み合わせて,特徴シフトに頑健なモデルを訓練し,新たなターゲット分布へ移行する因果伝達ランダムフォレスト(CTRF)について述べる。
理論的には、因果学習の知識を用いて特徴シフトに対するアプローチの強固さを正当化する。
実験では,クリック予測タスクを含むbing adsプラットフォームにおける合成データ実験と実世界の実験の両方を用いてctrfを評価する。
提案したCTRFは,特徴シフトが存在する場合と比較して,ロバストな予測を行い,ほとんどのベースライン法より優れる。
関連論文リスト
- Drift-Resilient TabPFN: In-Context Learning Temporal Distribution Shifts on Tabular Data [39.40116554523575]
In-Context Learning with a Prior-Data Fitted Network に基づく新しいアプローチである Drift-Resilient TabPFN を提案する。
先行した合成データセットのベイズ推定を近似することを学ぶ。
精度は0.688から0.744に向上し、OC AUCは0.786から0.832に向上し、キャリブレーションも強化された。
論文 参考訳(メタデータ) (2024-11-15T23:49:23Z) - A Curious Case of Searching for the Correlation between Training Data and Adversarial Robustness of Transformer Textual Models [11.938237087895649]
既存の研究によると、微調整されたテキスト変換モデルは最先端の予測性能を実現するが、敵対的なテキスト摂動にも弱い。
本稿では,トレーニングデータとモデルロバスト性との間にも強い相関関係があることを証明したい。
様々な入力微調整コーパス特性を表す13の異なる特徴を抽出し,それらを用いて微調整モデルの対角的堅牢性を予測する。
論文 参考訳(メタデータ) (2024-02-18T05:58:25Z) - Boosted Control Functions [10.503777692702952]
本研究の目的は,因果効果推定と予測タスクのギャップを埋めることである。
我々は,機械学習の分布場と同時方程式モデル,およびエコノメティクスの制御関数との新たな接続を確立する。
このフレームワーク内では、予測モデルに対する不変性の強い概念を提案し、それを既存の(ウィーカー)バージョンと比較する。
論文 参考訳(メタデータ) (2023-10-09T15:43:46Z) - Diverse Data Augmentation with Diffusions for Effective Test-time Prompt
Tuning [73.75282761503581]
DiffTPTを提案する。DiffTPTは,事前学習した拡散モデルを用いて,多種多様な情報データを生成する。
DiffTPTがゼロショット精度を平均5.13%向上することを示す。
論文 参考訳(メタデータ) (2023-08-11T09:36:31Z) - Chasing Fairness Under Distribution Shift: A Model Weight Perturbation
Approach [72.19525160912943]
まず,分布シフト,データ摂動,モデルウェイト摂動の関連性を理論的に検証した。
次に、ターゲットデータセットの公平性を保証するのに十分な条件を分析します。
これらの十分な条件により、ロバストフェアネス正則化(RFR)を提案する。
論文 参考訳(メタデータ) (2023-03-06T17:19:23Z) - Generative Causal Representation Learning for Out-of-Distribution Motion
Forecasting [13.99348653165494]
本稿では,分散シフト下での知識伝達を容易にするための生成因果学習表現を提案する。
ヒトの軌道予測モデルにおいて提案手法の有効性を評価する一方、GCRLは他の領域にも適用可能である。
論文 参考訳(メタデータ) (2023-02-17T00:30:44Z) - Leveraging Unlabeled Data to Predict Out-of-Distribution Performance [63.740181251997306]
実世界の機械学習デプロイメントは、ソース(トレーニング)とターゲット(テスト)ディストリビューションのミスマッチによって特徴づけられる。
本研究では,ラベル付きソースデータとラベルなしターゲットデータのみを用いて,対象領域の精度を予測する手法を検討する。
本稿では,モデルの信頼度をしきい値として学習し,精度をラベルなし例のごく一部として予測する実践的手法である平均閾値保持信頼度(ATC)を提案する。
論文 参考訳(メタデータ) (2022-01-11T23:01:12Z) - Unlabelled Data Improves Bayesian Uncertainty Calibration under
Covariate Shift [100.52588638477862]
後続正則化に基づく近似ベイズ推定法を開発した。
前立腺癌の予後モデルを世界規模で導入する上で,本手法の有用性を実証する。
論文 参考訳(メタデータ) (2020-06-26T13:50:19Z) - Stable Prediction via Leveraging Seed Variable [73.9770220107874]
従来の機械学習手法は、非因果変数によって誘導されるトレーニングデータにおいて、微妙に刺激的な相関を利用して予測する。
本研究では, 条件付き独立性テストに基づくアルゴリズムを提案し, 種子変数を先行変数とする因果変数を分離し, 安定な予測に採用する。
我々のアルゴリズムは、安定した予測のための最先端の手法より優れている。
論文 参考訳(メタデータ) (2020-06-09T06:56:31Z) - Balance-Subsampled Stable Prediction [55.13512328954456]
本稿では, 分数分解設計理論に基づく新しいバランスサブサンプル安定予測法を提案する。
設計理論解析により,提案手法は分布シフトによって誘導される予測器間の共起効果を低減できることを示した。
合成および実世界の両方のデータセットに関する数値実験により、BSSPアルゴリズムは未知のテストデータ間で安定した予測を行うためのベースライン法を著しく上回っていることが示された。
論文 参考訳(メタデータ) (2020-06-08T07:01:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。