論文の概要: Stable Prediction via Leveraging Seed Variable
- arxiv url: http://arxiv.org/abs/2006.05076v1
- Date: Tue, 9 Jun 2020 06:56:31 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-23 13:14:49.355500
- Title: Stable Prediction via Leveraging Seed Variable
- Title(参考訳): 種子変数の活用による安定予測
- Authors: Kun Kuang, Bo Li, Peng Cui, Yue Liu, Jianrong Tao, Yueting Zhuang and
Fei Wu
- Abstract要約: 従来の機械学習手法は、非因果変数によって誘導されるトレーニングデータにおいて、微妙に刺激的な相関を利用して予測する。
本研究では, 条件付き独立性テストに基づくアルゴリズムを提案し, 種子変数を先行変数とする因果変数を分離し, 安定な予測に採用する。
我々のアルゴリズムは、安定した予測のための最先端の手法より優れている。
- 参考スコア(独自算出の注目度): 73.9770220107874
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In this paper, we focus on the problem of stable prediction across unknown
test data, where the test distribution is agnostic and might be totally
different from the training one. In such a case, previous machine learning
methods might exploit subtly spurious correlations in training data induced by
non-causal variables for prediction. Those spurious correlations are changeable
across data, leading to instability of prediction across data. By assuming the
relationships between causal variables and response variable are invariant
across data, to address this problem, we propose a conditional independence
test based algorithm to separate those causal variables with a seed variable as
priori, and adopt them for stable prediction. By assuming the independence
between causal and non-causal variables, we show, both theoretically and with
empirical experiments, that our algorithm can precisely separate causal and
non-causal variables for stable prediction across test data. Extensive
experiments on both synthetic and real-world datasets demonstrate that our
algorithm outperforms state-of-the-art methods for stable prediction.
- Abstract(参考訳): 本稿では,テスト分布が非依存であり,トレーニングデータとは全く異なる可能性のある,未知のテストデータ間の安定予測の問題に焦点を当てる。
このような場合、従来の機械学習手法では、非因果変数によって引き起こされるトレーニングデータの微妙な相関を予測に利用する可能性がある。
これらのスプリアス相関はデータ間で変更可能であり、データ間で予測が不安定になる。
因果変数と応答変数の関係がデータ間で不変であると仮定することにより,これらの因果変数を先行変数として分離し,安定な予測を行う条件独立テストベースアルゴリズムを提案する。
因果変数と非因果変数の独立性を仮定することにより, 理論的および実験実験により, テストデータ間で安定な予測を行うために, 因果変数と非因果変数を正確に分離できることを示す。
合成データと実世界のデータセットの両方に関する広範な実験により、本アルゴリズムは安定予測のために最先端の手法よりも優れていることが証明された。
関連論文リスト
- Selective Nonparametric Regression via Testing [54.20569354303575]
本研究では,所定の点における条件分散の値に関する仮説を検証し,留置手順を開発する。
既存の手法とは異なり、提案手法は分散自体の値だけでなく、対応する分散予測器の不確実性についても考慮することができる。
論文 参考訳(メタデータ) (2023-09-28T13:04:11Z) - Invariant Probabilistic Prediction [45.90606906307022]
任意の分布シフトは、一般に不変かつ頑健な確率的予測を認めないことを示す。
Invariant probabilistic predictions called IPP, and study the consistency of the underlying parameters。
論文 参考訳(メタデータ) (2023-09-18T18:50:24Z) - Testing Independence of Exchangeable Random Variables [19.973896010415977]
十分なシャッフルデータがあれば、データ項目が統計的に(非)依存しているかどうかを判断できますか?
これは可能であることを示し、データが独立で同一に分散されているというヌル仮説を確実に拒否できるテストを開発する。
潜在的なアプリケーションはDeep Learningで、データはしばしばインターネット全体から取り除かれ、重複は多い。
論文 参考訳(メタデータ) (2022-10-22T08:55:48Z) - Conformal prediction for the design problem [72.14982816083297]
機械学習の現実的な展開では、次にテストすべきデータを選択するために予測アルゴリズムを使用します。
このような設定では、トレーニングデータとテストデータの間には、異なるタイプの分散シフトがある。
このような環境で予測の不確実性を定量化する手法を提案する。
論文 参考訳(メタデータ) (2022-02-08T02:59:12Z) - Counterfactual Invariance to Spurious Correlations: Why and How to Pass
Stress Tests [87.60900567941428]
素早い相関」とは、アナリストが重要とすべきでないと考える入力データのある側面に対するモデルの依存である。
機械学習では、これらにはノウ・イ・ウ・ウ・ウ・ウ・ウ・ウ・ウ・ウ・ウ・ウ・ウ・ウ・ウ・ウ・ウ・ウ・ウ・ウ・ウ・ウ・ウ・ウ・ウ・ウ・ウ・ウ・ウ・ウ・ウ・ウ」という特徴がある。
因果推論ツールを用いたストレステストについて検討した。
論文 参考訳(メタデータ) (2021-05-31T14:39:38Z) - Double Perturbation: On the Robustness of Robustness and Counterfactual
Bias Evaluation [109.06060143938052]
テストデータセットを超えたモデル弱点を明らかにするための"ダブル摂動"フレームワークを提案する。
この枠組みを,モデルの頑健さと英語における反事実バイアスの分析に使用される2つの摂動に基づくアプローチに応用する。
論文 参考訳(メタデータ) (2021-04-12T06:57:36Z) - Causal Transfer Random Forest: Combining Logged Data and Randomized
Experiments for Robust Prediction [8.736551469632758]
本稿では,既存のトレーニングデータとランダム化実験から得られた少量のデータを組み合わせてモデルを訓練するCTRFについて述べる。
我々は,Bing Adsプラットフォームにおける合成データ実験と実世界の実験の両方を用いてCTRFを評価する。
論文 参考訳(メタデータ) (2020-10-17T03:54:37Z) - Balance-Subsampled Stable Prediction [55.13512328954456]
本稿では, 分数分解設計理論に基づく新しいバランスサブサンプル安定予測法を提案する。
設計理論解析により,提案手法は分布シフトによって誘導される予測器間の共起効果を低減できることを示した。
合成および実世界の両方のデータセットに関する数値実験により、BSSPアルゴリズムは未知のテストデータ間で安定した予測を行うためのベースライン法を著しく上回っていることが示された。
論文 参考訳(メタデータ) (2020-06-08T07:01:38Z) - Stable Prediction with Model Misspecification and Agnostic Distribution
Shift [41.26323389341987]
機械学習アルゴリズムでは、2つの主要な仮定が性能を保証するために必要である。
1つは、トレーニングデータと同じ分布からテストデータが引き出され、もう1つは、モデルが正しく指定されていることである。
モデルのミススペクテーションの下では、トレーニングデータとテストデータの間の分布シフトは、パラメータ推定の不正確さと未知のテストデータ間の予測の不安定性をもたらす。
可変デコリレーション正規化器と重み付き回帰モデルとを協調的に最適化する新しいDecororrelated Weighting Regression (DWR)アルゴリズムを提案する。
論文 参考訳(メタデータ) (2020-01-31T08:56:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。