論文の概要: Beyond Reweighting: On the Predictive Role of Covariate Shift in Effect Generalization
- arxiv url: http://arxiv.org/abs/2412.08869v1
- Date: Thu, 12 Dec 2024 02:06:27 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-12-13 13:30:38.750329
- Title: Beyond Reweighting: On the Predictive Role of Covariate Shift in Effect Generalization
- Title(参考訳): 再重み付けを超えて:効果一般化における共変量シフトの予測的役割について
- Authors: Ying Jin, Naoki Egami, Dominik Rothenhäusler,
- Abstract要約: 観測変数のシフトの調整は、一般化に不十分な場合が多いことを示す。
本稿では,2つの大規模マルチサイトレプリケーション研究から,一連の実証的証拠を提示する。
次に、この現象をランダム分布シフトモデルから理論的に導出可能な類似パターンに接続することで解釈する。
- 参考スコア(独自算出の注目度): 5.280036476742084
- License:
- Abstract: Many existing approaches to generalizing statistical inference amidst distribution shift operate under the covariate shift assumption, which posits that the conditional distribution of unobserved variables given observable ones is invariant across populations. However, recent empirical investigations have demonstrated that adjusting for shift in observed variables (covariate shift) is often insufficient for generalization. In other words, covariate shift does not typically ``explain away'' the distribution shift between settings. As such, addressing the unknown yet non-negligible shift in the unobserved variables given observed ones (conditional shift) is crucial for generalizable inference. In this paper, we present a series of empirical evidence from two large-scale multi-site replication studies to support a new role of covariate shift in ``predicting'' the strength of the unknown conditional shift. Analyzing 680 studies across 65 sites, we find that even though the conditional shift is non-negligible, its strength can often be bounded by that of the observable covariate shift. However, this pattern only emerges when the two sources of shifts are quantified by our proposed standardized, ``pivotal'' measures. We then interpret this phenomenon by connecting it to similar patterns that can be theoretically derived from a random distribution shift model. Finally, we demonstrate that exploiting the predictive role of covariate shift leads to reliable and efficient uncertainty quantification for target estimates in generalization tasks with partially observed data. Overall, our empirical and theoretical analyses suggest a new way to approach the problem of distributional shift, generalizability, and external validity.
- Abstract(参考訳): 分布シフト中の統計的推測を一般化するための既存の多くのアプローチは、共変量シフトの仮定の下で動作し、観測可能な変数が与えられた条件付き変数の分布は個体群間で不変であると仮定する。
しかし、最近の実証的研究は、観測変数(共変量シフト)のシフトの調整が一般化に不十分であることを示した。
言い換えれば、共変量シフトは、通常、設定間の分配シフトを ``explain away'' しない。
したがって、観測された変数(条件シフト)の未知だが無視できないシフトに対処することは、一般化可能な推論に不可欠である。
本稿では,2つの大規模マルチサイトレプリケーション研究から,未知条件シフトの強さの「予測」における共変量シフトの新たな役割を支援するための実証的証拠を提示する。
65の地点で680の研究を分析したところ、条件シフトは無視できないが、その強さは観測可能な共変量シフトによって束縛されることが多いことが判明した。
しかし、このパターンは、2つのシフトの源が標準化された ' <pivotal'' 測度によって定量化されるときにのみ現れる。
次に、この現象をランダム分布シフトモデルから理論的に導出可能な類似パターンに接続することで解釈する。
最後に、共変量シフトの予測的役割を活用することにより、部分的に観測されたデータを含む一般化タスクにおいて、目標推定に対する信頼性と効率的な不確実性定量化が導かれることを示す。
全体として、我々の経験的および理論的分析は、分布シフト、一般化可能性、外的妥当性といった問題にアプローチする新しい方法を提案する。
関連論文リスト
- SoftCVI: Contrastive variational inference with self-generated soft labels [2.5398014196797614]
変分推論とマルコフ連鎖モンテカルロ法がこのタスクの主要なツールである。
ソフトコントラスト変動推論(SoftCVI)を導入し、コントラスト推定フレームワークを用いて変動対象のファミリーを導出する。
我々は、SoftCVIを用いて、訓練や大量発見に安定な目標を定式化することができ、他の変分アプローチよりも頻繁に優れた推論が可能であることを発見した。
論文 参考訳(メタデータ) (2024-07-22T14:54:12Z) - Identifiable Latent Neural Causal Models [82.14087963690561]
因果表現学習は、低レベルの観測データから潜伏した高レベルの因果表現を明らかにすることを目指している。
因果表現の識別可能性に寄与する分布シフトのタイプを決定する。
本稿では,本研究の成果を実用的なアルゴリズムに翻訳し,信頼性の高い潜在因果表現の取得を可能にする。
論文 参考訳(メタデータ) (2024-03-23T04:13:55Z) - Proxy Methods for Domain Adaptation [78.03254010884783]
プロキシ変数は、遅延変数を明示的にリカバリしたりモデル化したりすることなく、分散シフトへの適応を可能にする。
両設定の複雑な分散シフトに適応する2段階のカーネル推定手法を開発した。
論文 参考訳(メタデータ) (2024-03-12T09:32:41Z) - Invariant Anomaly Detection under Distribution Shifts: A Causal
Perspective [6.845698872290768]
異常検出(AD、Anomaly Detection)は、異常なサンプルを識別する機械学習タスクである。
分散シフトの制約の下では、トレーニングサンプルとテストサンプルが同じ分布から引き出されるという仮定が崩壊する。
我々は,異常検出モデルのレジリエンスを,異なる種類の分布シフトに高めようとしている。
論文 参考訳(メタデータ) (2023-12-21T23:20:47Z) - Nonparametric Identifiability of Causal Representations from Unknown
Interventions [63.1354734978244]
本研究では, 因果表現学習, 潜伏因果変数を推定するタスク, およびそれらの変数の混合から因果関係を考察する。
我々のゴールは、根底にある真理潜入者とその因果グラフの両方を、介入データから解決不可能なあいまいさの集合まで識別することである。
論文 参考訳(メタデータ) (2023-06-01T10:51:58Z) - Temporally Disentangled Representation Learning [14.762231867144065]
下位の潜伏変数とその因果関係が任意の非パラメトリック因果関係を持つかどうかは不明である。
時間遅延因果変数を復元する基本フレームワークである textbftextttTDRL を提案する。
私たちのアプローチは、このモジュラー表現を正しく活用しない既存のベースラインをかなり上回ります。
論文 参考訳(メタデータ) (2022-10-24T23:02:49Z) - Causal Discovery in Heterogeneous Environments Under the Sparse
Mechanism Shift Hypothesis [7.895866278697778]
機械学習のアプローチは、一般に独立で同一に分散されたデータ(すなわち、d)の仮定に依存する。
実際、この仮定は環境間の分散シフトによってほとんど常に破られる。
そこで我々は,様々な経験的推定器に適用可能なスコアベースアプローチであるメカニズムシフトスコア(MSS)を提案する。
論文 参考訳(メタデータ) (2022-06-04T15:39:30Z) - Covariate Shift in High-Dimensional Random Feature Regression [44.13449065077103]
共変量シフトは、堅牢な機械学習モデルの開発において重要な障害である。
現代の機械学習の文脈における理論的理解を示す。
論文 参考訳(メタデータ) (2021-11-16T05:23:28Z) - Deconfounded Score Method: Scoring DAGs with Dense Unobserved
Confounding [101.35070661471124]
本研究では,観測データ分布に特徴的フットプリントが残っており,突発的・因果的影響を解消できることを示す。
汎用ソルバで実装し,高次元問題へのスケールアップが可能なスコアベース因果検出アルゴリズムを提案する。
論文 参考訳(メタデータ) (2021-03-28T11:07:59Z) - The Hidden Uncertainty in a Neural Networks Activations [105.4223982696279]
ニューラルネットワークの潜在表現の分布は、アウト・オブ・ディストリビューション(OOD)データの検出に成功している。
本研究は、この分布が、モデルの不確実性と相関しているかどうかを考察し、新しい入力に一般化する能力を示す。
論文 参考訳(メタデータ) (2020-12-05T17:30:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。