論文の概要: Environment-Adaptive Covariate Selection: Learning When to Use Spurious Correlations for Out-of-Distribution Prediction
- arxiv url: http://arxiv.org/abs/2601.02322v1
- Date: Mon, 05 Jan 2026 18:13:02 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-06 16:25:23.351871
- Title: Environment-Adaptive Covariate Selection: Learning When to Use Spurious Correlations for Out-of-Distribution Prediction
- Title(参考訳): 環境適応型共変量選択:分布外予測にスパーラス相関をいつ使うかを学ぶ
- Authors: Shuozhi Zuo, Yixin Wang,
- Abstract要約: 結果の真の原因のサブセットのみを観測した場合に,アウト・オブ・ディストリビューション予測が失敗することを示す。
環境適応型共変量選択アルゴリズムを提案する。
EACSは、様々な分布シフトの下で静的因果、不変、およびERMベースの予測器を一貫して上回る。
- 参考スコア(独自算出の注目度): 33.69413571438309
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Out-of-distribution (OOD) prediction is often approached by restricting models to causal or invariant covariates, avoiding non-causal spurious associations that may be unstable across environments. Despite its theoretical appeal, this strategy frequently underperforms empirical risk minimization (ERM) in practice. We investigate the source of this gap and show that such failures naturally arise when only a subset of the true causes of the outcome is observed. In these settings, non-causal spurious covariates can serve as informative proxies for unobserved causes and substantially improve prediction, except under distribution shifts that break these proxy relationships. Consequently, the optimal set of predictive covariates is neither universal nor necessarily exhibits invariant relationships with the outcome across all environments, but instead depends on the specific type of shift encountered. Crucially, we observe that different covariate shifts induce distinct, observable signatures in the covariate distribution itself. Moreover, these signatures can be extracted from unlabeled data in the target OOD environment and used to assess when proxy covariates remain reliable and when they fail. Building on this observation, we propose an environment-adaptive covariate selection (EACS) algorithm that maps environment-level covariate summaries to environment-specific covariate sets, while allowing the incorporation of prior causal knowledge as constraints. Across simulations and applied datasets, EACS consistently outperforms static causal, invariant, and ERM-based predictors under diverse distribution shifts.
- Abstract(参考訳): アウト・オブ・ディストリビューション(OOD)予測は、モデルに因果関係や不変な共変体を制限し、環境全体にわたって不安定な非因果関係を避けることで、しばしばアプローチされる。
理論上の魅力にもかかわらず、この戦略は実際に経験的リスク最小化(ERM)を過小評価することが多い。
このギャップの原因を調査し、結果の真の原因のサブセットが観察された場合に自然にそのような障害が発生することを示す。
これらの設定では、非因果的スプリアス共変体は、これらのプロキシ関係を破る分布シフトを除いて、観測されていない原因に対する情報的プロキシとして機能し、予測を大幅に改善することができる。
その結果、予測共変量の最適セットは普遍的ではなく、必ずしもすべての環境における結果と不変の関係を示すものではないが、その代わりに遭遇した特定のシフトの種類に依存する。
重要なことに、異なる共変量シフトは、共変量分布自体において異なる、観測可能なシグネチャを誘導する。
さらに、これらのシグネチャは、ターゲットのOOD環境でラベル付けされていないデータから抽出することができ、プロキシの共変がいつ信頼できるか、いつ失敗したかを評価するのに使用される。
本研究では,環境適応型共変量選択(EACS)アルゴリズムを提案し,環境レベルの共変量集合を環境固有の共変量集合にマッピングすると同時に,事前の因果的知識を制約として組み込むことを可能にした。
シミュレーションと応用データセット全体で、EACSは多様な分布シフトの下で静的因果、不変、ERMベースの予測器を一貫して上回る。
関連論文リスト
- Model-based causal feature selection for general response types [8.228587135343071]
Invariant causal prediction (ICP) は、不均一な設定からのデータを必要とする因果的特徴選択の手法である。
我々は変換モデル(TRAM)ベースのICPを開発し、連続的、分類的、カウント型、非形式的に検閲された応答を可能にする。
我々は、オープンソースのRパッケージ「tramicp」を提供し、シミュレーションデータに対する我々のアプローチを評価し、重篤な患者の生存の因果的特徴を調査する事例研究を行った。
論文 参考訳(メタデータ) (2023-09-22T12:42:48Z) - Adapting to Latent Subgroup Shifts via Concepts and Proxies [82.01141290360562]
最適ターゲット予測器は、ソースドメインでのみ利用できる概念とプロキシ変数の助けを借りて、非パラメトリックに識別可能であることを示す。
本研究では,データ生成プロセスに特有の潜在変数モデルを提案する。
論文 参考訳(メタデータ) (2022-12-21T18:30:22Z) - Breaking the Spurious Causality of Conditional Generation via Fairness
Intervention with Corrective Sampling [77.15766509677348]
条件生成モデルは、トレーニングデータセットから急激な相関を継承することが多い。
これは別の潜在属性に対して不均衡なラベル条件分布をもたらす。
この問題を緩和するための一般的な2段階戦略を提案する。
論文 参考訳(メタデータ) (2022-12-05T08:09:33Z) - Unleashing the Power of Graph Data Augmentation on Covariate
Distribution Shift [50.98086766507025]
本稿では,AIA(Adversarial Invariant Augmentation)という,シンプルで効率の良いデータ拡張戦略を提案する。
AIAは、拡張プロセス中に元の安定した特徴を同時に保存しながら、新しい環境をエクスポーレーションし、生成することを目的としている。
論文 参考訳(メタデータ) (2022-11-05T07:55:55Z) - Balancing Fairness and Robustness via Partial Invariance [17.291131923335918]
不変リスク最小化(IRM)は、アウト・オブ・ディストリビューション(OOD)問題を解決するための環境セットから不変機能を学ぶことを目的としている。
障害ケースを軽減するために、部分的な不変性フレームワークを議論する。
本研究は, 一定の条件下での公正性とリスクのトレードオフを軽減するため, 部分的不変リスク最小化が可能であることを示す。
論文 参考訳(メタデータ) (2021-12-17T06:41:47Z) - Deconfounding Scores: Feature Representations for Causal Effect
Estimation with Weak Overlap [140.98628848491146]
推定対象の偏りを伴わずに高い重なりを生じさせる,デコンファウンディングスコアを導入する。
分離スコアは観測データで識別可能なゼロ共分散条件を満たすことを示す。
特に,この手法が標準正規化の魅力的な代替となることを示す。
論文 参考訳(メタデータ) (2021-04-12T18:50:11Z) - The Risks of Invariant Risk Minimization [52.7137956951533]
不変リスク最小化(Invariant Risk Minimization)は、データの深い不変性を学ぶという考え方に基づく目標である。
我々は、IRMの目的に基づく分類の最初の分析と、最近提案されたこれらの代替案について、かなり自然で一般的なモデルで分析する。
IRMは、テストデータがトレーニング分布と十分に類似していない限り、破滅的に失敗する可能性がある。
論文 参考訳(メタデータ) (2020-10-12T14:54:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。