論文の概要: Common Functional Decompositions Can Mis-attribute Differences in Outcomes Between Populations
- arxiv url: http://arxiv.org/abs/2504.16864v1
- Date: Wed, 23 Apr 2025 16:36:55 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-02 15:15:29.875169
- Title: Common Functional Decompositions Can Mis-attribute Differences in Outcomes Between Populations
- Title(参考訳): 共通機能分解は個体群間のアウトカムの相違に寄与する
- Authors: Manuel Quintero, William T. Stephenson, Advik Shreekumar, Tamara Broderick,
- Abstract要約: 科学と社会科学では、2つの集団で結果が異なる理由を説明することがよくあります。
北川-Oaxaca-Blinder (KOB) 分解は、2つの集団の平均結果の違いを説明する計量学の標準ツールである。
- 参考スコア(独自算出の注目度): 13.896180143147962
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In science and social science, we often wish to explain why an outcome is different in two populations. For instance, if a jobs program benefits members of one city more than another, is that due to differences in program participants (particular covariates) or the local labor markets (outcomes given covariates)? The Kitagawa-Oaxaca-Blinder (KOB) decomposition is a standard tool in econometrics that explains the difference in the mean outcome across two populations. However, the KOB decomposition assumes a linear relationship between covariates and outcomes, while the true relationship may be meaningfully nonlinear. Modern machine learning boasts a variety of nonlinear functional decompositions for the relationship between outcomes and covariates in one population. It seems natural to extend the KOB decomposition using these functional decompositions. We observe that a successful extension should not attribute the differences to covariates -- or, respectively, to outcomes given covariates -- if those are the same in the two populations. Unfortunately, we demonstrate that, even in simple examples, two common decompositions -- functional ANOVA and Accumulated Local Effects -- can attribute differences to outcomes given covariates, even when they are identical in two populations. We provide a characterization of when functional ANOVA misattributes, as well as a general property that any discrete decomposition must satisfy to avoid misattribution. We show that if the decomposition is independent of its input distribution, it does not misattribute. We further conjecture that misattribution arises in any reasonable additive decomposition that depends on the distribution of the covariates.
- Abstract(参考訳): 科学と社会科学では、2つの集団で結果が異なる理由を説明することがよくあります。
例えば、ある雇用プログラムが他の都市のメンバーに恩恵を与えた場合、プログラム参加者(特に共変国)や現地の労働市場(共変国からの収入)の違いによるものであるか。
北川-Oaxaca-Blinder (KOB) 分解は、2つの集団の平均結果の違いを説明する計量学の標準ツールである。
しかしながら、KOB分解は共変量と結果の間の線形関係を仮定するが、真の関係は有意に非線形であるかもしれない。
現代の機械学習は、1つの集団における結果と共変量の関係について、様々な非線形機能分解を誇っている。
これらの機能的分解を用いて KOB 分解を拡張することは自然である。
成功した拡張は、2つの個体群で同じならば、共変量(またはそれぞれ共変量の結果)の違いに起因してはならない。
残念なことに、単純な例であっても、機能的ANOVAと累積局所効果という2つの一般的な分解は、2つの集団で同一である場合でも、与えられた共変量の結果に違いがある。
我々は,機能的ANOVAの誤属性がいつ現れるかの特性と,分解が不寄与を避けるために満たさなければならない一般的な性質について述べる。
分解が入力分布から独立である場合、それは誤属性ではないことを示す。
さらに、共変量の分布に依存する任意の合理的加法分解において、誤帰が生じると推測する。
関連論文リスト
- Representation Learning Preserving Ignorability and Covariate Matching for Treatment Effects [18.60804431844023]
観測データから治療効果を推定することは, 隠れたコンバウンディングにより困難である。
隠れた欠点と選択バイアスの両方に対処する共通のフレームワークが欠落している。
論文 参考訳(メタデータ) (2025-04-29T09:33:56Z) - Towards Self-Supervised Covariance Estimation in Deep Heteroscedastic Regression [102.24287051757469]
深部異方性回帰における自己教師付き共分散推定について検討する。
正規分布の間の2-ワッサーシュタイン距離の上界を導出する。
幅広い合成データセットと実データセットに対する実験により、提案された2-ワッサーシュタインと擬似ラベルアノテーションが結合した結果、計算的に安価で正確な深部ヘテロ代用回帰が導かれることが示された。
論文 参考訳(メタデータ) (2025-02-14T22:37:11Z) - Causal vs. Anticausal merging of predictors [57.26526031579287]
同じデータを用いて、因果方向と反因果方向の融合予測器から生じる差について検討した。
帰納的バイアスとしてCausal Maximum Entropy (CMAXENT) を用いて予測器をマージする。
論文 参考訳(メタデータ) (2025-01-14T20:38:15Z) - Robustly estimating heterogeneity in factorial data using Rashomon Partitions [4.76518127830168]
我々は、羅生門分割集合(RPS)と呼ばれる別の視点を開発する。
RPSは、たとえ実質的に異なる説明を提供するとしても、最大アフターディパーティションの近くに後続値を持つすべてのパーティションを組み込む。
提案手法を,チャリタブルギフトの価格効果,染色体構造(テロメア長),マイクロファイナンス導入の3つの経験的設定に適用した。
論文 参考訳(メタデータ) (2024-04-02T17:53:28Z) - TIC-TAC: A Framework for Improved Covariance Estimation in Deep Heteroscedastic Regression [109.69084997173196]
奥行き回帰は、予測分布の平均と共分散を負の対数類似度を用いて共同最適化する。
近年の研究では, 共分散推定に伴う課題により, 準最適収束が生じる可能性が示唆されている。
1)予測共分散は予測平均のランダム性を真に捉えているか?
その結果, TICは共分散を正確に学習するだけでなく, 負の対数類似性の収束性の向上も促進することがわかった。
論文 参考訳(メタデータ) (2023-10-29T09:54:03Z) - Nonparametric Identifiability of Causal Representations from Unknown
Interventions [63.1354734978244]
本研究では, 因果表現学習, 潜伏因果変数を推定するタスク, およびそれらの変数の混合から因果関係を考察する。
我々のゴールは、根底にある真理潜入者とその因果グラフの両方を、介入データから解決不可能なあいまいさの集合まで識別することである。
論文 参考訳(メタデータ) (2023-06-01T10:51:58Z) - Unleashing the Power of Graph Data Augmentation on Covariate
Distribution Shift [50.98086766507025]
本稿では,AIA(Adversarial Invariant Augmentation)という,シンプルで効率の良いデータ拡張戦略を提案する。
AIAは、拡張プロセス中に元の安定した特徴を同時に保存しながら、新しい環境をエクスポーレーションし、生成することを目的としている。
論文 参考訳(メタデータ) (2022-11-05T07:55:55Z) - On the Strong Correlation Between Model Invariance and Generalization [54.812786542023325]
一般化は、見えないデータを分類するモデルの能力をキャプチャする。
不変性はデータの変換におけるモデル予測の一貫性を測定する。
データセット中心の視点から、あるモデルの精度と不変性は異なるテストセット上で線形に相関している。
論文 参考訳(メタデータ) (2022-07-14T17:08:25Z) - Controlling for multiple covariates [0.0]
統計学における根本的な問題は、サブ集団のメンバーが達成した結果を比較することである。
比較は、特定の特徴に応じて類似した個人に対して別々に行う場合に最も理にかなっている。
論文 参考訳(メタデータ) (2021-12-01T17:37:36Z) - The SKIM-FA Kernel: High-Dimensional Variable Selection and Nonlinear
Interaction Discovery in Linear Time [26.11563787525079]
変数選択と推定の両方において、カーネルのトリックが適切なベイズモデルによる計算をO(#共変量)時間に還元する方法を示す。
提案手法は,大規模で高次元なデータセットの既存の手法よりも優れている。
論文 参考訳(メタデータ) (2021-06-23T13:53:36Z) - Examining and Combating Spurious Features under Distribution Shift [94.31956965507085]
我々は、最小限の統計量という情報理論の概念を用いて、ロバストで刺激的な表現を定義し、分析する。
入力分布のバイアスしか持たない場合でも、モデルはトレーニングデータから急激な特徴を拾い上げることができることを証明しています。
分析から着想を得た結果,グループDROは,グループ同士の相関関係を直接考慮しない場合に失敗する可能性が示唆された。
論文 参考訳(メタデータ) (2021-06-14T05:39:09Z) - Replicating and Extending "Because Their Treebanks Leak": Graph
Isomorphism, Covariants, and Parser Performance [0.32228025627337864]
NLPの他の統計分析と同様に、結果は線形回帰の評価に基づいていた。
そこで本研究では,グラフの同型性に関して,短い文のサブセットのみの性能が異なることを確認した。
このような統計的分析から得られた結論は、より容易に要因を分解することで、制御された実験がそれらを補う必要があることを示唆する。
論文 参考訳(メタデータ) (2021-06-01T10:00:46Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。