論文の概要: Na\"ive regression requires weaker assumptions than factor models to
adjust for multiple cause confounding
- arxiv url: http://arxiv.org/abs/2007.12702v1
- Date: Fri, 24 Jul 2020 18:00:02 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-07 06:32:41.303907
- Title: Na\"ive regression requires weaker assumptions than factor models to
adjust for multiple cause confounding
- Title(参考訳): na\"ive regressionは、複数の原因の共起を調整するための因子モデルよりも弱い仮定を必要とする
- Authors: Justin Grimmer, Dean Knox and Brandon M. Stewart
- Abstract要約: 我々は、$mathbfA$の因子モデルを用いた因果推論手法である「創始者」を開発し、「代替創始者」を推定する。
これらの仮定の下で、$mathbfA$上の$mathbfY$のナイーブ半パラメトリック回帰は非バイアスであることを示す。
利用可能なデータですべてのデコンファウンデーション分析を複製し、継続的に“回帰”を上回らないことに気付きます。
- 参考スコア(独自算出の注目度): 3.871148938060281
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The empirical practice of using factor models to adjust for shared,
unobserved confounders, $\mathbf{Z}$, in observational settings with multiple
treatments, $\mathbf{A}$, is widespread in fields including genetics, networks,
medicine, and politics. Wang and Blei (2019, WB) formalizes these procedures
and develops the "deconfounder," a causal inference method using factor models
of $\mathbf{A}$ to estimate "substitute confounders," $\hat{\mathbf{Z}}$, then
estimating treatment effects by regressing the outcome, $\mathbf{Y}$, on part
of $\mathbf{A}$ while adjusting for $\hat{\mathbf{Z}}$. WB claim the
deconfounder is unbiased when there are no single-cause confounders and
$\hat{\mathbf{Z}}$ is "pinpointed." We clarify pinpointing requires each
confounder to affect infinitely many treatments. We prove under these
assumptions, a na\"ive semiparametric regression of $\mathbf{Y}$ on
$\mathbf{A}$ is asymptotically unbiased. Deconfounder variants nesting this
regression are therefore also asymptotically unbiased, but variants using
$\hat{\mathbf{Z}}$ and subsets of causes require further untestable
assumptions. We replicate every deconfounder analysis with available data and
find it fails to consistently outperform na\"ive regression. In practice, the
deconfounder produces implausible estimates in WB's case study to movie
earnings: estimates suggest comic author Stan Lee's cameo appearances causally
contributed \$15.5 billion, most of Marvel movie revenue. We conclude neither
approach is a viable substitute for careful research design in real-world
applications.
- Abstract(参考訳): 因子モデルを用いて共有され観測されていない共同設立者($\mathbf{Z}$)を複数の治療を施した観察環境で調整するという実証的な実践は、遺伝学、ネットワーク、医学、政治などの分野に広く浸透している。
wang and blei (2019, wb) はこれらの手順を定式化し、$\mathbf{a}$ の因子モデルを用いた因果推論法 "deconfounder" を開発し、"substitute confounders", $\hat{\mathbf{z}}$ を推定した後、$\hat{\mathbf{z}}$ を調整しながら$\mathbf{a}$ の一部として$\mathbf{y}$ を回帰して治療効果を推定する。
WBは、共同ファウンダーが一人もいない場合、共同ファウンダーは無バイアスであり、$\hat{\mathbf{Z}}$は「ピンポイント」であると主張している。
各共同創設者は無限に多くの治療に影響を及ぼす必要がある。
これらの仮定の下では、$\mathbf{Y}$ on $\mathbf{A}$は漸近的に非バイアスであることを示す。
したがって、この回帰をネストするデコンボリック変種は漸近的に偏りがないが、$\hat{\mathbf{z}}$ と原因のサブセットを使用する変種は、さらにテスト不能な仮定を必要とする。
利用可能なデータですべてのデコンファウンデーション分析を複製し、Na\\の回帰を一貫して上回らないことに気付きます。
推定では、コミック作家スタン・リーのカメオ出演は、マーベル映画の収入の大部分を占める155億ドルを因果的に寄与したと推測されている。
いずれのアプローチも,実世界のアプリケーションにおける注意深い研究設計の代替として有効なものではない,と結論付けている。
関連論文リスト
- Mind the Gap: A Causal Perspective on Bias Amplification in Prediction & Decision-Making [58.06306331390586]
本稿では,閾値演算による予測値がS$変化の程度を測るマージン補数の概念を導入する。
適切な因果仮定の下では、予測スコア$S$に対する$X$の影響は、真の結果$Y$に対する$X$の影響に等しいことを示す。
論文 参考訳(メタデータ) (2024-05-24T11:22:19Z) - Debiasing and a local analysis for population clustering using
semidefinite programming [1.9761774213809036]
サブガウス分布の混合から引き出された小さいデータサンプルを$n$で分割する問題を考察する。
この研究は、起源の個体数に応じた集団化の応用によって動機付けられている。
論文 参考訳(メタデータ) (2024-01-16T03:14:24Z) - A Unified Framework for Uniform Signal Recovery in Nonlinear Generative
Compressed Sensing [68.80803866919123]
非線形測定では、ほとんどの先行結果は一様ではない、すなわち、すべての$mathbfx*$に対してではなく、固定された$mathbfx*$に対して高い確率で保持される。
本フレームワークはGCSに1ビット/一様量子化観測と単一インデックスモデルを標準例として適用する。
また、指標集合が計量エントロピーが低い製品プロセスに対して、より厳密な境界を生み出す濃度不等式も開発する。
論文 参考訳(メタデータ) (2023-09-25T17:54:19Z) - Near Optimal Heteroscedastic Regression with Symbiotic Learning [29.16456701187538]
我々は不連続線形回帰の問題を考察する。
正則ノルムにおいて$mathbfw*$を$tildeOleft(|mathbff*|2cdot left(frac1n + left(dnright)2right)$の誤差まで推定し、一致する下界を証明できる。
論文 参考訳(メタデータ) (2023-06-25T16:32:00Z) - Statistical Learning under Heterogeneous Distribution Shift [71.8393170225794]
ground-truth predictor is additive $mathbbE[mathbfz mid mathbfx,mathbfy] = f_star(mathbfx) +g_star(mathbfy)$.
論文 参考訳(メタデータ) (2023-02-27T16:34:21Z) - Learning a Single Neuron with Adversarial Label Noise via Gradient
Descent [50.659479930171585]
モノトン活性化に対する $mathbfxmapstosigma(mathbfwcdotmathbfx)$ の関数について検討する。
学習者の目標は仮説ベクトル $mathbfw$ that $F(mathbbw)=C, epsilon$ を高い確率で出力することである。
論文 参考訳(メタデータ) (2022-06-17T17:55:43Z) - Simpson's Bias in NLP Training [4.171555557592296]
サンプルレベル損失$G$の一般的な設計は、そのタスクの真の人口レベル指標$F$と矛盾する可能性があることを示す。
我々はこの現象をシンプソンの偏見と呼び、統計学や社会科学におけるシンプソンの逆パラドックスとして知られる古典的なパラドックスと深く結びついている。
論文 参考訳(メタデータ) (2021-03-13T06:19:37Z) - Model-Based Reinforcement Learning with Value-Targeted Regression [48.92439657407732]
我々は、遷移モデル $P$ が既知のモデルの族 $mathcalP$ に属する有限水平エピソード RL に焦点を当てる。
線形混合の特別な場合において、後悔束は $tildemathcalO(dsqrtH3T)$ という形を取る。
論文 参考訳(メタデータ) (2020-06-01T17:47:53Z) - Agnostic Learning of a Single Neuron with Gradient Descent [92.7662890047311]
期待される正方形損失から、最も適合した単一ニューロンを学習することの問題点を考察する。
ReLUアクティベーションでは、我々の人口リスク保証は$O(mathsfOPT1/2)+epsilon$である。
ReLUアクティベーションでは、我々の人口リスク保証は$O(mathsfOPT1/2)+epsilon$である。
論文 参考訳(メタデータ) (2020-05-29T07:20:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。