論文の概要: Data Fusion for Partial Identification of Causal Effects
- arxiv url: http://arxiv.org/abs/2505.24296v1
- Date: Fri, 30 May 2025 07:13:01 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-02 19:47:52.828144
- Title: Data Fusion for Partial Identification of Causal Effects
- Title(参考訳): 因果効果の部分同定のためのデータ融合
- Authors: Quinn Lanners, Cynthia Rudin, Alexander Volfovsky, Harsh Parikh,
- Abstract要約: 本稿では,研究者が重要な疑問に答えられるような,新しい部分的識別フレームワークを提案する。
因果効果は肯定的か否定的か?
本研究の枠組みをSTARプロジェクトに適用し,第3級の標準試験性能に対する教室規模の影響について検討する。
- 参考スコア(独自算出の注目度): 62.56890808004615
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Data fusion techniques integrate information from heterogeneous data sources to improve learning, generalization, and decision making across data sciences. In causal inference, these methods leverage rich observational data to improve causal effect estimation, while maintaining the trustworthiness of randomized controlled trials. Existing approaches often relax the strong no unobserved confounding assumption by instead assuming exchangeability of counterfactual outcomes across data sources. However, when both assumptions simultaneously fail - a common scenario in practice - current methods cannot identify or estimate causal effects. We address this limitation by proposing a novel partial identification framework that enables researchers to answer key questions such as: Is the causal effect positive or negative? and How severe must assumption violations be to overturn this conclusion? Our approach introduces interpretable sensitivity parameters that quantify assumption violations and derives corresponding causal effect bounds. We develop doubly robust estimators for these bounds and operationalize breakdown frontier analysis to understand how causal conclusions change as assumption violations increase. We apply our framework to the Project STAR study, which investigates the effect of classroom size on students' third-grade standardized test performance. Our analysis reveals that the Project STAR results are robust to simultaneous violations of key assumptions, both on average and across various subgroups of interest. This strengthens confidence in the study's conclusions despite potential unmeasured biases in the data.
- Abstract(参考訳): データ融合技術は異種データソースからの情報を統合し、データサイエンスにおける学習、一般化、意思決定を改善する。
因果推論において、これらの手法は、ランダム化制御試験の信頼性を維持しながら、リッチな観測データを利用して因果効果の推定を改善する。
既存のアプローチは、データソース間での対実的な結果の交換可能性を想定して、強固で観測されていない矛盾した仮定を緩和することが多い。
しかし、両方の仮定が同時に失敗すると(実際には一般的なシナリオである)、現在のメソッドは因果的影響を識別または推定することはできない。
この制限に対処するために、研究者が次のような重要な疑問に答えられるような、新しい部分的識別フレームワークを提案する。
そして、この結論を覆すという前提違反は、どれほど深刻でなければならないのか?
提案手法では,仮定違反を定量化し,それに対応する因果効果境界を導出する解釈可能な感度パラメータを導入する。
本研究では,これらの境界値に対する二重頑健な推定器を開発し,仮定違反の増大に伴う因果的結論の変化を理解するために,ブレークダウンフロンティア分析を運用する。
本研究の枠組みをSTARプロジェクトに適用し,第3級の標準試験性能に及ぼす教室規模の影響について検討する。
分析の結果,Project STARの結果は,各サブグループにおける平均的および多岐にわたる主要な仮定の同時違反に対して堅牢であることが判明した。
これは、データに未測定のバイアスがあるにもかかわらず、研究の結論に対する信頼性を高める。
関連論文リスト
- Assumption-Lean Post-Integrated Inference with Negative Control Outcomes [0.0]
負の制御結果を用いて遅延不均一性を調整する頑健なポストインテグレート推論(PII)手法を提案する。
提案手法は,予測された直接効果推定値,隠された仲介者,共同設立者,モデレーターまで拡張する。
提案された二重頑健な推定器は、最小の仮定と潜在的な不特定性の下で一貫性があり、効率的である。
論文 参考訳(メタデータ) (2024-10-07T12:52:38Z) - Unsupervised Pairwise Causal Discovery on Heterogeneous Data using Mutual Information Measures [49.1574468325115]
因果発見(Causal Discovery)は、構成変数の統計的性質を分析することで、この問題に取り組む手法である。
教師付き学習によって得られたことに基づいて,現在の(おそらく誤解を招く)ベースライン結果に疑問を呈する。
その結果、堅牢な相互情報測定を用いて、教師なしの方法でこの問題にアプローチする。
論文 参考訳(メタデータ) (2024-08-01T09:11:08Z) - Automating the Selection of Proxy Variables of Unmeasured Confounders [16.773841751009748]
既存のプロキシ変数推定器を拡張して、治療と結果の間に複数の未測定の共同創設者が存在するシナリオに対応する。
本稿では、プロキシ変数の選択と因果効果の偏りのない推定のための2つのデータ駆動手法を提案する。
論文 参考訳(メタデータ) (2024-05-25T08:53:49Z) - Assumption violations in causal discovery and the robustness of score matching [38.60630271550033]
本稿では、最近の因果発見手法の観測データに対する実証的性能を広範囲にベンチマークする。
スコアマッチングに基づく手法は、推定されたグラフの偽陽性と偽陰性率において驚くべき性能を示すことを示す。
本論文は,因果発見手法の評価のための新しい基準を策定することを願っている。
論文 参考訳(メタデータ) (2023-10-20T09:56:07Z) - Advancing Counterfactual Inference through Nonlinear Quantile Regression [77.28323341329461]
ニューラルネットワークで実装された効率的かつ効果的な対実的推論のためのフレームワークを提案する。
提案手法は、推定された反事実結果から見つからないデータまでを一般化する能力を高める。
複数のデータセットで実施した実証実験の結果は、我々の理論的な主張に対する説得力のある支持を提供する。
論文 参考訳(メタデータ) (2023-06-09T08:30:51Z) - Evaluation of Induced Expert Knowledge in Causal Structure Learning by
NOTEARS [1.5469452301122175]
非パラメトリックNOTEARSモデルの定式化に使用される追加制約の形で、専門家の知識が因果関係に与える影響について検討する。
その結果, (i) NOTEARSモデルの誤りを正す知識は, 統計的に有意な改善をもたらすこと, (ii) アクティブエッジに対する制約は, 非アクティブエッジよりも因果発見に肯定的な影響を与えること, (iii) 意外なことに, (iii) 誘導された知識は, 平均的な不正確なアクティブエッジおよび/または非アクティブエッジに対して予想以上に正確でないことが判明した。
論文 参考訳(メタデータ) (2023-01-04T20:39:39Z) - Valid Inference After Causal Discovery [73.87055989355737]
我々は、因果関係発見後の推論に有効なツールを開発する。
因果発見とその後の推論アルゴリズムの組み合わせは,高度に膨らんだ誤発見率をもたらすことを示す。
論文 参考訳(メタデータ) (2022-08-11T17:40:45Z) - BayesIMP: Uncertainty Quantification for Causal Data Fusion [52.184885680729224]
本研究では,複数の因果グラフに関連するデータセットを組み合わせ,対象変数の平均処理効果を推定する因果データ融合問題について検討する。
本稿では、確率積分とカーネル平均埋め込みのアイデアを組み合わせて、再生されたカーネルヒルベルト空間における干渉分布を表現するフレームワークを提案する。
論文 参考訳(メタデータ) (2021-06-07T10:14:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。