論文の概要: The Hardness of Validating Observational Studies with Experimental Data
- arxiv url: http://arxiv.org/abs/2503.14795v1
- Date: Wed, 19 Mar 2025 00:06:23 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-03-20 15:24:38.441986
- Title: The Hardness of Validating Observational Studies with Experimental Data
- Title(参考訳): 実験データによる観測研究の検証の難しさ
- Authors: Jake Fawkes, Michael O'Riordan, Athanasios Vlontzos, Oriol Corcoll, Ciarán Mark Gilligan-Lee,
- Abstract要約: 実験データを用いて,観測データから因果効果を推定する手法を提案する。
この定理は, 観測実験において, 補正関数の滑らかさを仮定することなく, 偏差を検出する実験データを用いることができるが, 除去には使用できないことを証明している。
- 参考スコア(独自算出の注目度): 2.9593087583214173
- License:
- Abstract: Observational data is often readily available in large quantities, but can lead to biased causal effect estimates due to the presence of unobserved confounding. Recent works attempt to remove this bias by supplementing observational data with experimental data, which, when available, is typically on a smaller scale due to the time and cost involved in running a randomised controlled trial. In this work, we prove a theorem that places fundamental limits on this ``best of both worlds'' approach. Using the framework of impossible inference, we show that although it is possible to use experimental data to \emph{falsify} causal effect estimates from observational data, in general it is not possible to \emph{validate} such estimates. Our theorem proves that while experimental data can be used to detect bias in observational studies, without additional assumptions on the smoothness of the correction function, it can not be used to remove it. We provide a practical example of such an assumption, developing a novel Gaussian Process based approach to construct intervals which contain the true treatment effect with high probability, both inside and outside of the support of the experimental data. We demonstrate our methodology on both simulated and semi-synthetic datasets and make the \href{https://github.com/Jakefawkes/Obs_and_exp_data}{code available}.
- Abstract(参考訳): 観測データは、しばしば大量に入手することができるが、観測されていない埋没の存在により、因果効果の推定に偏りが生じることがある。
最近の研究は、観測データを実験データで補足することで、このバイアスを除去しようとしている。
この研究において、この『両世界のベスト』アプローチに基本的な限界を置く定理を証明した。
不可能な推論の枠組みを用いて、観測データから推定される因果効果をemph{falsify} に実験データを使用することは可能であるが、一般にそのような推定をemph{validate} にすることは不可能であることを示す。
本定理は, 観測実験において, 補正関数の滑らかさを仮定することなく, 偏差を検出する実験データを用いることができるが, 除去には使用できないことを証明している。
このような仮定の実践例として、実験データの支持の内外において、真の処理効果を高い確率で含む間隔を構築するための新しいガウス過程に基づくアプローチを提案する。
シミュレーションと半合成の両方のデータセットで方法論を実証し,<href{https://github.com/Jakefawkes/Obs_and_exp_data}{code>を利用できるようにした。
関連論文リスト
- Causal Lifting of Neural Representations: Zero-Shot Generalization for Causal Inferences [56.23412698865433]
本研究では,ラベル付き類似実験を微調整した予測モデルを用いて,ラベル付き実結果を用いた対象実験の因果推論に焦点をあてる。
まず,経験的リスク最小化(ERM)による実結果推定は,対象個体群に対して有効な因果推論を導出できない可能性があることを示す。
本稿では,実証的リスク最小化法(DEM)を提案する。
論文 参考訳(メタデータ) (2025-02-10T10:52:17Z) - Combining Incomplete Observational and Randomized Data for Heterogeneous Treatment Effects [10.9134216137537]
既存の観測データとランダム化データを統合するには,テキスト完全観測データが必要である。
我々は、HTE推定のためのtextbfCombine textbfIncomplete textbfObservationalデータとランダム化データに対するレジリエントなアプローチを提案する。
論文 参考訳(メタデータ) (2024-10-28T06:19:14Z) - Approximating Counterfactual Bounds while Fusing Observational, Biased
and Randomised Data Sources [64.96984404868411]
我々は、複数の、偏見のある、観察的、介入的な研究からのデータを統合するという問題に対処する。
利用可能なデータの可能性は局所的な最大値を持たないことを示す。
次に、同じアプローチが複数のデータセットの一般的なケースにどのように対処できるかを示す。
論文 参考訳(メタデータ) (2023-07-31T11:28:24Z) - A Double Machine Learning Approach to Combining Experimental and Observational Data [59.29868677652324]
実験と観測を組み合わせた二重機械学習手法を提案する。
我々の枠組みは、より軽度の仮定の下で、外部の妥当性と無知の違反を検査する。
論文 参考訳(メタデータ) (2023-07-04T02:53:11Z) - Intervention Generalization: A View from Factor Graph Models [7.117681268784223]
操作されたシステムの分布の因子化に関する最小限の仮定に基づいて、過去の実験から新しい条件への飛躍をいかに保証するかを詳しく検討する。
仮定された$textitinterventional Factor Model$ (IFM) は必ずしも情報であるとは限らないが、不測のコンバウンディングとフィードバックのメカニズムを明示的にモデル化する必要性を便利に抽象化する。
論文 参考訳(メタデータ) (2023-06-06T21:44:23Z) - Falsification before Extrapolation in Causal Effect Estimation [6.715453431174765]
個体群における因果関係は、しばしば観測データを用いて推定される。
本稿では,偏りのある観測推定を拒否するメタアルゴリズムを提案する。
論文 参考訳(メタデータ) (2022-09-27T21:47:23Z) - Detecting hidden confounding in observational data using multiple
environments [0.81585306387285]
本論では, 隠れた接尾辞が存在する場合にのみ欠落する, 検証可能な条件不一致の理論について述べる。
ほとんどの場合、提案手法は隠れた共起の存在を正確に予測する。
論文 参考訳(メタデータ) (2022-05-27T12:20:09Z) - Combining Observational and Randomized Data for Estimating Heterogeneous
Treatment Effects [82.20189909620899]
不均一な治療効果を推定することは、多くの領域において重要な問題である。
現在、現存するほとんどの作品は観測データにのみ依存している。
本稿では、大量の観測データと少量のランダム化データを組み合わせることで、不均一な処理効果を推定する。
論文 参考訳(メタデータ) (2022-02-25T18:59:54Z) - Efficient Causal Inference from Combined Observational and
Interventional Data through Causal Reductions [68.6505592770171]
因果効果を推定する際の主な課題の1つである。
そこで本研究では,任意の数の高次元潜入共創者を置き換える新たな因果還元法を提案する。
パラメータ化縮小モデルを観測データと介入データから共同で推定する学習アルゴリズムを提案する。
論文 参考訳(メタデータ) (2021-03-08T14:29:07Z) - Learning Adjustment Sets from Observational and Limited Experimental
Data [9.028773906859541]
本研究では,大規模な観測データと限られた実験データを組み合わせて調整セットを同定する手法を提案する。
本手法は, 調整セットの同定に成功し, シミュレーションデータの因果効果推定を改善する。
論文 参考訳(メタデータ) (2020-05-18T14:23:32Z) - Showing Your Work Doesn't Always Work [73.63200097493576]
『Show Your Work: Improved Reporting of Experimental Results』では、最高の学習モデルの有効性を報告している。
解析的にそれらの推定器は偏りがあり、エラーを起こしやすい仮定を用いていることを示す。
我々は、偏見のない代替案を導き、統計的シミュレーションから経験的な証拠で主張を裏付ける。
論文 参考訳(メタデータ) (2020-04-28T17:59:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。