論文の概要: What can the millions of random treatments in nonexperimental data
reveal about causes?
- arxiv url: http://arxiv.org/abs/2105.01152v1
- Date: Mon, 3 May 2021 20:13:34 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-05 12:51:15.348576
- Title: What can the millions of random treatments in nonexperimental data
reveal about causes?
- Title(参考訳): 非実験データから何百万ものランダムな治療が原因を明らかにすることができるのか?
- Authors: Andre F. Ribeiro, Frank Neffke and Ricardo Hausmann
- Abstract要約: この記事ではこのようなモデルとベイズ的アプローチを紹介し、非経験的データで典型的に使用可能な 1(n2)$ のペアワイズ観測を組み合わせる。
提案手法は, 一般のnswサンプル, 任意のサブポピュレーションおよび大容量スーパーサンプルにおいて, 因果効果を回復することを示す。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: We propose a new method to estimate causal effects from nonexperimental data.
Each pair of sample units is first associated with a stochastic 'treatment' -
differences in factors between units - and an effect - a resultant outcome
difference. It is then proposed that all such pairs can be combined to provide
more accurate estimates of causal effects in observational data, provided a
statistical model connecting combinatorial properties of treatments to the
accuracy and unbiasedness of their effects. The article introduces one such
model and a Bayesian approach to combine the $O(n^2)$ pairwise observations
typically available in nonexperimnetal data. This also leads to an
interpretation of nonexperimental datasets as incomplete, or noisy, versions of
ideal factorial experimental designs.
This approach to causal effect estimation has several advantages: (1) it
expands the number of observations, converting thousands of individuals into
millions of observational treatments; (2) starting with treatments closest to
the experimental ideal, it identifies noncausal variables that can be ignored
in the future, making estimation easier in each subsequent iteration while
departing minimally from experiment-like conditions; (3) it recovers individual
causal effects in heterogeneous populations. We evaluate the method in
simulations and the National Supported Work (NSW) program, an intensively
studied program whose effects are known from randomized field experiments. We
demonstrate that the proposed approach recovers causal effects in common NSW
samples, as well as in arbitrary subpopulations and an order-of-magnitude
larger supersample with the entire national program data, outperforming
Statistical, Econometrics and Machine Learning estimators in all cases...
- Abstract(参考訳): 非実験データから因果効果を推定する新しい手法を提案する。
それぞれのサンプル単位は、まず、単位間の因子の確率的な「処理」差と、結果の差である効果に関連付けられる。
観察データにおける因果効果をより正確に推定するためにこれらのペアを組み合わせることが提案され、治療の組合せ特性とそれらの効果の正確さと偏りを結びつける統計モデルを提供した。
この記事ではそのようなモデルとベイズ的アプローチを紹介し、通常、実験的でないデータで利用できる$O(n^2)$ペアの観測を組み合わせている。
これはまた、実験的でないデータセットを理想的な因子的実験設計の不完全な、あるいはノイズの多いバージョンとして解釈する。
This approach to causal effect estimation has several advantages: (1) it expands the number of observations, converting thousands of individuals into millions of observational treatments; (2) starting with treatments closest to the experimental ideal, it identifies noncausal variables that can be ignored in the future, making estimation easier in each subsequent iteration while departing minimally from experiment-like conditions; (3) it recovers individual causal effects in heterogeneous populations.
シミュレーションの手法と,ランダムフィールド実験から効果が判明した集中的なプログラムであるnational supported work (nsw) プログラムの評価を行った。
提案手法は、共通のNSWサンプルの因果関係を回復し、任意のサブポピュレーションや、全国のプログラムデータ全体の大局的なスーパーサンプル、統計、計量、機械学習推定器を全て上回っていることを実証する。
関連論文リスト
- Multi-CATE: Multi-Accurate Conditional Average Treatment Effect Estimation Robust to Unknown Covariate Shifts [12.289361708127876]
我々は、CATE T-learnerを後処理するために、マルチ精度の予測子を学習するために方法論を使用する。
このアプローチは、(より大きな)確立された観測データと(より小さな)ランダム化されたデータセットを組み合わせることができることを示す。
論文 参考訳(メタデータ) (2024-05-28T14:12:25Z) - Identification of Single-Treatment Effects in Factorial Experiments [0.0]
実験において複数の介入がランダム化されている場合、実験環境外において単一の介入が与える影響は、不在の英雄的仮定とは見なされないことを示す。
観測研究と要因実験は、ゼロおよび複数介入による潜在的アウトカム分布に関する情報を提供する。
この種の設計に頼っている研究者は、関数形式の線形性を正当化するか、あるいはDirected Acyclic Graphsで変数が実世界でどのように関連しているかを特定する必要がある。
論文 参考訳(メタデータ) (2024-05-16T04:01:53Z) - Approximating Counterfactual Bounds while Fusing Observational, Biased
and Randomised Data Sources [64.96984404868411]
我々は、複数の、偏見のある、観察的、介入的な研究からのデータを統合するという問題に対処する。
利用可能なデータの可能性は局所的な最大値を持たないことを示す。
次に、同じアプローチが複数のデータセットの一般的なケースにどのように対処できるかを示す。
論文 参考訳(メタデータ) (2023-07-31T11:28:24Z) - Learning to Bound Counterfactual Inference in Structural Causal Models
from Observational and Randomised Data [64.96984404868411]
我々は、従来のEMベースのアルゴリズムを拡張するための全体的なデータの特徴付けを導出する。
新しいアルゴリズムは、そのような混合データソースからモデルパラメータの(不特定性)領域を近似することを学ぶ。
反実的な結果に間隔近似を与え、それが特定可能な場合の点に崩壊する。
論文 参考訳(メタデータ) (2022-12-06T12:42:11Z) - Combining Observational and Randomized Data for Estimating Heterogeneous
Treatment Effects [82.20189909620899]
不均一な治療効果を推定することは、多くの領域において重要な問題である。
現在、現存するほとんどの作品は観測データにのみ依存している。
本稿では、大量の観測データと少量のランダム化データを組み合わせることで、不均一な処理効果を推定する。
論文 参考訳(メタデータ) (2022-02-25T18:59:54Z) - Combining Experimental and Observational Data for Identification of
Long-Term Causal Effects [13.32091725929965]
本研究では、観察領域と実験領域のデータを用いて、治療変数の長期的な結果変数に対する因果効果を推定するタスクについて検討する。
観測データは共起していると考えられており、さらなる仮定なしでは、このデータセットは因果推論にも使用できない。
論文 参考訳(メタデータ) (2022-01-26T04:21:14Z) - Efficient Causal Inference from Combined Observational and
Interventional Data through Causal Reductions [68.6505592770171]
因果効果を推定する際の主な課題の1つである。
そこで本研究では,任意の数の高次元潜入共創者を置き換える新たな因果還元法を提案する。
パラメータ化縮小モデルを観測データと介入データから共同で推定する学習アルゴリズムを提案する。
論文 参考訳(メタデータ) (2021-03-08T14:29:07Z) - Tracking disease outbreaks from sparse data with Bayesian inference [55.82986443159948]
新型コロナウイルス(COVID-19)のパンデミックは、感染発生時の感染率を推定する新たな動機を与える。
標準的な手法は、より細かいスケールで共通する部分的な観測可能性とスパースなデータに対応するのに苦労する。
原理的に部分観測可能なベイズ的枠組みを提案する。
論文 参考訳(メタデータ) (2020-09-12T20:37:33Z) - Enabling Counterfactual Survival Analysis with Balanced Representations [64.17342727357618]
生存データは様々な医学的応用、すなわち薬物開発、リスクプロファイリング、臨床試験で頻繁に見られる。
本稿では,生存結果に適用可能な対実的推論のための理論的基盤を持つ統一的枠組みを提案する。
論文 参考訳(メタデータ) (2020-06-14T01:15:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。