論文の概要: Causal Inference With Selectively Deconfounded Data
- arxiv url: http://arxiv.org/abs/2002.11096v4
- Date: Sun, 7 Mar 2021 01:33:15 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-28 21:20:57.568092
- Title: Causal Inference With Selectively Deconfounded Data
- Title(参考訳): 選択的に分解されたデータによる因果推論
- Authors: Kyra Gan, Andrew A. Li, Zachary C. Lipton, Sridhar Tayur
- Abstract要約: 我々は、平均治療効果(ATE)を推定する際に、大規模な統合された観測データセット(共同設立者なし)と小さな非統合された観測データセット(共同設立者明らかに)を組み込むことの利点を検討する。
理論的には, 待ち行列を所望の精度で推定するために必要なデコンストラクタデータの量を大幅に削減できる可能性が示唆された。
- 参考スコア(独自算出の注目度): 22.624714904663424
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Given only data generated by a standard confounding graph with unobserved
confounder, the Average Treatment Effect (ATE) is not identifiable. To estimate
the ATE, a practitioner must then either (a) collect deconfounded data;(b) run
a clinical trial; or (c) elucidate further properties of the causal graph that
might render the ATE identifiable. In this paper, we consider the benefit of
incorporating a large confounded observational dataset (confounder unobserved)
alongside a small deconfounded observational dataset (confounder revealed) when
estimating the ATE. Our theoretical results suggest that the inclusion of
confounded data can significantly reduce the quantity of deconfounded data
required to estimate the ATE to within a desired accuracy level. Moreover, in
some cases -- say, genetics -- we could imagine retrospectively selecting
samples to deconfound. We demonstrate that by actively selecting these samples
based upon the (already observed) treatment and outcome, we can reduce sample
complexity further. Our theoretical and empirical results establish that the
worst-case relative performance of our approach (vs. a natural benchmark) is
bounded while our best-case gains are unbounded. Finally, we demonstrate the
benefits of selective deconfounding using a large real-world dataset related to
genetic mutation in cancer.
- Abstract(参考訳): 標準的なコンバウンディンググラフと保存されていないコンファウンダリで生成されたデータのみを考えると、平均処理効果(ATE)は識別できない。
ATEを見積もるには、実践者はいずれかにしなければならない
(a)非定型データの収集
b) 臨床試験を実施すること,又は
(c) ATEを識別できるかもしれない因果グラフのさらなる性質を解明する。
本稿では、ateを推定する際に、小型の非共役観測データセット(共同設立者不明)とともに、巨大共役観測データセット(共同設立者不明)を組み込むことの利点を考察する。
理論的には, 待ち行列を所望の精度で推定するために必要なデコンストラクタデータの量を大幅に削減できる可能性が示唆された。
さらに、遺伝学など一部のケースでは、再考してサンプルを分解する例も考えられる。
既に観察されている)治療と結果に基づいて,これらの試料を積極的に選択することにより,試料の複雑さをさらに軽減できることを示す。
我々の理論的および実証的な結果は、我々のアプローチの最悪の相対的な性能(例えば、自然ベンチマーク)が有界であり、ベストケースの利得は非有界であることを示す。
最後に, がんの遺伝子変異に関連する大規模な実世界データセットを用いて, 選択的解凍の利点を実証する。
関連論文リスト
- Combining Incomplete Observational and Randomized Data for Heterogeneous Treatment Effects [10.9134216137537]
既存の観測データとランダム化データを統合するには,テキスト完全観測データが必要である。
我々は、HTE推定のためのtextbfCombine textbfIncomplete textbfObservationalデータとランダム化データに対するレジリエントなアプローチを提案する。
論文 参考訳(メタデータ) (2024-10-28T06:19:14Z) - Efficient adjustment for complex covariates: Gaining efficiency with
DOPE [56.537164957672715]
共変量によって表現される情報のサブセットを調整可能なフレームワークを提案する。
理論的な結果に基づいて,平均処理効果(ATE)の効率的な評価を目的とした,デバイアスドアウトカム適応確率推定器(DOPE)を提案する。
その結果,DOPE は様々な観測環境において ATE 推定のための効率的かつ堅牢な手法を提供することがわかった。
論文 参考訳(メタデータ) (2024-02-20T13:02:51Z) - Approximating Counterfactual Bounds while Fusing Observational, Biased
and Randomised Data Sources [64.96984404868411]
我々は、複数の、偏見のある、観察的、介入的な研究からのデータを統合するという問題に対処する。
利用可能なデータの可能性は局所的な最大値を持たないことを示す。
次に、同じアプローチが複数のデータセットの一般的なケースにどのように対処できるかを示す。
論文 参考訳(メタデータ) (2023-07-31T11:28:24Z) - Temporal Output Discrepancy for Loss Estimation-based Active Learning [65.93767110342502]
ラベルのないサンプルが高損失を伴っていると信じられている場合に,データアノテーションのオラクルに問い合わせる,新しいディープラーニングアプローチを提案する。
本手法は,画像分類やセマンティックセグメンテーションタスクにおける最先端の能動学習手法よりも優れた性能を実現する。
論文 参考訳(メタデータ) (2022-12-20T19:29:37Z) - Falsification before Extrapolation in Causal Effect Estimation [6.715453431174765]
個体群における因果関係は、しばしば観測データを用いて推定される。
本稿では,偏りのある観測推定を拒否するメタアルゴリズムを提案する。
論文 参考訳(メタデータ) (2022-09-27T21:47:23Z) - Combining Observational and Randomized Data for Estimating Heterogeneous
Treatment Effects [82.20189909620899]
不均一な治療効果を推定することは、多くの領域において重要な問題である。
現在、現存するほとんどの作品は観測データにのみ依存している。
本稿では、大量の観測データと少量のランダム化データを組み合わせることで、不均一な処理効果を推定する。
論文 参考訳(メタデータ) (2022-02-25T18:59:54Z) - Multi-Source Causal Inference Using Control Variates [81.57072928775509]
本稿では,複数のデータソースから因果効果を推定するアルゴリズムを提案する。
理論的には、これはATE推定値の分散を減少させる。
このフレームワークを結果選択バイアスの下で観測データからの推論に適用する。
論文 参考訳(メタデータ) (2021-03-30T21:20:51Z) - Quantifying Ignorance in Individual-Level Causal-Effect Estimates under
Hidden Confounding [38.09565581056218]
共同設立者による高次元観測データから条件付き平均治療効果(CATE)の学習問題について検討した。
高次元データに適した新しいパラメトリック間隔推定器を提案する。
論文 参考訳(メタデータ) (2021-03-08T15:58:06Z) - Provably Efficient Causal Reinforcement Learning with Confounded
Observational Data [135.64775986546505]
オフラインで収集されたデータセット(観測データ)を組み込んで、オンライン環境でのサンプル効率を改善する方法について検討する。
提案手法は,観測データを効率よく組み込んだ,分解された楽観的値反復 (DOVI) アルゴリズムを提案する。
論文 参考訳(メタデータ) (2020-06-22T14:49:33Z) - Overly Optimistic Prediction Results on Imbalanced Data: a Case Study of
Flaws and Benefits when Applying Over-sampling [13.463035357173045]
データを相互に排他的なトレーニングとテストセットに分割する前にオーバーサンプリングを適用する。
この結果が,2つの人工データセットを用いて偏りを生じさせ,この欠陥が同定された研究結果を再現することを示す。
論文 参考訳(メタデータ) (2020-01-15T12:53:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。