論文の概要: Causal discovery for observational sciences using supervised machine
learning
- arxiv url: http://arxiv.org/abs/2202.12813v1
- Date: Fri, 25 Feb 2022 16:44:00 GMT
- ステータス: 処理完了
- システム内更新日: 2022-02-28 16:16:56.169421
- Title: Causal discovery for observational sciences using supervised machine
learning
- Title(参考訳): 教師付き機械学習による観測科学の因果発見
- Authors: Anne Helby Petersen, Joseph Ramsey, Claus Thorn Ekstr{\o}m and Peter
Spirtes
- Abstract要約: 因果推論は因果効果を推定することができるが、データが実験的に収集されない限り、統計分析は事前に特定された因果モデルに依存する必要がある。
いくつかの正しい方法は既に存在するが、通常はより小さなサンプルで苦労する。
ほとんどの手法は、非常にスパースな因果モデルに焦点をあてるが、これは必ずしも現実的なデータ生成機構の現実的な表現ではないかもしれない。
本稿では,これら3つの欠点に対処する新たな因果発見手法を提案する。
- 参考スコア(独自算出の注目度): 1.6631602844999722
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Causal inference can estimate causal effects, but unless data are collected
experimentally, statistical analyses must rely on pre-specified causal models.
Causal discovery algorithms are empirical methods for constructing such causal
models from data.
Several asymptotically correct methods already exist, but they generally
struggle on smaller samples. Moreover, most methods focus on very sparse causal
models, which may not always be a realistic representation of real-life data
generating mechanisms. Finally, while causal relationships suggested by the
methods often hold true, their claims about causal non-relatedness have high
error rates. This non-conservative error tradeoff is not ideal for
observational sciences, where the resulting model is directly used to inform
causal inference: A causal model with many missing causal relations entails too
strong assumptions and may lead to biased effect estimates.
We propose a new causal discovery method that addresses these three
shortcomings: Supervised learning discovery (SLdisco). SLdisco uses supervised
machine learning to obtain a mapping from observational data to equivalence
classes of causal models.
We evaluate SLdisco in a large simulation study based on Gaussian data and we
consider several choices of model size and sample size. We find that SLdisco is
more conservative, only moderately less informative and less sensitive towards
sample size than existing procedures.
We furthermore provide a real epidemiological data application. We use random
subsampling to investigate real data performance on small samples and again
find that SLdisco is less sensitive towards sample size and hence seems to
better utilize the information available in small datasets.
- Abstract(参考訳): 因果推論は因果効果を推定するが、データが実験的に収集されない限り、統計的分析は予め特定された因果モデルに依存する必要がある。
因果発見アルゴリズムは、データからそのような因果モデルを構築するための実証的な方法である。
いくつかの漸近的に正しい方法がすでに存在するが、通常はより小さなサンプルに苦しむ。
さらに、ほとんどの手法は、常に現実的なデータ生成機構の現実的な表現であるとは限らない非常にスパースな因果モデルに焦点を当てている。
最後に、手法によって提案される因果関係はしばしば成り立つが、因果関係の非関連性に関する主張は誤り率が高い。
この非保存的エラートレードオフは観測科学にとって理想的ではなく、結果のモデルは因果推論に直接使われる: 因果関係の欠如が多い因果モデルには、あまりにも強い仮定が伴い、偏りのある効果推定に繋がる可能性がある。
本研究では,これら3つの欠点を解決する新しい因果的発見法を提案する。
SLdiscoは教師付き機械学習を使用して、観測データから因果モデルの等価クラスへのマッピングを取得する。
ガウスデータに基づく大規模シミュレーション研究においてsldiscoを評価し,モデルサイズとサンプルサイズについて検討した。
SLdiscoは従来よりも保守的で, 情報量が少なく, サンプルサイズに敏感であることがわかった。
さらに,実際の疫学データ応用も提供する。
また、sldiscoはサンプルサイズに対して感度が低く、そのため小さなデータセットで利用可能な情報をよりよく活用しているように思われる。
関連論文リスト
- Discovering Mixtures of Structural Causal Models from Time Series Data [26.057750839209127]
基礎となる因果モデルを推測するために, MCD と呼ばれる一般的な変分推論に基づくフレームワークを提案する。
このアプローチでは、データ可能性のエビデンス-ローバウンドを最大化するエンドツーエンドのトレーニングプロセスを採用しています。
本研究では,本手法が因果発見タスクにおける最先端のベンチマークを上回ることを実証する。
論文 参考訳(メタデータ) (2023-10-10T05:13:10Z) - How to select predictive models for causal inference? [0.0]
従来の機械学習モデル選択は因果推論の最良の結果モデルを選択しないことを示す。
Rtext-risk$, フレキシブルな推定器を用いて列車集合上のニュアンスモデルを計算する。
論文 参考訳(メタデータ) (2023-02-01T10:58:55Z) - Active Bayesian Causal Inference [72.70593653185078]
因果発見と推論を統合するための完全ベイズ能動学習フレームワークであるアクティブベイズ因果推論(ABCI)を提案する。
ABCIは因果関係のモデルと関心のクエリを共同で推論する。
我々のアプローチは、完全な因果グラフの学習のみに焦点を当てた、いくつかのベースラインよりも、よりデータ効率が高いことを示す。
論文 参考訳(メタデータ) (2022-06-04T22:38:57Z) - MissDAG: Causal Discovery in the Presence of Missing Data with
Continuous Additive Noise Models [78.72682320019737]
不完全な観測データから因果発見を行うため,MissDAGと呼ばれる一般的な手法を開発した。
MissDAGは、期待-最大化の枠組みの下で観測の可視部分の期待される可能性を最大化する。
各種因果探索アルゴリズムを組み込んだMissDAGの柔軟性について,広範囲なシミュレーションと実データ実験により検証した。
論文 参考訳(メタデータ) (2022-05-27T09:59:46Z) - Combining Observational and Randomized Data for Estimating Heterogeneous
Treatment Effects [82.20189909620899]
不均一な治療効果を推定することは、多くの領域において重要な問題である。
現在、現存するほとんどの作品は観測データにのみ依存している。
本稿では、大量の観測データと少量のランダム化データを組み合わせることで、不均一な処理効果を推定する。
論文 参考訳(メタデータ) (2022-02-25T18:59:54Z) - Evaluating Causal Inference Methods [0.4588028371034407]
我々は、因果推論手法を検証するために、深層生成モデルに基づくフレームワーク、クレデンスを導入する。
我々の研究は、因果推論手法を検証するために、深層生成モデルに基づくフレームワーク、クレデンスを導入している。
論文 参考訳(メタデータ) (2022-02-09T00:21:22Z) - Improving Efficiency and Accuracy of Causal Discovery Using a
Hierarchical Wrapper [7.570246812206772]
観測データからの因果発見は、科学の多くの分野において重要なツールである。
大規模なサンプルリミットでは、音と完全な因果探索アルゴリズムが導入されている。
しかし、これらのアルゴリズムが使用する統計的テストのパワーを制限するのは、有限のトレーニングデータのみである。
論文 参考訳(メタデータ) (2021-07-11T09:24:49Z) - Efficient Causal Inference from Combined Observational and
Interventional Data through Causal Reductions [68.6505592770171]
因果効果を推定する際の主な課題の1つである。
そこで本研究では,任意の数の高次元潜入共創者を置き換える新たな因果還元法を提案する。
パラメータ化縮小モデルを観測データと介入データから共同で推定する学習アルゴリズムを提案する。
論文 参考訳(メタデータ) (2021-03-08T14:29:07Z) - Good Classifiers are Abundant in the Interpolating Regime [64.72044662855612]
補間分類器間のテストエラーの完全な分布を正確に計算する手法を開発した。
テストエラーは、最悪の補間モデルのテストエラーから大きく逸脱する、小さな典型的な$varepsilon*$に集中する傾向にある。
以上の結果から,統計的学習理論における通常の解析手法は,実際に観測された優れた一般化性能を捉えるのに十分な粒度にはならない可能性が示唆された。
論文 参考訳(メタデータ) (2020-06-22T21:12:31Z) - Amortized Causal Discovery: Learning to Infer Causal Graphs from
Time-Series Data [63.15776078733762]
本稿では,時系列データから因果関係を推定する新しいフレームワークであるAmortized Causal Discoveryを提案する。
本研究では,本手法が変分モデルとして実装され,因果発見性能が大幅に向上することを示した。
論文 参考訳(メタデータ) (2020-06-18T19:59:12Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。