論文の概要: Causal discovery for observational sciences using supervised machine
learning
- arxiv url: http://arxiv.org/abs/2202.12813v1
- Date: Fri, 25 Feb 2022 16:44:00 GMT
- ステータス: 処理完了
- システム内更新日: 2022-02-28 16:16:56.169421
- Title: Causal discovery for observational sciences using supervised machine
learning
- Title(参考訳): 教師付き機械学習による観測科学の因果発見
- Authors: Anne Helby Petersen, Joseph Ramsey, Claus Thorn Ekstr{\o}m and Peter
Spirtes
- Abstract要約: 因果推論は因果効果を推定することができるが、データが実験的に収集されない限り、統計分析は事前に特定された因果モデルに依存する必要がある。
いくつかの正しい方法は既に存在するが、通常はより小さなサンプルで苦労する。
ほとんどの手法は、非常にスパースな因果モデルに焦点をあてるが、これは必ずしも現実的なデータ生成機構の現実的な表現ではないかもしれない。
本稿では,これら3つの欠点に対処する新たな因果発見手法を提案する。
- 参考スコア(独自算出の注目度): 1.6631602844999722
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Causal inference can estimate causal effects, but unless data are collected
experimentally, statistical analyses must rely on pre-specified causal models.
Causal discovery algorithms are empirical methods for constructing such causal
models from data.
Several asymptotically correct methods already exist, but they generally
struggle on smaller samples. Moreover, most methods focus on very sparse causal
models, which may not always be a realistic representation of real-life data
generating mechanisms. Finally, while causal relationships suggested by the
methods often hold true, their claims about causal non-relatedness have high
error rates. This non-conservative error tradeoff is not ideal for
observational sciences, where the resulting model is directly used to inform
causal inference: A causal model with many missing causal relations entails too
strong assumptions and may lead to biased effect estimates.
We propose a new causal discovery method that addresses these three
shortcomings: Supervised learning discovery (SLdisco). SLdisco uses supervised
machine learning to obtain a mapping from observational data to equivalence
classes of causal models.
We evaluate SLdisco in a large simulation study based on Gaussian data and we
consider several choices of model size and sample size. We find that SLdisco is
more conservative, only moderately less informative and less sensitive towards
sample size than existing procedures.
We furthermore provide a real epidemiological data application. We use random
subsampling to investigate real data performance on small samples and again
find that SLdisco is less sensitive towards sample size and hence seems to
better utilize the information available in small datasets.
- Abstract(参考訳): 因果推論は因果効果を推定するが、データが実験的に収集されない限り、統計的分析は予め特定された因果モデルに依存する必要がある。
因果発見アルゴリズムは、データからそのような因果モデルを構築するための実証的な方法である。
いくつかの漸近的に正しい方法がすでに存在するが、通常はより小さなサンプルに苦しむ。
さらに、ほとんどの手法は、常に現実的なデータ生成機構の現実的な表現であるとは限らない非常にスパースな因果モデルに焦点を当てている。
最後に、手法によって提案される因果関係はしばしば成り立つが、因果関係の非関連性に関する主張は誤り率が高い。
この非保存的エラートレードオフは観測科学にとって理想的ではなく、結果のモデルは因果推論に直接使われる: 因果関係の欠如が多い因果モデルには、あまりにも強い仮定が伴い、偏りのある効果推定に繋がる可能性がある。
本研究では,これら3つの欠点を解決する新しい因果的発見法を提案する。
SLdiscoは教師付き機械学習を使用して、観測データから因果モデルの等価クラスへのマッピングを取得する。
ガウスデータに基づく大規模シミュレーション研究においてsldiscoを評価し,モデルサイズとサンプルサイズについて検討した。
SLdiscoは従来よりも保守的で, 情報量が少なく, サンプルサイズに敏感であることがわかった。
さらに,実際の疫学データ応用も提供する。
また、sldiscoはサンプルサイズに対して感度が低く、そのため小さなデータセットで利用可能な情報をよりよく活用しているように思われる。
関連論文リスト
- CAnDOIT: Causal Discovery with Observational and Interventional Data from Time-Series [4.008958683836471]
CAnDOITは、観測データと介入データの両方を用いて因果モデルを再構築する因果発見手法である。
因果解析における介入データの利用は、ロボット工学のような現実世界の応用には不可欠である。
CAnDOITのPython実装も開発され、GitHubで公開されている。
論文 参考訳(メタデータ) (2024-10-03T13:57:08Z) - Smoke and Mirrors in Causal Downstream Tasks [59.90654397037007]
本稿では, 治療効果推定の因果推論タスクについて検討し, 高次元観察において利害関係が記録されている。
最先端の視覚バックボーンから微調整した6つの480モデルを比較し、サンプリングとモデリングの選択が因果推定の精度に大きく影響することを発見した。
以上の結果から,今後のベンチマークでは,下流の科学的問題,特に因果的な問題について慎重に検討すべきであることが示唆された。
論文 参考訳(メタデータ) (2024-05-27T13:26:34Z) - Sample, estimate, aggregate: A recipe for causal discovery foundation models [28.116832159265964]
我々は、古典因果探索アルゴリズムの出力からより大きな因果グラフを予測することを学ぶ教師付きモデルを訓練する。
我々のアプローチは、古典的手法の出力における典型的なエラーがデータセット間で比較できるという観察によって実現されている。
実データおよび合成データに関する実験では、このモデルが不特定性や分布シフトに直面して高い精度を維持することを示した。
論文 参考訳(メタデータ) (2024-02-02T21:57:58Z) - Discovering Mixtures of Structural Causal Models from Time Series Data [23.18511951330646]
基礎となる因果モデルを推測するために, MCD と呼ばれる一般的な変分推論に基づくフレームワークを提案する。
このアプローチでは、データ可能性のエビデンス-ローバウンドを最大化するエンドツーエンドのトレーニングプロセスを採用しています。
本研究では,本手法が因果発見タスクにおける最先端のベンチマークを上回ることを実証する。
論文 参考訳(メタデータ) (2023-10-10T05:13:10Z) - Active Bayesian Causal Inference [72.70593653185078]
因果発見と推論を統合するための完全ベイズ能動学習フレームワークであるアクティブベイズ因果推論(ABCI)を提案する。
ABCIは因果関係のモデルと関心のクエリを共同で推論する。
我々のアプローチは、完全な因果グラフの学習のみに焦点を当てた、いくつかのベースラインよりも、よりデータ効率が高いことを示す。
論文 参考訳(メタデータ) (2022-06-04T22:38:57Z) - Combining Observational and Randomized Data for Estimating Heterogeneous
Treatment Effects [82.20189909620899]
不均一な治療効果を推定することは、多くの領域において重要な問題である。
現在、現存するほとんどの作品は観測データにのみ依存している。
本稿では、大量の観測データと少量のランダム化データを組み合わせることで、不均一な処理効果を推定する。
論文 参考訳(メタデータ) (2022-02-25T18:59:54Z) - Improving Efficiency and Accuracy of Causal Discovery Using a
Hierarchical Wrapper [7.570246812206772]
観測データからの因果発見は、科学の多くの分野において重要なツールである。
大規模なサンプルリミットでは、音と完全な因果探索アルゴリズムが導入されている。
しかし、これらのアルゴリズムが使用する統計的テストのパワーを制限するのは、有限のトレーニングデータのみである。
論文 参考訳(メタデータ) (2021-07-11T09:24:49Z) - Efficient Causal Inference from Combined Observational and
Interventional Data through Causal Reductions [68.6505592770171]
因果効果を推定する際の主な課題の1つである。
そこで本研究では,任意の数の高次元潜入共創者を置き換える新たな因果還元法を提案する。
パラメータ化縮小モデルを観測データと介入データから共同で推定する学習アルゴリズムを提案する。
論文 参考訳(メタデータ) (2021-03-08T14:29:07Z) - Good Classifiers are Abundant in the Interpolating Regime [64.72044662855612]
補間分類器間のテストエラーの完全な分布を正確に計算する手法を開発した。
テストエラーは、最悪の補間モデルのテストエラーから大きく逸脱する、小さな典型的な$varepsilon*$に集中する傾向にある。
以上の結果から,統計的学習理論における通常の解析手法は,実際に観測された優れた一般化性能を捉えるのに十分な粒度にはならない可能性が示唆された。
論文 参考訳(メタデータ) (2020-06-22T21:12:31Z) - Amortized Causal Discovery: Learning to Infer Causal Graphs from
Time-Series Data [63.15776078733762]
本稿では,時系列データから因果関係を推定する新しいフレームワークであるAmortized Causal Discoveryを提案する。
本研究では,本手法が変分モデルとして実装され,因果発見性能が大幅に向上することを示した。
論文 参考訳(メタデータ) (2020-06-18T19:59:12Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。