論文の概要: Multiple imputation and test-wise deletion for causal discovery with
incomplete cohort data
- arxiv url: http://arxiv.org/abs/2108.13331v1
- Date: Mon, 30 Aug 2021 15:51:30 GMT
- ステータス: 処理完了
- システム内更新日: 2021-08-31 16:32:08.737508
- Title: Multiple imputation and test-wise deletion for causal discovery with
incomplete cohort data
- Title(参考訳): 不完全コホートデータを用いた因果発見のための多重インプテーションとテストワイズ削除
- Authors: Janine Witte, Ronja Foraita, Vanessa Didelez
- Abstract要約: 因果探索アルゴリズムは観測データから因果グラフを推定する。
最近まで、これらのアルゴリズムは欠落した値を扱うことができなかった。
テストワイド削除と多重計算の2つの方法について検討する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Causal discovery algorithms estimate causal graphs from observational data.
This can provide a valuable complement to analyses focussing on the causal
relation between individual treatment-outcome pairs. Constraint-based causal
discovery algorithms rely on conditional independence testing when building the
graph. Until recently, these algorithms have been unable to handle missing
values. In this paper, we investigate two alternative solutions: Test-wise
deletion and multiple imputation. We establish necessary and sufficient
conditions for the recoverability of causal structures under test-wise
deletion, and argue that multiple imputation is more challenging in the context
of causal discovery than for estimation. We conduct an extensive comparison by
simulating from benchmark causal graphs: As one might expect, we find that
test-wise deletion and multiple imputation both clearly outperform list-wise
deletion and single imputation. Crucially, our results further suggest that
multiple imputation is especially useful in settings with a small number of
either Gaussian or discrete variables, but when the dataset contains a mix of
both neither method is uniformly best. The methods we compare include random
forest imputation and a hybrid procedure combining test-wise deletion and
multiple imputation. An application to data from the IDEFICS cohort study on
diet- and lifestyle-related diseases in European children serves as an
illustrating example.
- Abstract(参考訳): 因果発見アルゴリズムは観測データから因果グラフを推定する。
これにより、個々の治療対対間の因果関係に注目した分析に貴重な補足を与えることができる。
制約に基づく因果探索アルゴリズムは、グラフを構築する際に条件付き独立性テストに依存する。
最近まで、これらのアルゴリズムは欠落した値を処理できなかった。
本稿では,テスト方向削除と複数インプテーションという2つの代替解について検討する。
我々は, 因果構造の復元性に必要十分条件を定め, 因果関係発見の文脈において, 因果関係発見よりも複数のインプテーションがより困難であると主張する。
ベンチマーク因果グラフをシミュレートして広範な比較を実施している。 予想通り、テスト毎の削除と複数のインプテーションは、リスト毎の削除と単一のインプテーションよりも明らかに優れています。
特にガウス変数と離散変数のどちらかが少数存在する場合, いずれの手法も混在している場合, いずれの手法も一意に最適である。
比較した手法は,ランダムな森林インプテーションと,テストワイズインプテーションと複数インプテーションを組み合わせたハイブリッド手法である。
IDEFICSコホートによる欧州の小児の食生活と生活習慣関連疾患のコホート研究のデータへの応用は、具体例である。
関連論文リスト
- Adaptive Online Experimental Design for Causal Discovery [9.447864414136905]
因果発見は因果グラフに符号化された因果関係を明らかにすることを目的としている。
オンライン学習の観点から,データの介入効率に着目し,因果発見を形式化する。
グラフ分離システムから介入を適応的に選択するトラック・アンド・ストップ因果探索アルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-05-19T13:26:33Z) - Membership Testing in Markov Equivalence Classes via Independence Query
Oracles [17.84347390320128]
因果関係を学習するよりも、因果関係をテストする方が比較的容易であることを示す。
特に、高いin-degreeと小さなcliqueサイズを特徴とするグラフにおいて、指数関数的に低い独立性テストが必要である。
論文 参考訳(メタデータ) (2024-03-09T02:10:08Z) - Learning to Bound Counterfactual Inference in Structural Causal Models
from Observational and Randomised Data [64.96984404868411]
我々は、従来のEMベースのアルゴリズムを拡張するための全体的なデータの特徴付けを導出する。
新しいアルゴリズムは、そのような混合データソースからモデルパラメータの(不特定性)領域を近似することを学ぶ。
反実的な結果に間隔近似を与え、それが特定可能な場合の点に崩壊する。
論文 参考訳(メタデータ) (2022-12-06T12:42:11Z) - Statistical and Computational Phase Transitions in Group Testing [73.55361918807883]
本研究の目的は、希少な疾患を患っているk人の集団を同定することである。
個々人のテストを割り当てるための2つの異なる単純なランダムな手順を考える。
論文 参考訳(メタデータ) (2022-06-15T16:38:50Z) - Equivariance Allows Handling Multiple Nuisance Variables When Analyzing
Pooled Neuroimaging Datasets [53.34152466646884]
本稿では,構造空間上でインスタンス化された同変表現学習における最近の結果と,因果推論における古典的結果の簡易な利用が,いかに効果的に実現されたかを示す。
いくつかの仮定の下で、我々のモデルが複数のニュアンス変数を扱えることを実証し、そうでなければサンプルの大部分を取り除く必要のあるシナリオにおいて、プールされた科学データセットの分析を可能にする。
論文 参考訳(メタデータ) (2022-03-29T04:54:06Z) - MIRACLE: Causally-Aware Imputation via Learning Missing Data Mechanisms [82.90843777097606]
欠落データに対する因果認識型計算アルゴリズム(MIRACLE)を提案する。
MIRACLEは、欠落発生機構を同時にモデル化することにより、ベースラインの計算を反復的に洗練する。
我々は、MIRACLEが一貫してイミューテーションを改善することができることを示すために、合成および様々な公開データセットに関する広範な実験を行う。
論文 参考訳(メタデータ) (2021-11-04T22:38:18Z) - Improving Efficiency and Accuracy of Causal Discovery Using a
Hierarchical Wrapper [7.570246812206772]
観測データからの因果発見は、科学の多くの分野において重要なツールである。
大規模なサンプルリミットでは、音と完全な因果探索アルゴリズムが導入されている。
しかし、これらのアルゴリズムが使用する統計的テストのパワーを制限するのは、有限のトレーニングデータのみである。
論文 参考訳(メタデータ) (2021-07-11T09:24:49Z) - Multi-Source Causal Inference Using Control Variates [81.57072928775509]
本稿では,複数のデータソースから因果効果を推定するアルゴリズムを提案する。
理論的には、これはATE推定値の分散を減少させる。
このフレームワークを結果選択バイアスの下で観測データからの推論に適用する。
論文 参考訳(メタデータ) (2021-03-30T21:20:51Z) - On the Sample Complexity of Causal Discovery and the Value of Domain
Expertise [0.0]
因果発見法は、純粋観測データからランダム変数間の因果関係を同定する。
本稿では,CIオラクルを使わずに因果探索アルゴリズムのサンプル複雑性を解析する。
我々の方法では、データサンプルの観点からドメインの専門知識の価値を定量化できます。
論文 参考訳(メタデータ) (2021-02-05T16:26:17Z) - Group Testing with a Graph Infection Spread Model [61.48558770435175]
感染は個人間のつながりを通じて広がり、その結果、確率的クラスター形成構造と、個人に対する非i.d.感染状態が生じる。
そこで本研究では,既知の確率的感染拡散モデルを利用する2段階のサンプルグループテストアルゴリズムを提案する。
その結果, 感染率が高い場合でも, 集団検査により必要な検査数を大幅に削減できることが示唆された。
論文 参考訳(メタデータ) (2021-01-14T18:51:32Z) - A Single Iterative Step for Anytime Causal Discovery [7.570246812206772]
観測された非介入データから因果グラフを回復するための健全で完全なアルゴリズムを提示する。
我々は因果マルコフと忠実性仮定に依存し、基礎となる因果グラフの同値クラスを回復する。
提案アルゴリズムでは,FCIアルゴリズムと比較して,CIテストと条件セットの大幅な削減が要求される。
論文 参考訳(メタデータ) (2020-12-14T13:46:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。