論文の概要: Large-Scale Differentiable Causal Discovery of Factor Graphs
- arxiv url: http://arxiv.org/abs/2206.07824v1
- Date: Wed, 15 Jun 2022 21:28:36 GMT
- ステータス: 処理完了
- システム内更新日: 2022-06-18 17:40:42.712827
- Title: Large-Scale Differentiable Causal Discovery of Factor Graphs
- Title(参考訳): 因子グラフの大規模微分可能因果発見
- Authors: Romain Lopez, Jan-Christian H\"utter, Jonathan K. Pritchard, Aviv
Regev
- Abstract要約: 本稿では,非線形低ランク因果相互作用モデルへの探索空間の方法として,因子指向非巡回グラフ(f-DAG)の概念を導入する。
本稿では,f-DAG制約因果探索のスケーラブルな実装を提案する。
- 参考スコア(独自算出の注目度): 3.8015092217142223
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: A common theme in causal inference is learning causal relationships between
observed variables, also known as causal discovery. This is usually a daunting
task, given the large number of candidate causal graphs and the combinatorial
nature of the search space. Perhaps for this reason, most research has so far
focused on relatively small causal graphs, with up to hundreds of nodes.
However, recent advances in fields like biology enable generating experimental
data sets with thousands of interventions followed by rich profiling of
thousands of variables, raising the opportunity and urgent need for large
causal graph models. Here, we introduce the notion of factor directed acyclic
graphs (f-DAGs) as a way to restrict the search space to non-linear low-rank
causal interaction models. Combining this novel structural assumption with
recent advances that bridge the gap between causal discovery and continuous
optimization, we achieve causal discovery on thousands of variables.
Additionally, as a model for the impact of statistical noise on this estimation
procedure, we study a model of edge perturbations of the f-DAG skeleton based
on random graphs and quantify the effect of such perturbations on the f-DAG
rank. This theoretical analysis suggests that the set of candidate f-DAGs is
much smaller than the whole DAG space and thus more statistically robust in the
high-dimensional regime where the underlying skeleton is hard to assess. We
propose Differentiable Causal Discovery of Factor Graphs (DCD-FG), a scalable
implementation of f-DAG constrained causal discovery for high-dimensional
interventional data. DCD-FG uses a Gaussian non-linear low-rank structural
equation model and shows significant improvements compared to state-of-the-art
methods in both simulations as well as a recent large-scale single-cell RNA
sequencing data set with hundreds of genetic interventions.
- Abstract(参考訳): 因果推論における一般的なテーマは、観察された変数間の因果関係を学習することである。
これは通常、多くの候補因果グラフと探索空間の組合せ的性質を考えると、厄介なタスクである。
おそらくこの理由から、ほとんどの研究は、数百のノードを持つ比較的小さな因果グラフに焦点を合わせてきた。
しかし、生物学などの分野の最近の進歩により、数千の介入による実験データセットの生成と、数千の変数の豊富なプロファイリングが可能になり、大きな因果グラフモデルの必要性が高まりつつある。
本稿では,非線型低ランク因果相互作用モデルに探索空間を限定する手段として,因子指向非巡回グラフ (f-DAG) の概念を導入する。
この新たな構造仮定と因果発見と連続最適化のギャップを埋める最近の進歩を組み合わせることで、何千もの変数の因果発見を実現する。
さらに, この推定法における統計的ノイズの影響のモデルとして, ランダムグラフに基づくf-DAG骨格のエッジ摂動モデルについて検討し, それらの摂動がf-DAGランクに与える影響を定量化する。
この理論解析は、候補f-DAGの集合がDAG空間全体よりもはるかに小さく、基底骨格が評価が難しい高次元構造においてより統計的に堅牢であることを示している。
本稿では,f-DAG制約付き因果探索のスケーラブルな実装である因子グラフの微分因果探索(DCD-FG)を提案する。
DCD-FGはガウスの非線形低ランク構造方程式モデルを用いており、両方のシミュレーションにおける最先端の手法と、数百の遺伝的介入を伴う最近の大規模単一細胞RNAシークエンシングデータセットと比較して大幅に改善されている。
関連論文リスト
- Predicting perturbation targets with causal differential networks [23.568795598997376]
我々は、因果グラフを観察および介入データセットから推定するために、償却因果探索モデルを用いる。
我々は、これらのペアグラフを、教師付き学習フレームワークで介入された変数の集合にマッピングすることを学ぶ。
このアプローチは、7つのシングルセルトランスクリプトミクスデータセットの摂動モデリングのベースラインを一貫して上回る。
論文 参考訳(メタデータ) (2024-10-04T12:48:21Z) - Adaptive Online Experimental Design for Causal Discovery [9.447864414136905]
因果発見は因果グラフに符号化された因果関係を明らかにすることを目的としている。
オンライン学習の観点から,データの介入効率に着目し,因果発見を形式化する。
グラフ分離システムから介入を適応的に選択するトラック・アンド・ストップ因果探索アルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-05-19T13:26:33Z) - Sample, estimate, aggregate: A recipe for causal discovery foundation models [28.116832159265964]
我々は、古典因果探索アルゴリズムの出力からより大きな因果グラフを予測することを学ぶ教師付きモデルを訓練する。
我々のアプローチは、古典的手法の出力における典型的なエラーがデータセット間で比較できるという観察によって実現されている。
実データおよび合成データに関する実験では、このモデルが不特定性や分布シフトに直面して高い精度を維持することを示した。
論文 参考訳(メタデータ) (2024-02-02T21:57:58Z) - Learning Latent Structural Causal Models [31.686049664958457]
機械学習タスクでは、画像ピクセルや高次元ベクトルのような低レベルのデータを扱うことが多い。
本稿では,潜在構造因果モデルの因果変数,構造,パラメータについて共同推論を行う,抽出可能な近似推定手法を提案する。
論文 参考訳(メタデータ) (2022-10-24T20:09:44Z) - Effect Identification in Cluster Causal Diagrams [51.42809552422494]
クラスタ因果図(略してC-DAG)と呼ばれる新しいタイプのグラフィカルモデルを導入する。
C-DAGは、限定された事前知識に基づいて変数間の関係を部分的に定義することができる。
我々はC-DAGに対する因果推論のための基礎と機械を開発する。
論文 参考訳(メタデータ) (2022-02-22T21:27:31Z) - BCDAG: An R package for Bayesian structure and Causal learning of
Gaussian DAGs [77.34726150561087]
観測データから因果関係の発見と因果関係を推定するためのRパッケージを提案する。
我々の実装は、観測回数とともに効率的にスケールし、DAGが十分にスパースであるたびに、データセット内の変数の数を削減します。
次に、実際のデータセットとシミュレーションデータセットの両方で、主な機能とアルゴリズムを説明します。
論文 参考訳(メタデータ) (2022-01-28T09:30:32Z) - BCD Nets: Scalable Variational Approaches for Bayesian Causal Discovery [97.79015388276483]
構造方程式モデル(SEM)は、有向非巡回グラフ(DAG)を介して表される因果関係を推論する効果的な枠組みである。
近年の進歩により、観測データからDAGの有効最大点推定が可能となった。
線形ガウス SEM を特徴付ける DAG 上の分布を推定するための変分フレームワークである BCD Nets を提案する。
論文 参考訳(メタデータ) (2021-12-06T03:35:21Z) - Learning Neural Causal Models with Active Interventions [83.44636110899742]
本稿では,データ生成プロセスの根底にある因果構造を素早く識別する能動的介入ターゲット機構を提案する。
本手法は,ランダムな介入ターゲティングと比較して,要求される対話回数を大幅に削減する。
シミュレーションデータから実世界のデータまで,複数のベンチマークにおいて優れた性能を示す。
論文 参考訳(メタデータ) (2021-09-06T13:10:37Z) - Variational Causal Networks: Approximate Bayesian Inference over Causal
Structures [132.74509389517203]
離散DAG空間上の自己回帰分布をモデル化したパラメトリック変分族を導入する。
実験では,提案した変分後部が真の後部を良好に近似できることを示した。
論文 参考訳(メタデータ) (2021-06-14T17:52:49Z) - Block-Approximated Exponential Random Graphs [77.4792558024487]
指数乱グラフ(ERG)の分野における重要な課題は、大きなグラフ上の非自明なERGの適合である。
本稿では,非自明なERGに対する近似フレームワークを提案する。
我々の手法は、数百万のノードからなるスパースグラフにスケーラブルである。
論文 参考訳(メタデータ) (2020-02-14T11:42:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。