論文の概要: Shortcuts for causal discovery of nonlinear models by score matching
- arxiv url: http://arxiv.org/abs/2310.14246v1
- Date: Sun, 22 Oct 2023 10:09:52 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-25 00:51:23.272844
- Title: Shortcuts for causal discovery of nonlinear models by score matching
- Title(参考訳): スコアマッチングによる非線形モデルの因果的発見のためのショートカット
- Authors: Francesco Montagna, Nicoletta Noceti, Lorenzo Rosasco, Francesco
Locatello
- Abstract要約: 非線形付加雑音モデルのスコア・ソータビリティ・パターンを定義し,特徴付ける。
文献において最も一般的な合成ベンチマークのスコアソート性を示す。
本研究は, 非線形因果発見手法の評価において, データの多様性の欠如が重要な限界であることを示すものである。
- 参考スコア(独自算出の注目度): 32.01302470630594
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The use of simulated data in the field of causal discovery is ubiquitous due
to the scarcity of annotated real data. Recently, Reisach et al., 2021
highlighted the emergence of patterns in simulated linear data, which displays
increasing marginal variance in the casual direction. As an ablation in their
experiments, Montagna et al., 2023 found that similar patterns may emerge in
nonlinear models for the variance of the score vector $\nabla \log
p_{\mathbf{X}}$, and introduced the ScoreSort algorithm. In this work, we
formally define and characterize this score-sortability pattern of nonlinear
additive noise models. We find that it defines a class of identifiable
(bivariate) causal models overlapping with nonlinear additive noise models. We
theoretically demonstrate the advantages of ScoreSort in terms of statistical
efficiency compared to prior state-of-the-art score matching-based methods and
empirically show the score-sortability of the most common synthetic benchmarks
in the literature. Our findings remark (1) the lack of diversity in the data as
an important limitation in the evaluation of nonlinear causal discovery
approaches, (2) the importance of thoroughly testing different settings within
a problem class, and (3) the importance of analyzing statistical properties in
causal discovery, where research is often limited to defining identifiability
conditions of the model.
- Abstract(参考訳): 因果発見の分野におけるシミュレーションデータの利用は、注釈付き実データの不足のためにユビキタスである。
近年、Reisachら2021は、シミュレーション線形データにおけるパターンの出現を強調し、カジュアルな方向の限界分散が増大している。
実験のアブレーションとして、Montagnaら 2023 は、スコアベクトル $\nabla \log p_{\mathbf{X}}$ の分散に対して、同様のパターンが非線形モデルに現れることを発見し、ScoreSortアルゴリズムを導入した。
本研究では,非線形付加雑音モデルのスコアソータビリティパターンを正式に定義し,特徴付ける。
非線形加法的雑音モデルと重なり合う同定可能な(バイバリエートな)因果関係モデルのクラスを定義する。
ScoreSortの統計的効率性は,従来の最先端のスコアマッチング法と比較して理論的に証明し,文献において最も一般的な合成ベンチマークのスコアソート性を実証的に示す。
以上より,(1)非線形因果関係発見手法の評価における重要な限界としてのデータの多様性の欠如,(2)問題クラス内で異なる設定を徹底的にテストすることの重要性,(3)因果関係発見における統計的性質の分析の重要性,(3)モデルの識別可能性条件の定義に研究が制限されることが多い。
関連論文リスト
- Score matching through the roof: linear, nonlinear, and latent variables causal discovery [18.46845413928147]
観測データからの因果発見は、非常に有望である。
既存の手法は根底にある因果構造に関する強い仮定に依存している。
線形・非線形・潜在変数モデルにまたがる因果探索のためのフレキシブルアルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-07-26T14:09:06Z) - Demystifying amortized causal discovery with transformers [21.058343547918053]
観測データからの因果発見のための教師付き学習アプローチは、しばしば競争性能を達成する。
本研究では,CSIvAについて検討する。CSIvAは,合成データのトレーニングと実データへの転送を約束するトランスフォーマーモデルである。
既存の識別可能性理論とギャップを埋め、トレーニングデータ分布の制約がテスト観測の事前を暗黙的に定義していることを示します。
論文 参考訳(メタデータ) (2024-05-27T08:17:49Z) - Sample, estimate, aggregate: A recipe for causal discovery foundation models [28.116832159265964]
我々は、古典因果探索アルゴリズムの出力からより大きな因果グラフを予測することを学ぶ教師付きモデルを訓練する。
我々のアプローチは、古典的手法の出力における典型的なエラーがデータセット間で比較できるという観察によって実現されている。
実データおよび合成データに関する実験では、このモデルが不特定性や分布シフトに直面して高い精度を維持することを示した。
論文 参考訳(メタデータ) (2024-02-02T21:57:58Z) - Sample Complexity Bounds for Score-Matching: Causal Discovery and
Generative Modeling [82.36856860383291]
我々は,標準深部ReLUニューラルネットワークをトレーニングすることにより,スコア関数の正確な推定が可能であることを実証した。
スコアマッチングに基づく因果発見手法を用いて因果関係の回復の誤差率の限界を確立する。
論文 参考訳(メタデータ) (2023-10-27T13:09:56Z) - Assessing the overall and partial causal well-specification of nonlinear additive noise models [4.13592995550836]
このような誤用があっても因果関係を推測できる予測変数を同定することを目的としている。
本稿では,有限サンプルデータに対するアルゴリズムを提案し,その特性について議論し,シミュレーションおよび実データ上での性能を示す。
論文 参考訳(メタデータ) (2023-10-25T09:44:16Z) - Learning to Bound Counterfactual Inference in Structural Causal Models
from Observational and Randomised Data [64.96984404868411]
我々は、従来のEMベースのアルゴリズムを拡張するための全体的なデータの特徴付けを導出する。
新しいアルゴリズムは、そのような混合データソースからモデルパラメータの(不特定性)領域を近似することを学ぶ。
反実的な結果に間隔近似を与え、それが特定可能な場合の点に崩壊する。
論文 参考訳(メタデータ) (2022-12-06T12:42:11Z) - Causal Inference via Nonlinear Variable Decorrelation for Healthcare
Applications [60.26261850082012]
線形および非線形共振の両方を扱う可変デコリレーション正規化器を用いた新しい手法を提案する。
我々は、モデル解釈可能性を高めるために、元の特徴に基づくアソシエーションルールマイニングを用いた新しい表現として、アソシエーションルールを採用する。
論文 参考訳(メタデータ) (2022-09-29T17:44:14Z) - Bivariate Causal Discovery for Categorical Data via Classification with
Optimal Label Permutation [2.0305676256390934]
最適ラベル置換(COLP)を用いた新しい分類モデルに基づく分類データのための新しい因果モデルを提案する。
因果的モデルと反因果的モデルの確率関数を比較した単純な学習アルゴリズムは因果的方向を学習するのに十分である。
論文 参考訳(メタデータ) (2022-09-18T15:04:55Z) - Amortized Inference for Causal Structure Learning [72.84105256353801]
因果構造を学習することは、通常、スコアまたは独立テストを使用して構造を評価することを伴う探索問題を引き起こす。
本研究では,観測・干渉データから因果構造を予測するため,変分推論モデルを訓練する。
我々のモデルは、実質的な分布シフトの下で頑健な一般化能力を示す。
論文 参考訳(メタデータ) (2022-05-25T17:37:08Z) - Estimation of Bivariate Structural Causal Models by Variational Gaussian
Process Regression Under Likelihoods Parametrised by Normalising Flows [74.85071867225533]
因果機構は構造因果モデルによって記述できる。
最先端の人工知能の大きな欠点の1つは、説明責任の欠如である。
論文 参考訳(メタデータ) (2021-09-06T14:52:58Z) - Good Classifiers are Abundant in the Interpolating Regime [64.72044662855612]
補間分類器間のテストエラーの完全な分布を正確に計算する手法を開発した。
テストエラーは、最悪の補間モデルのテストエラーから大きく逸脱する、小さな典型的な$varepsilon*$に集中する傾向にある。
以上の結果から,統計的学習理論における通常の解析手法は,実際に観測された優れた一般化性能を捉えるのに十分な粒度にはならない可能性が示唆された。
論文 参考訳(メタデータ) (2020-06-22T21:12:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。