論文の概要: FiP: a Fixed-Point Approach for Causal Generative Modeling
- arxiv url: http://arxiv.org/abs/2404.06969v1
- Date: Wed, 10 Apr 2024 12:29:05 GMT
- ステータス: 処理完了
- システム内更新日: 2024-04-11 14:40:47.732893
- Title: FiP: a Fixed-Point Approach for Causal Generative Modeling
- Title(参考訳): FiP:因果生成モデリングのための固定点アプローチ
- Authors: Meyer Scetbon, Joel Jennings, Agrin Hilmkil, Cheng Zhang, Chao Ma,
- Abstract要約: 因果順序付き変数上の不動点問題を記述するのにDAGを必要としない新しい等価形式法を提案する。
理論的な知見に基づいて、ゼロショット方式で観測から因果順序を推定する2段階因果生成モデルを設計する。
固定点SCMを学習するために、我々は、因果構造のモデリングを可能にする新しいアテンション機構を利用するトランスフォーマーベースのアーキテクチャを設計する。
- 参考スコア(独自算出の注目度): 20.88890689294816
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Modeling true world data-generating processes lies at the heart of empirical science. Structural Causal Models (SCMs) and their associated Directed Acyclic Graphs (DAGs) provide an increasingly popular answer to such problems by defining the causal generative process that transforms random noise into observations. However, learning them from observational data poses an ill-posed and NP-hard inverse problem in general. In this work, we propose a new and equivalent formalism that do not require DAGs to describe them, viewed as fixed-point problems on the causally ordered variables, and show three important cases where they can be uniquely recovered given the topological ordering (TO). To the best of our knowledge, we obtain the most general recovery results when the TO is known. Based on our theoretical findings, we design a two-stage causal generative model that first infers the causal order from observations in a zero-shot manner, thus by-passing the search, and then learns the generative fixed-point SCM on the ordered variables. To infer TOs from observations, we propose to amortize the learning of TOs on generated datasets by sequentially predicting the leaves of graphs seen during training. To learn fixed-point SCMs, we design a transformer-based architecture that exploits a new attention mechanism enabling the modeling of causal structures, and show that this parameterization is consistent with our formalism. Finally, we conduct an extensive evaluation of each method individually, and show that when combined, our model outperforms various baselines on generated out-of-distribution problems.
- Abstract(参考訳): 真の世界データ生成プロセスのモデリングは、実証科学の中心にある。
構造因果モデル(SCM)とそれらの関連した非巡回グラフ(DAG)は、ランダムノイズを観測に変換する因果生成過程を定義することによって、そのような問題に対するより一般的な回答を提供する。
しかし、観測データからそれらを学ぶことは、一般的にNP-ハード逆問題を引き起こす。
そこで本研究では,DAGを必要とせず,因果的に順序づけられた変数上の不動点問題とみなし,トポロジ的順序付け(TO)を考えると,それらが一意に回復できる3つの重要なケースを示す。
我々の知る限り、TOが知られている場合に最も一般的な回復結果が得られる。
理論的な知見に基づいて、まずゼロショットで観測から因果順序を推定し、探索をバイパスし、次に順序づけられた変数の定点SCMを学習する2段階因果生成モデルを設計する。
to infer TOs from observed, we propose to amortize the learning of TOs on generated datasets by Sequencely predicting the leaves of graphs during training。
固定点SCMを学習するために、我々は、因果構造のモデリングを可能にする新しい注意機構を利用するトランスフォーマーベースのアーキテクチャを設計し、このパラメータ化が我々の形式主義と一致していることを示す。
最後に、各手法を個別に広範囲に評価し、組み合わせると、生成されたアウト・オブ・ディストリビューション問題に対して、モデルが様々なベースラインより優れていることを示す。
関連論文リスト
- Generative Flow Networks: Theory and Applications to Structure Learning [7.6872614776094]
この論文は、ベイズの観点からの構造学習の問題を研究する。
ジェネレーティブフローネットワーク(GFlowNets)を導入
GFlowNetsは、生成をシーケンシャルな意思決定問題として扱う。
論文 参考訳(メタデータ) (2025-01-09T17:47:17Z) - Learning Structural Causal Models from Ordering: Identifiable Flow Models [19.99352354910655]
本稿では,変数の可逆変換を部品的に再現するフローモデルを提案する。
本稿では,すべての因果メカニズムの同時学習を可能にする設計改善を提案する。
本手法は,既存の拡散法に比べて計算時間を大幅に短縮する。
論文 参考訳(メタデータ) (2024-12-13T04:25:56Z) - Induced Covariance for Causal Discovery in Linear Sparse Structures [55.2480439325792]
因果モデルでは、観測データから変数間の因果関係を解き明かそうとしている。
本稿では,変数が線形に疎結合な関係を示す設定のための新しい因果探索アルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-10-02T04:01:38Z) - Supervised structure learning [41.35046208072566]
ベイズモデルの選択とトレーニングデータやコンテンツの同化に焦点を当てており、特にデータの摂取順序に重点を置いている。
続くスキームにおける重要な動きは、期待される自由エネルギーに基づいて、モデルの選択に先んじることである。
結果として得られたスキームは、まずMNISTデータセットで画像分類を行い、基本概念を記述し、その後、ダイナミックスを持つモデルを発見するというより難しい問題でテストされる。
論文 参考訳(メタデータ) (2023-11-17T03:18:55Z) - Mutual Exclusivity Training and Primitive Augmentation to Induce
Compositionality [84.94877848357896]
最近のデータセットは、標準的なシーケンス・ツー・シーケンスモデルにおける体系的な一般化能力の欠如を露呈している。
本稿では,セq2seqモデルの振る舞いを分析し,相互排他バイアスの欠如と全例を記憶する傾向の2つの要因を同定する。
広範に使用されている2つの構成性データセット上で、標準的なシーケンス・ツー・シーケンスモデルを用いて、経験的改善を示す。
論文 参考訳(メタデータ) (2022-11-28T17:36:41Z) - Bayesian learning of Causal Structure and Mechanisms with GFlowNets and Variational Bayes [51.84122462615402]
本研究では,変分ベイズ-DAG-GFlowNetを用いて因果モデルの構造と機構を学習する手法を提案する。
我々は,GFlowNetを用いたベイズ因果構造学習の手法を拡張し,線形ガウスモデルのパラメータを学習する。
論文 参考訳(メタデータ) (2022-11-04T21:57:39Z) - On the Generalization and Adaption Performance of Causal Models [99.64022680811281]
異なる因果発見は、データ生成プロセスを一連のモジュールに分解するために提案されている。
このようなモジュラニューラル因果モデルの一般化と適応性能について検討する。
我々の分析では、モジュラーニューラル因果モデルが、低データレギュレーションにおけるゼロおよび少数ショットの適応において、他のモデルよりも優れていることを示している。
論文 参考訳(メタデータ) (2022-06-09T17:12:32Z) - Amortized Inference for Causal Structure Learning [72.84105256353801]
因果構造を学習することは、通常、スコアまたは独立テストを使用して構造を評価することを伴う探索問題を引き起こす。
本研究では,観測・干渉データから因果構造を予測するため,変分推論モデルを訓練する。
我々のモデルは、実質的な分布シフトの下で頑健な一般化能力を示す。
論文 参考訳(メタデータ) (2022-05-25T17:37:08Z) - Surrogate Modeling for Physical Systems with Preserved Properties and
Adjustable Tradeoffs [0.0]
代理モデルを生成するためのモデルベースおよびデータ駆動型戦略を提案する。
後者は、前提となる位相構造に人工的関係を組み込むことで解釈可能な代理モデルを生成する。
我々のフレームワークは、分散パラメータモデルのための様々な空間離散化スキームと互換性がある。
論文 参考訳(メタデータ) (2022-02-02T17:07:02Z) - Towards Robust and Adaptive Motion Forecasting: A Causal Representation
Perspective [72.55093886515824]
本稿では,3つの潜伏変数群からなる動的過程として,運動予測の因果的形式化を導入する。
我々は、因果グラフを近似するために、不変なメカニズムやスタイルの共創者の表現を分解するモジュラーアーキテクチャを考案する。
合成および実データを用いた実験結果から,提案した3つの成分は,学習した動き表現の頑健性と再利用性を大幅に向上することが示された。
論文 参考訳(メタデータ) (2021-11-29T18:59:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。