論文の概要: Arrow: A Foundation Model for Causal Discovery
- arxiv url: http://arxiv.org/abs/2605.07204v1
- Date: Fri, 08 May 2026 03:51:51 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-11 19:43:38.784651
- Title: Arrow: A Foundation Model for Causal Discovery
- Title(参考訳): Arrow: 因果発見の基礎モデル
- Authors: Ryan Thompson, He Zhao, Daniel M. Steinberg, Edwin V. Bonilla,
- Abstract要約: 本稿では,観測データに基づくゼロショット因果発見の基礎モデルであるArrowを紹介する。
有向非巡回グラフを無向骨格と位相順序に分解し、建設による非巡回性を保証する。
Arrowは、地上構造グラフを用いた合成データセットの教師あり方式で訓練されている。
- 参考スコア(独自算出の注目度): 12.571238167923907
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We introduce Arrow, a foundation model for zero-shot causal discovery on observational tabular data. Arrow factorizes a directed acyclic graph into an undirected skeleton and a topological order, guaranteeing acyclicity by construction. Given a new dataset, it uses a transformer-based architecture to contextualize variables within and across observations, then predicts skeleton edge probabilities and node order scores that together define a graph. Arrow is trained in a supervised fashion on synthetic datasets with ground-truth graphs, using an end-to-end differentiable directed edge composite likelihood induced by the skeleton-order factorization. The training distribution spans diverse graph families, functional forms, noise models, and dataset shapes. Across in- and out-of-distribution synthetic, semi-synthetic, and real datasets, Arrow matches or outperforms existing causal discovery methods at substantially lower inference cost than competitive alternatives. Our results demonstrate that large-scale pretraining on diverse synthetic data can yield zero-shot causal discovery models that are fast, accurate, and reusable on new datasets.
- Abstract(参考訳): 本稿では,観測表データに基づくゼロショット因果発見の基礎モデルであるArrowを紹介する。
アローは有向非巡回グラフを無向骨格と位相順序に分解し、建設による非巡回性を保証する。
新しいデータセットが与えられた後、Transformerベースのアーキテクチャを使用して、観測中の変数をコンテキスト化し、スケルトンエッジの確率とノード順序スコアを予測し、グラフを定義する。
アーロウは、骨格次数分解によって誘導される終端から終端までの微分可能な有向エッジ合成確率を用いて、地上構造グラフを用いた合成データセットの教師付き方式で訓練される。
トレーニング分布は、さまざまなグラフファミリ、機能形式、ノイズモデル、データセット形状にまたがる。
分布内および外部の合成、半合成、および実際のデータセット全体において、Arrowは既存の因果発見手法を競合する代替手段よりも大幅に低い推論コストでマッチまたは上回る。
以上の結果から,多様な合成データに対する大規模事前学習が,新しいデータセット上で高速で正確で再利用可能なゼロショット因果発見モデルが得られることが示された。
関連論文リスト
- Sample, estimate, aggregate: A recipe for causal discovery foundation models [28.116832159265964]
因果発見は、生物学的実験から機械的な洞察を明らかにする可能性がある。
因果グラフを予測するために,大規模合成データに基づいて学習した教師付きモデルを提案する。
我々のアプローチは、発見アルゴリズムの出力の典型的なエラーがデータセット間で比較できるという観察によって実現されている。
論文 参考訳(メタデータ) (2024-02-02T21:57:58Z) - Improving embedding of graphs with missing data by soft manifolds [51.425411400683565]
グラフ埋め込みの信頼性は、連続空間の幾何がグラフ構造とどの程度一致しているかに依存する。
我々は、この問題を解決することができる、ソフト多様体と呼ばれる新しい多様体のクラスを導入する。
グラフ埋め込みにソフト多様体を用いることで、複雑なデータセット上のデータ解析における任意のタスクを追求するための連続空間を提供できる。
論文 参考訳(メタデータ) (2023-11-29T12:48:33Z) - Sparse Training of Discrete Diffusion Models for Graph Generation [45.103518022696996]
SparseDiffは、ほとんど全ての大きなグラフがスパースであるという観察に基づく、新しい拡散モデルである。
エッジのサブセットを選択することで、SparseDiffは、ノイズ発生過程とノイズ発生ネットワーク内のスパースグラフ表現を効果的に活用する。
本モデルでは,小規模・大規模両方のデータセットにおいて,複数のメトリクスにわたる最先端性能を示す。
論文 参考訳(メタデータ) (2023-11-03T16:50:26Z) - Permutation Equivariant Graph Framelets for Heterophilous Graph Learning [6.679929638714752]
本研究では,Haar型グラフフレームレットの構築により,マルチスケール抽出を実現する手法を開発した。
ヘテロ親和性グラフの特定のデータセット上で,我々のモデルが最高の性能を達成できることが示される。
論文 参考訳(メタデータ) (2023-06-07T09:05:56Z) - Bures-Wasserstein Means of Graphs [60.42414991820453]
本研究では,スムーズなグラフ信号分布の空間への埋め込みを通じて,グラフ平均を定義する新しいフレームワークを提案する。
この埋め込み空間において平均を求めることにより、構造情報を保存する平均グラフを復元することができる。
我々は,新しいグラフの意味の存在と特異性を確立し,それを計算するための反復アルゴリズムを提供する。
論文 参考訳(メタデータ) (2023-05-31T11:04:53Z) - A Framework for Large Scale Synthetic Graph Dataset Generation [2.248608623448951]
この研究は、データセットをプロダクションサイズのグラフにスケールするスケーラブルな合成グラフ生成ツールを提案する。
このツールは、研究者にリリース可能なプロプライエタリなデータセットから、一連のパラメトリックモデルを学ぶ。
一連のデータセットにまたがるフレームワークの一般化可能性を示す。
論文 参考訳(メタデータ) (2022-10-04T22:41:33Z) - Bias Reduction via Cooperative Bargaining in Synthetic Graph Dataset
Generation [1.6942548626426182]
そこで本稿では,異なるメトリクスを持つグラフの偶数表現を持つ合成グラフデータセットの探索手法を提案する。
結果のデータセットは、グラフ処理テクニックのベンチマークに使用することができる。
論文 参考訳(メタデータ) (2022-05-27T11:12:50Z) - Amortized Inference for Causal Structure Learning [72.84105256353801]
因果構造を学習することは、通常、スコアまたは独立テストを使用して構造を評価することを伴う探索問題を引き起こす。
本研究では,観測・干渉データから因果構造を予測するため,変分推論モデルを訓練する。
我々のモデルは、実質的な分布シフトの下で頑健な一般化能力を示す。
論文 参考訳(メタデータ) (2022-05-25T17:37:08Z) - Discovering Invariant Rationales for Graph Neural Networks [104.61908788639052]
グラフニューラルネットワーク(GNN)の固有の解釈可能性とは、入力グラフの特徴の小さなサブセットを見つけることである。
本稿では,本質的に解釈可能なGNNを構築するために,不変理性(DIR)を発見するための新しい戦略を提案する。
論文 参考訳(メタデータ) (2022-01-30T16:43:40Z) - Block-Approximated Exponential Random Graphs [77.4792558024487]
指数乱グラフ(ERG)の分野における重要な課題は、大きなグラフ上の非自明なERGの適合である。
本稿では,非自明なERGに対する近似フレームワークを提案する。
我々の手法は、数百万のノードからなるスパースグラフにスケーラブルである。
論文 参考訳(メタデータ) (2020-02-14T11:42:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。