論文の概要: A Scale-Invariant Sorting Criterion to Find a Causal Order in Additive
Noise Models
- arxiv url: http://arxiv.org/abs/2303.18211v2
- Date: Tue, 31 Oct 2023 22:04:39 GMT
- ステータス: 処理完了
- システム内更新日: 2023-11-02 18:10:07.763260
- Title: A Scale-Invariant Sorting Criterion to Find a Causal Order in Additive
Noise Models
- Title(参考訳): 付加雑音モデルにおける因果順序を求めるスケール不変なソーティング基準
- Authors: Alexander G. Reisach, Myriam Tami, Christof Seiler, Antoine Chambaz,
Sebastian Weichwald
- Abstract要約: 分散の増加による変数のソートは、しばしば因果順序に近い順序になることを示す。
本稿ではR2$-SortnRegressと呼ばれる,高いR2$-sortabilityを利用する効率的なベースラインアルゴリズムを提案する。
その結果,因果発見に関連するデータ生成プロセスの仮定として,R2$-sortabilityが高額であることが判明した。
- 参考スコア(独自算出の注目度): 49.038420266408586
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Additive Noise Models (ANMs) are a common model class for causal discovery
from observational data and are often used to generate synthetic data for
causal discovery benchmarking. Specifying an ANM requires choosing all
parameters, including those not fixed by explicit assumptions. Reisach et al.
(2021) show that sorting variables by increasing variance often yields an
ordering close to a causal order and introduce var-sortability to quantify this
alignment. Since increasing variances may be unrealistic and are
scale-dependent, ANM data are often standardized in benchmarks.
We show that synthetic ANM data are characterized by another pattern that is
scale-invariant: the explainable fraction of a variable's variance, as captured
by the coefficient of determination $R^2$, tends to increase along the causal
order. The result is high $R^2$-sortability, meaning that sorting the variables
by increasing $R^2$ yields an ordering close to a causal order. We propose an
efficient baseline algorithm termed $R^2$-SortnRegress that exploits high
$R^2$-sortability and that can match and exceed the performance of established
causal discovery algorithms. We show analytically that sufficiently high edge
weights lead to a relative decrease of the noise contributions along causal
chains, resulting in increasingly deterministic relationships and high $R^2$.
We characterize $R^2$-sortability for different simulation parameters and find
high values in common settings. Our findings reveal high $R^2$-sortability as
an assumption about the data generating process relevant to causal discovery
and implicit in many ANM sampling schemes. It should be made explicit, as its
prevalence in real-world data is unknown. For causal discovery benchmarking, we
implement $R^2$-sortability, the $R^2$-SortnRegress algorithm, and ANM
simulation procedures in our library CausalDisco at
https://causaldisco.github.io/CausalDisco/.
- Abstract(参考訳): 付加ノイズモデル(anms)は、観測データから因果発見を行う共通のモデルクラスであり、因果発見ベンチマークのための合成データを生成するためにしばしば使用される。
ANMを指定するには、明示的な仮定で固定されていないパラメータを含むすべてのパラメータを選択する必要がある。
Reisach et al. (2021) は、分散の増加による変数のソートはしばしば因果次数に近い順序を与え、このアライメントを定量化するためにvar-sortabilityを導入することを示した。
ばらつきの増加は非現実的でスケール依存であるため、ANMデータはベンチマークで標準化されることが多い。
決定係数 $r^2$ によってキャプチャされる変数の分散の説明可能な割合は因果順序に沿って増加する傾向がある。
その結果、高い$r^2$-sortabilityとなり、すなわち$r^2$を増加させることで変数のソートが因果順序に近い順序を与える。
本研究では,r^2$-sortnregressと呼ばれる効率的なベースラインアルゴリズムを提案する。
十分高いエッジ重みが因果連鎖に沿ったノイズ寄与を相対的に減少させ、決定論的関係が増大し、R^2$が高くなることを解析的に示す。
我々は,異なるシミュレーションパラメータに対して$r^2$-sortabilityを特徴付け,共通設定で高い値を求める。
その結果,多くのANMサンプリング方式において因果発見と暗黙的なデータ生成プロセスの仮定として高いR^2$-sortabilityが示された。
実世界データでの流行は明らかではないため、明示されるべきである。
因果探索ベンチマークには、$R^2$-sortability、$R^2$-SortnRegressアルゴリズム、およびライブラリーのCausalDisco at https://causaldisco.github.io/CausalDisco/におけるANMシミュレーション手順を実装します。
関連論文リスト
- Standardizing Structural Causal Models [80.21199731817698]
ベンチマークアルゴリズムのための内部標準構造因果モデル(iSCM)を提案する。
構成上、iSCMは$operatornameVar$-sortableではなく、実験的に示すように、$operatornameR2$-sortableではない。
論文 参考訳(メタデータ) (2024-06-17T14:52:21Z) - Computational-Statistical Gaps in Gaussian Single-Index Models [77.1473134227844]
単次元モデル(Single-Index Models)は、植木構造における高次元回帰問題である。
我々は,統計的クエリ (SQ) と低遅延多項式 (LDP) フレームワークの両方において,計算効率のよいアルゴリズムが必ずしも$Omega(dkstar/2)$サンプルを必要とすることを示した。
論文 参考訳(メタデータ) (2024-03-08T18:50:19Z) - Uncertainty Quantification of MLE for Entity Ranking with Covariates [3.2839905453386162]
本稿では,ペア比較に基づくランキング問題の統計的推定と推定について検討する。
我々は、有名なBradley-Terry-Luceモデルを拡張した新しいモデルCAREモデルを提案する。
我々は、スパース比較グラフの下で、$alpha_i*_i=1n$と$beta*$の最大確率推定器を導出する。
大規模数値研究による理論結果の検証と相互資金保有データセットへの適用について検討する。
論文 参考訳(メタデータ) (2022-12-20T02:28:27Z) - On the Identifiability and Estimation of Causal Location-Scale Noise
Models [122.65417012597754]
位置スケール・異方性雑音モデル(LSNM)のクラスについて検討する。
症例によっては, 因果方向が同定可能であることが示唆された。
我々は,LSNMの2つの推定器を提案し,その1つは(非線形)特徴写像に基づく推定器と,1つはニューラルネットワークに基づく推定器を提案する。
論文 参考訳(メタデータ) (2022-10-13T17:18:59Z) - Diffusion Models for Causal Discovery via Topological Ordering [20.875222263955045]
emphTopological ordering approachは、グラフ空間ではなく置換を探索することによって因果発見の最適化空間を減少させる。
ANMsの場合、データログのようなemphHessianは、葉ノードを因果グラフで見つけるのに使用することができ、トポロジ的順序付けを可能にする。
ニューラルネットワークを再トレーニングすることなく、学習したヘッセンを更新する理論を導入し、サンプルのサブセットによる計算が注文の正確な近似を与えることを示す。
論文 参考訳(メタデータ) (2022-10-12T13:36:29Z) - Exponential Family Model-Based Reinforcement Learning via Score Matching [97.31477125728844]
有限水平表層強化学習(RL)のための楽観的モデルベースアルゴリズムSMRLを提案する。
SMRLは、リッジ回帰によるモデルパラメータの効率的な推定を可能にする非正規化密度推定手法であるスコアマッチングを用いる。
論文 参考訳(メタデータ) (2021-12-28T15:51:07Z) - Beware of the Simulated DAG! Varsortability in Additive Noise Models [70.54639814319096]
合成データにおける連続構造学習アルゴリズムの性能は,バラエティが如何に支配されているかを示す。
模擬添加ノイズモデルではバラツキが起こりやすいという認識を高めることを目指しています。
論文 参考訳(メタデータ) (2021-02-26T18:52:27Z) - Does generalization performance of $l^q$ regularization learning depend
on $q$? A negative example [19.945160684285003]
$lq$-regularizationは、機械学習と統計モデリングにおいて魅力的なテクニックであることが示されている。
0 infty$ に対するすべての $lq$ 推定子は、同様の一般化誤差境界が得られることを示す。
この発見は、あるモデリングの文脈において、$q$の選択が一般化能力に強い影響を与えることはないことを仮に示している。
論文 参考訳(メタデータ) (2013-07-25T00:48:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。