論文の概要: Asymptotic Causal Inference
- arxiv url: http://arxiv.org/abs/2109.09653v1
- Date: Mon, 20 Sep 2021 16:16:00 GMT
- ステータス: 処理完了
- システム内更新日: 2021-09-21 16:33:41.494915
- Title: Asymptotic Causal Inference
- Title(参考訳): 漸近因果推論
- Authors: Sridhar Mahadevan
- Abstract要約: 情報理論の枠組みを用いて,変数の数が無限に近づいた場合のシステム内の因果推論について検討する。
対数成長速度によって測定される記述複雑性の観点から,因果モデルの構造エントロピーを定義した。
大規模データセットの因果推論を研究するために,最近普及している二部構成の実験設計を一般化する。
- 参考スコア(独自算出の注目度): 6.489113969363787
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We investigate causal inference in the asymptotic regime as the number of
variables approaches infinity using an information-theoretic framework. We
define structural entropy of a causal model in terms of its description
complexity measured by the logarithmic growth rate, measured in bits, of all
directed acyclic graphs (DAGs), parameterized by the edge density d. Structural
entropy yields non-intuitive predictions. If we randomly sample a DAG from the
space of all models, in the range d = (0, 1/8), almost surely the model is a
two-layer DAG! Semantic entropy quantifies the reduction in entropy where edges
are removed by causal intervention. Semantic causal entropy is defined as the
f-divergence between the observational distribution and the interventional
distribution P', where a subset S of edges are intervened on to determine their
causal influence. We compare the decomposability properties of semantic entropy
for different choices of f-divergences, including KL-divergence, squared
Hellinger distance, and total variation distance. We apply our framework to
generalize a recently popular bipartite experimental design for studying causal
inference on large datasets, where interventions are carried out on one set of
variables (e.g., power plants, items in an online store), but outcomes are
measured on a disjoint set of variables (residents near power plants, or
shoppers). We generalize bipartite designs to k-partite designs, and describe
an optimization framework for finding the optimal k-level DAG architecture for
any value of d \in (0, 1/2). As edge density increases, a sequence of phase
transitions occur over disjoint intervals of d, with deeper DAG architectures
emerging for larger values of d. We also give a quantitative bound on the
number of samples needed to reliably test for average causal influence for a
k-partite design.
- Abstract(参考訳): 情報理論の枠組みを用いて,変数数が無限に近づいた漸近的体系における因果推論について検討する。
我々は, エッジ密度dでパラメータ化されたすべての有向非巡回グラフ (DAG) の対数的成長速度によって測定される記述複雑性の観点から, 因果モデルの構造エントロピーを定義する。
構造エントロピーは直観的でない予測をもたらす。
すべてのモデルの空間から、d = (0, 1/8) の範囲でDAGをランダムにサンプリングすると、ほぼ確実に2層DAGとなる。
セマンティックエントロピーは、エッジが因果介入によって除去されるエントロピーの減少を定量化する。
セマンティック因果エントロピーは、観察分布と介入分布P'の間のf分割として定義され、エッジのサブセットSが介在して因果的影響を決定する。
kl-divergence, squared hellinger distance, total variation distanceなどf-divergencesの異なる選択に対する意味エントロピーの分解性の比較を行った。
提案手法を応用して, 大規模データセットにおける因果推論の研究に応用し, 1つの変数(例えば, 発電所, オンライン店舗のアイテム)に対して介入を行うが, 解離した変数(電力工場, 買い物客付近の居住者, あるいは買い物客)に対して結果を測定する。
両部設計をk-部分設計に一般化し、d \in (0, 1/2) の任意の値に対して最適なkレベルDAGアーキテクチャを求めるための最適化フレームワークを記述する。
エッジ密度が増加すると、dの非連結区間で相転移が連続し、より深いdagアーキテクチャがdのより大きな値に出現する。
また,k成分設計における平均因果影響の検証に必要な試料数を定量的に評価した。
関連論文リスト
- Low-dimensional adaptation of diffusion models: Convergence in total variation [13.218641525691195]
拡散生成モデルが(未知の)低次元構造をどのように活用してサンプリングを高速化するかを検討する。
本研究はDDIM型試料試料の未知の低次元構造への適応性を示す最初の厳密な証拠である。
論文 参考訳(メタデータ) (2025-01-22T16:12:33Z) - Causal vs. Anticausal merging of predictors [57.26526031579287]
同じデータを用いて、因果方向と反因果方向の融合予測器から生じる差について検討した。
帰納的バイアスとしてCausal Maximum Entropy (CMAXENT) を用いて予測器をマージする。
論文 参考訳(メタデータ) (2025-01-14T20:38:15Z) - Convergence of Score-Based Discrete Diffusion Models: A Discrete-Time Analysis [56.442307356162864]
連続時間マルコフ連鎖(CTMC)に基づくスコアベース離散拡散モデルの理論的側面について検討する。
本稿では,事前定義された時間点におけるスコア推定値を利用する離散時間サンプリングアルゴリズムを一般状態空間$[S]d$に導入する。
我々の収束解析はジルサノフ法を用いて離散スコア関数の重要な性質を確立する。
論文 参考訳(メタデータ) (2024-10-03T09:07:13Z) - KPZ scaling from the Krylov space [83.88591755871734]
近年,Cardar-Parisi-Zhangスケーリングをリアルタイムの相関器や自動相関器に示す超拡散が報告されている。
これらの結果から着想を得て,Krylov演算子に基づく相関関数のKPZスケーリングについて検討する。
論文 参考訳(メタデータ) (2024-06-04T20:57:59Z) - Convergence and concentration properties of constant step-size SGD
through Markov chains [0.0]
定常段差勾配勾配(SGD)を用いた滑らかで強凸な目標の最適化について検討する。
緩やかに制御された分散を伴う不偏勾配推定に対して、反復は全変動距離の不変分布に収束することを示す。
全ての結果は無症状であり、その結果はいくつかのアプリケーションを通して議論されている。
論文 参考訳(メタデータ) (2023-06-20T12:36:28Z) - High-dimensional limit theorems for SGD: Effective dynamics and critical
scaling [6.950316788263433]
我々は、勾配降下(SGD)の要約統計の軌跡に対する極限定理を証明する。
下記の有効弾道力学が人口減少の勾配流と一致するステップサイズにおける重要なスケーリング体制を示す。
この実効力学の固定点について、対応する拡散極限は極めて複雑であり、さらに退化することもある。
論文 参考訳(メタデータ) (2022-06-08T17:42:18Z) - On the Double Descent of Random Features Models Trained with SGD [78.0918823643911]
勾配降下(SGD)により最適化された高次元におけるランダム特徴(RF)回帰特性について検討する。
本研究では, RF回帰の高精度な非漸近誤差境界を, 定常および適応的なステップサイズSGD設定の下で導出する。
理論的にも経験的にも二重降下現象を観察する。
論文 参考訳(メタデータ) (2021-10-13T17:47:39Z) - Variational Causal Networks: Approximate Bayesian Inference over Causal
Structures [132.74509389517203]
離散DAG空間上の自己回帰分布をモデル化したパラメトリック変分族を導入する。
実験では,提案した変分後部が真の後部を良好に近似できることを示した。
論文 参考訳(メタデータ) (2021-06-14T17:52:49Z) - SGD in the Large: Average-case Analysis, Asymptotics, and Stepsize
Criticality [15.640534097470923]
本稿では,サンプル数と寸法がともに大きい場合の勾配降下(SGD)のダイナミクスを解析するための新しい枠組みを提案する。
この新たな枠組みを用いて, ランダムデータを用いた最小二乗問題におけるSGDの力学が, 標本および次元限界において決定論的になることを示す。
論文 参考訳(メタデータ) (2021-02-08T18:00:13Z) - Entropic Causal Inference: Identifiability and Finite Sample Results [14.495984877053948]
エントロピー因果推論は、観測データから2つのカテゴリー変数間の因果方向を推定する枠組みである。
Kocaogluらによって提示される最小エントロピー結合に基づくアルゴリズムアプローチを検討する。
論文 参考訳(メタデータ) (2021-01-10T08:37:54Z) - Causal Expectation-Maximisation [70.45873402967297]
ポリツリーグラフを特徴とするモデルにおいても因果推論はNPハードであることを示す。
我々は因果EMアルゴリズムを導入し、分類的表現変数のデータから潜伏変数の不確かさを再構築する。
我々は、反事実境界が構造方程式の知識なしにしばしば計算できるというトレンドのアイデアには、目立たずの制限があるように思える。
論文 参考訳(メタデータ) (2020-11-04T10:25:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。