論文の概要: Conditional Diffusion Models Based Conditional Independence Testing
- arxiv url: http://arxiv.org/abs/2412.11744v1
- Date: Mon, 16 Dec 2024 13:03:18 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-12-17 14:01:17.988017
- Title: Conditional Diffusion Models Based Conditional Independence Testing
- Title(参考訳): 条件拡散モデルに基づく条件独立試験
- Authors: Yanfeng Yang, Shuai Li, Yingjie Zhang, Zhuoran Sun, Hai Shu, Ziqi Chen, Renmin Zhang,
- Abstract要約: 条件付きランダム化テスト (CRT) は2つの確率変数である$X$ と $Y$ が条件独立かどうかをテストするために最近導入された。
条件拡散モデル(CDM)を用いて,X|Z$の分布を学習する。
- 参考スコア(独自算出の注目度): 8.411537393525114
- License:
- Abstract: Conditional independence (CI) testing is a fundamental task in modern statistics and machine learning. The conditional randomization test (CRT) was recently introduced to test whether two random variables, $X$ and $Y$, are conditionally independent given a potentially high-dimensional set of random variables, $Z$. The CRT operates exceptionally well under the assumption that the conditional distribution $X|Z$ is known. However, since this distribution is typically unknown in practice, accurately approximating it becomes crucial. In this paper, we propose using conditional diffusion models (CDMs) to learn the distribution of $X|Z$. Theoretically and empirically, it is shown that CDMs closely approximate the true conditional distribution. Furthermore, CDMs offer a more accurate approximation of $X|Z$ compared to GANs, potentially leading to a CRT that performs better than those based on GANs. To accommodate complex dependency structures, we utilize a computationally efficient classifier-based conditional mutual information (CMI) estimator as our test statistic. The proposed testing procedure performs effectively without requiring assumptions about specific distribution forms or feature dependencies, and is capable of handling mixed-type conditioning sets that include both continuous and discrete variables. Theoretical analysis shows that our proposed test achieves a valid control of the type I error. A series of experiments on synthetic data demonstrates that our new test effectively controls both type-I and type-II errors, even in high dimensional scenarios.
- Abstract(参考訳): 条件付き独立テスト(CI)は、現代の統計学と機械学習における基本的な課題である。
条件付き乱数化テスト(CRT)は、最近導入され、2つの確率変数である$X$と$Y$が、潜在的に高次元の確率変数の集合である$Z$に対して条件独立であるかどうかをテストするために導入された。
CRT は条件分布 $X|Z$ が知られているという仮定の下で非常によく機能する。
しかし、この分布は実際には分かっていないため、正確に近似することが重要である。
本稿では,条件拡散モデル(CDM)を用いて,X|Z$の分布を学習する。
理論的および実験的に、CDMが真の条件分布を近似していることが示されている。
さらに、CDM は GAN と比較してより正確な$X|Z$ の近似を提供しており、おそらくは GAN に基づくものよりも優れた性能を持つ CRT に繋がる可能性がある。
複雑な依存関係構造に対応するため、計算効率の良い分類器に基づく条件付き相互情報(CMI)をテスト統計量として利用した。
提案手法は,特定の分布形式や機能依存の仮定を必要とせずに効果的に動作し,連続変数と離散変数の両方を含む混合型条件付き集合を処理できる。
理論的解析により,提案手法がI型エラーの有効な制御を実現することが示された。
合成データの一連の実験により,本試験は高次元シナリオにおいても,I型とII型の両方のエラーを効果的に制御することを示した。
関連論文リスト
- Theory on Score-Mismatched Diffusion Models and Zero-Shot Conditional Samplers [49.97755400231656]
本報告では,明示的な次元の一般スコアミスマッチ拡散サンプリング器を用いた最初の性能保証について述べる。
その結果, スコアミスマッチは, 目標分布とサンプリング分布の分布バイアスとなり, 目標分布とトレーニング分布の累積ミスマッチに比例することがわかった。
この結果は、測定ノイズに関係なく、任意の条件モデルに対するゼロショット条件付きサンプリングに直接適用することができる。
論文 参考訳(メタデータ) (2024-10-17T16:42:12Z) - Doubly Robust Conditional Independence Testing with Generative Neural Networks [8.323172773256449]
本稿では、第3の確率ベクトル$Z$を与えられた2つのジェネリックランダムベクトル$X$と$Y$の条件独立性をテストする問題に対処する。
条件分布を明示的に推定しない新しい非パラメトリック試験法を提案する。
論文 参考訳(メタデータ) (2024-07-25T01:28:59Z) - Unveil Conditional Diffusion Models with Classifier-free Guidance: A Sharp Statistical Theory [87.00653989457834]
条件付き拡散モデルは現代の画像合成の基礎となり、計算生物学や強化学習などの分野に広く応用されている。
経験的成功にもかかわらず、条件拡散モデルの理論はほとんど欠落している。
本稿では,条件拡散モデルを用いた分布推定の急激な統計的理論を提示することにより,ギャップを埋める。
論文 参考訳(メタデータ) (2024-03-18T17:08:24Z) - Towards Faster Non-Asymptotic Convergence for Diffusion-Based Generative
Models [49.81937966106691]
我々は拡散モデルのデータ生成過程を理解するための非漸近理論のスイートを開発する。
従来の研究とは対照的に,本理論は基本的だが多目的な非漸近的アプローチに基づいて開発されている。
論文 参考訳(メタデータ) (2023-06-15T16:30:08Z) - Nearest-Neighbor Sampling Based Conditional Independence Testing [15.478671471695794]
条件付きランダム化テスト (CRT) は、2つの確率変数 X と Y が条件付き独立な与えられた確率変数 Z であるかどうかをテストするために最近提案された。
本研究の目的は, 与えられたXの分布の正確な形式を仮定することなく, 隣り合うサンプリングを用いて, CRTの新たな代替品を開発することである。
論文 参考訳(メタデータ) (2023-04-09T07:54:36Z) - DIET: Conditional independence testing with marginal dependence measures
of residual information [30.99595500331328]
条件付きランダム化テスト(CRT)は、変数$x$が他の変数$y$の予測値であるかどうかを評価する。
CRTのコストを削減する既存のソリューションは通常、データセットを列車とテスト部分に分割する。
両問題を回避するアルゴリズムとして,分離独立テスト(DIET)を提案する。
論文 参考訳(メタデータ) (2022-08-18T00:48:04Z) - Nonparametric Conditional Local Independence Testing [69.31200003384122]
条件付き局所独立は、連続的な時間プロセス間の独立関係である。
条件付き地域独立の非パラメトリックテストは行われていない。
二重機械学習に基づく非パラメトリックテストを提案する。
論文 参考訳(メタデータ) (2022-03-25T10:31:02Z) - An $\ell^p$-based Kernel Conditional Independence Test [21.689461247198388]
そこで本稿では, 最適分布の2つのカーネルベース代表者間の距離を$Lp$とする, 条件付き独立性のための計算効率の高い新しいテストを提案する。
我々は,新しい試験の性能が,高次元設定においても,統計的パワーとタイプI誤差の両方の観点から,最先端の手法よりも優れていることを示す一連の実験を行った。
論文 参考訳(メタデータ) (2021-10-28T03:18:27Z) - On the Generative Utility of Cyclic Conditionals [103.1624347008042]
2つの条件付きモデル$p(x|z)$を用いて、共同分布$p(x,z)$をモデル化できるかどうか、また、どのようにしてサイクルを形成するかを検討する。
本稿では,周期条件生成モデリングのためのCyGenフレームワークを提案する。
論文 参考訳(メタデータ) (2021-06-30T10:23:45Z) - Good Classifiers are Abundant in the Interpolating Regime [64.72044662855612]
補間分類器間のテストエラーの完全な分布を正確に計算する手法を開発した。
テストエラーは、最悪の補間モデルのテストエラーから大きく逸脱する、小さな典型的な$varepsilon*$に集中する傾向にある。
以上の結果から,統計的学習理論における通常の解析手法は,実際に観測された優れた一般化性能を捉えるのに十分な粒度にはならない可能性が示唆された。
論文 参考訳(メタデータ) (2020-06-22T21:12:31Z) - Double Generative Adversarial Networks for Conditional Independence
Testing [8.359770027722275]
高次元条件独立テストは統計学と機械学習の重要な構成要素である。
本稿では,GAN(Double Generative Adversarial Network)に基づく推論手法を提案する。
論文 参考訳(メタデータ) (2020-06-03T16:14:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。