論文の概要: Nearest-Neighbor Sampling Based Conditional Independence Testing
- arxiv url: http://arxiv.org/abs/2304.04183v1
- Date: Sun, 9 Apr 2023 07:54:36 GMT
- ステータス: 処理完了
- システム内更新日: 2023-04-11 17:08:56.058923
- Title: Nearest-Neighbor Sampling Based Conditional Independence Testing
- Title(参考訳): 近傍近傍サンプリングに基づく条件独立試験
- Authors: Shuai Li, Ziqi Chen, Hongtu Zhu, Christina Dan Wang, Wang Wen
- Abstract要約: 条件付きランダム化テスト (CRT) は、2つの確率変数 X と Y が条件付き独立な与えられた確率変数 Z であるかどうかをテストするために最近提案された。
本研究の目的は, 与えられたXの分布の正確な形式を仮定することなく, 隣り合うサンプリングを用いて, CRTの新たな代替品を開発することである。
- 参考スコア(独自算出の注目度): 15.478671471695794
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The conditional randomization test (CRT) was recently proposed to test
whether two random variables X and Y are conditionally independent given random
variables Z. The CRT assumes that the conditional distribution of X given Z is
known under the null hypothesis and then it is compared to the distribution of
the observed samples of the original data. The aim of this paper is to develop
a novel alternative of CRT by using nearest-neighbor sampling without assuming
the exact form of the distribution of X given Z. Specifically, we utilize the
computationally efficient 1-nearest-neighbor to approximate the conditional
distribution that encodes the null hypothesis. Then, theoretically, we show
that the distribution of the generated samples is very close to the true
conditional distribution in terms of total variation distance. Furthermore, we
take the classifier-based conditional mutual information estimator as our test
statistic. The test statistic as an empirical fundamental information theoretic
quantity is able to well capture the conditional-dependence feature. We show
that our proposed test is computationally very fast, while controlling type I
and II errors quite well. Finally, we demonstrate the efficiency of our
proposed test in both synthetic and real data analyses.
- Abstract(参考訳): 条件付き確率化テスト(conditional randomization test, crt)は、2つの確率変数 x と y が条件付き独立な与えられた確率変数 z であるかどうかをテストするために最近提案された。
本稿では, x の分布の正確な形を仮定することなく, 最近傍サンプリングを用いて crt の新たな代替法を開発することを目的としている。具体的には, 計算効率の良い 1-nearest-neighbor を用いて, ヌル仮説を符号化する条件分布を近似する。
そして, 理論的には, 生成した試料の分布は, 総変動距離の点で, 真の条件分布に非常に近いことを示す。
さらに, 分類器に基づく条件付き相互情報推定器をテスト統計として採用する。
経験的基本情報理論量としてのテスト統計量は条件依存の特徴を適切に捉えることができる。
提案手法は,I型とII型の誤差を十分に制御しながら,非常に高速であることを示す。
最後に,合成データ解析と実データ解析の両方において,提案手法の有効性を示す。
関連論文リスト
- Theory on Score-Mismatched Diffusion Models and Zero-Shot Conditional Samplers [49.97755400231656]
本報告では,明示的な次元の一般スコアミスマッチ拡散サンプリング器を用いた最初の性能保証について述べる。
その結果, スコアミスマッチは, 目標分布とサンプリング分布の分布バイアスとなり, 目標分布とトレーニング分布の累積ミスマッチに比例することがわかった。
この結果は、測定ノイズに関係なく、任意の条件モデルに対するゼロショット条件付きサンプリングに直接適用することができる。
論文 参考訳(メタデータ) (2024-10-17T16:42:12Z) - Controllable Generation via Locally Constrained Resampling [77.48624621592523]
本研究では, ベイズ条件付けを行い, 制約条件下でサンプルを描画する, トラクタブルな確率的手法を提案する。
提案手法はシーケンス全体を考慮し,現行のグリード法よりも大域的に最適に制約された生成を導出する。
提案手法は, 有害な世代からモデル出力を分離し, 脱毒化に対する同様のアプローチより優れていることを示す。
論文 参考訳(メタデータ) (2024-10-17T00:49:53Z) - Doubly Robust Conditional Independence Testing with Generative Neural Networks [8.323172773256449]
本稿では、第3の確率ベクトル$Z$を与えられた2つのジェネリックランダムベクトル$X$と$Y$の条件独立性をテストする問題に対処する。
条件分布を明示的に推定しない新しい非パラメトリック試験法を提案する。
論文 参考訳(メタデータ) (2024-07-25T01:28:59Z) - A Kernel-Based Conditional Two-Sample Test Using Nearest Neighbors (with Applications to Calibration, Regression Curves, and Simulation-Based Inference) [3.622435665395788]
本稿では,2つの条件分布の違いを検出するカーネルベースの尺度を提案する。
2つの条件分布が同じである場合、推定はガウス極限を持ち、その分散はデータから容易に推定できる単純な形式を持つ。
また、条件付き適合性問題に適用可能な推定値を用いた再サンプリングベースのテストも提供する。
論文 参考訳(メタデータ) (2024-07-23T15:04:38Z) - Sequential Predictive Two-Sample and Independence Testing [114.4130718687858]
逐次的非パラメトリック2サンプルテストと独立テストの問題点について検討する。
私たちは賭けによる(非パラメトリックな)テストの原則に基づいています。
論文 参考訳(メタデータ) (2023-04-29T01:30:33Z) - DensePure: Understanding Diffusion Models towards Adversarial Robustness [110.84015494617528]
拡散モデルの特性を解析し,それらが証明された堅牢性を高める条件を確立する。
事前訓練されたモデル(すなわち分類器)の信頼性向上を目的とした新しいDensePure法を提案する。
このロバストな領域は多重凸集合の和であり、以前の研究で特定されたロバストな領域よりもはるかに大きい可能性が示されている。
論文 参考訳(メタデータ) (2022-11-01T08:18:07Z) - Nonparametric Conditional Local Independence Testing [69.31200003384122]
条件付き局所独立は、連続的な時間プロセス間の独立関係である。
条件付き地域独立の非パラメトリックテストは行われていない。
二重機械学習に基づく非パラメトリックテストを提案する。
論文 参考訳(メタデータ) (2022-03-25T10:31:02Z) - Wasserstein Generative Learning of Conditional Distribution [6.051520664893158]
条件分布学習のためのワッサーシュタイン生成手法を提案する。
提案手法により生成された条件付きサンプリング分布の非漸近誤差境界を確立する。
論文 参考訳(メタデータ) (2021-12-19T01:55:01Z) - Adversarial sampling of unknown and high-dimensional conditional
distributions [0.0]
本稿では, GAN (Generative Adversarial Network) と呼ばれるデータ駆動方式を用いて, サンプリング法と基礎分布の推定を行う。
GANは、2つの競合するニューラルネットワークをトレーニングし、トレーニングセット分布からサンプルを効果的に生成できるネットワークを生成する。
提案アルゴリズムのすべてのバージョンは, 対象条件分布を, サンプルの品質に最小限の影響で効果的にサンプリングできることが示されている。
論文 参考訳(メタデータ) (2021-11-08T12:23:38Z) - Two-Sample Testing on Ranked Preference Data and the Role of Modeling
Assumptions [57.77347280992548]
本稿では,ペアワイズ比較データとランキングデータのための2サンプル試験を設計する。
私たちのテストでは、基本的に分布に関する仮定は必要ありません。
実世界のペアワイズ比較データに2サンプルテストを適用することで、人によって提供される評価とランキングは、実際は異なる分散である、と結論付ける。
論文 参考訳(メタデータ) (2020-06-21T20:51:09Z) - Testing Goodness of Fit of Conditional Density Models with Kernels [16.003516725803774]
条件分布に適合する2つの非パラメトリック統計テストを提案する。
私たちのテストは、任意の固定された代替条件モデルに対して一貫性があることを示します。
ニューヨーク市のタクシー降車場所の分布をモデル化する作業において,テストの解釈可能性を示す。
論文 参考訳(メタデータ) (2020-02-24T14:04:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。