論文の概要: DIET: Conditional independence testing with marginal dependence measures
of residual information
- arxiv url: http://arxiv.org/abs/2208.08579v1
- Date: Thu, 18 Aug 2022 00:48:04 GMT
- ステータス: 処理完了
- システム内更新日: 2022-08-19 13:22:25.867646
- Title: DIET: Conditional independence testing with marginal dependence measures
of residual information
- Title(参考訳): DIET:残余情報の限界依存度を用いた条件独立試験
- Authors: Mukund Sudarshan, Aahlad Manas Puli, Wesley Tansey, Rajesh Ranganath
- Abstract要約: 条件付きランダム化テスト(CRT)は、変数$x$が他の変数$y$の予測値であるかどうかを評価する。
CRTのコストを削減する既存のソリューションは通常、データセットを列車とテスト部分に分割する。
両問題を回避するアルゴリズムとして,分離独立テスト(DIET)を提案する。
- 参考スコア(独自算出の注目度): 30.99595500331328
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Conditional randomization tests (CRTs) assess whether a variable $x$ is
predictive of another variable $y$, having observed covariates $z$. CRTs
require fitting a large number of predictive models, which is often
computationally intractable. Existing solutions to reduce the cost of CRTs
typically split the dataset into a train and test portion, or rely on
heuristics for interactions, both of which lead to a loss in power. We propose
the decoupled independence test (DIET), an algorithm that avoids both of these
issues by leveraging marginal independence statistics to test conditional
independence relationships. DIET tests the marginal independence of two random
variables: $F(x \mid z)$ and $F(y \mid z)$ where $F(\cdot \mid z)$ is a
conditional cumulative distribution function (CDF). These variables are termed
"information residuals." We give sufficient conditions for DIET to achieve
finite sample type-1 error control and power greater than the type-1 error
rate. We then prove that when using the mutual information between the
information residuals as a test statistic, DIET yields the most powerful
conditionally valid test. Finally, we show DIET achieves higher power than
other tractable CRTs on several synthetic and real benchmarks.
- Abstract(参考訳): 条件付きランダム化テスト(CRT)は、変数$x$が他の変数$y$の予測値であるかどうかを評価する。
crtは大量の予測モデルに適合する必要があるが、計算上は難解であることが多い。
既存のCRTのコスト削減ソリューションは通常、データセットを列車とテスト部分に分割するか、インタラクションのヒューリスティックに頼っている。
本稿では,境界独立統計を利用して条件独立関係を検証し,両者の問題を回避するアルゴリズムである分離独立テスト(DIET)を提案する。
DIETは2つの確率変数の辺独立性をテストする:$F(x \mid z)$と$F(y \mid z)$ ここで$F(\cdot \mid z)$は条件累積分布関数(CDF)である。
これらの変数を「情報残差」と呼ぶ。
有限サンプルの1型エラー制御と1型エラーレートよりも大きなパワーを実現するために,ダイエットに十分な条件を与える。
次に,情報残差間の相互情報をテスト統計として使用する場合,食事は最も強力な条件付有効なテストとなることを示す。
最後に、DIETは、複数の合成および実ベンチマークにおいて、他のトラクタブルCRTよりも高い出力を達成することを示す。
関連論文リスト
- Doubly Robust Conditional Independence Testing with Generative Neural Networks [8.323172773256449]
本稿では、第3の確率ベクトル$Z$を与えられた2つのジェネリックランダムベクトル$X$と$Y$の条件独立性をテストする問題に対処する。
条件分布を明示的に推定しない新しい非パラメトリック試験法を提案する。
論文 参考訳(メタデータ) (2024-07-25T01:28:59Z) - Collaborative non-parametric two-sample testing [55.98760097296213]
目標は、null仮説の$p_v = q_v$が拒否されるノードを特定することである。
グラフ構造を効率的に活用する非パラメトリックコラボレーティブ2サンプルテスト(CTST)フレームワークを提案する。
提案手法は,f-divergence Estimation, Kernel Methods, Multitask Learningなどの要素を統合する。
論文 参考訳(メタデータ) (2024-02-08T14:43:56Z) - Nearest-Neighbor Sampling Based Conditional Independence Testing [15.478671471695794]
条件付きランダム化テスト (CRT) は、2つの確率変数 X と Y が条件付き独立な与えられた確率変数 Z であるかどうかをテストするために最近提案された。
本研究の目的は, 与えられたXの分布の正確な形式を仮定することなく, 隣り合うサンプリングを用いて, CRTの新たな代替品を開発することである。
論文 参考訳(メタデータ) (2023-04-09T07:54:36Z) - Sequential Kernelized Independence Testing [101.22966794822084]
我々は、カーネル化依存度にインスパイアされたシーケンシャルなカーネル化独立試験を設計する。
シミュレーションデータと実データの両方にアプローチのパワーを実証する。
論文 参考訳(メタデータ) (2022-12-14T18:08:42Z) - The Projected Covariance Measure for assumption-lean variable significance testing [3.8936058127056357]
単純だが一般的なアプローチは、線形モデルを指定し、次に$X$の回帰係数が 0 でないかどうかをテストすることである。
条件付き平均独立性のモデルフリーなnullをテストする問題、すなわち条件付き平均の$Y$$$X$と$Z$は$X$に依存しない。
本稿では,加法モデルやランダムフォレストなど,柔軟な非パラメトリックあるいは機械学習手法を活用可能な,シンプルで汎用的なフレームワークを提案する。
論文 参考訳(メタデータ) (2022-11-03T17:55:50Z) - Nonparametric Conditional Local Independence Testing [69.31200003384122]
条件付き局所独立は、連続的な時間プロセス間の独立関係である。
条件付き地域独立の非パラメトリックテストは行われていない。
二重機械学習に基づく非パラメトリックテストを提案する。
論文 参考訳(メタデータ) (2022-03-25T10:31:02Z) - The Sample Complexity of Robust Covariance Testing [56.98280399449707]
i. i. d.
形式 $Z = (1-epsilon) X + epsilon B$ の分布からのサンプル。ここで $X$ はゼロ平均で未知の共分散である Gaussian $mathcalN(0, Sigma)$ である。
汚染がない場合、事前の研究は、$O(d)$サンプルを使用するこの仮説テストタスクの単純なテスターを与えた。
サンプル複雑性の上限が $omega(d2)$ for $epsilon$ an arbitrarily small constant and $gamma であることを証明します。
論文 参考訳(メタデータ) (2020-12-31T18:24:41Z) - The leave-one-covariate-out conditional randomization test [36.9351790405311]
条件付き独立テストは重要な問題ですが、仮定なしでは間違いなく難しいです。
Knockoffsは、このフレームワークに関連する一般的な方法論であるが、2つの大きな欠点に悩まされている。
条件付きランダム化テスト(CRT)はモデルXの下では「正しい」解であると考えられているが、通常は計算的に非効率であると見なされる。
論文 参考訳(メタデータ) (2020-06-15T15:38:24Z) - Stable Prediction via Leveraging Seed Variable [73.9770220107874]
従来の機械学習手法は、非因果変数によって誘導されるトレーニングデータにおいて、微妙に刺激的な相関を利用して予測する。
本研究では, 条件付き独立性テストに基づくアルゴリズムを提案し, 種子変数を先行変数とする因果変数を分離し, 安定な予測に採用する。
我々のアルゴリズムは、安定した予測のための最先端の手法より優れている。
論文 参考訳(メタデータ) (2020-06-09T06:56:31Z) - A Random Matrix Analysis of Random Fourier Features: Beyond the Gaussian
Kernel, a Precise Phase Transition, and the Corresponding Double Descent [85.77233010209368]
本稿では、データサンプルの数が$n$である現実的な環境で、ランダムフーリエ(RFF)回帰の正確さを特徴付けます。
この分析はまた、大きな$n,p,N$のトレーニングとテスト回帰エラーの正確な推定も提供する。
論文 参考訳(メタデータ) (2020-06-09T02:05:40Z) - Optimal rates for independence testing via $U$-statistic permutation
tests [7.090165638014331]
独立分布と同一分布のペアが$sigma$-finiteで分離可能な測度空間で値を取る独立性テストの問題について検討する。
最初に、独立性の有効なテストはなく、$f: D(f) geq rho2 $ という形の代替と一様に一致していることを示す。
論文 参考訳(メタデータ) (2020-01-15T19:04:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。