論文の概要: The leave-one-covariate-out conditional randomization test
- arxiv url: http://arxiv.org/abs/2006.08482v2
- Date: Mon, 13 Jul 2020 14:34:28 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-21 04:54:16.046662
- Title: The leave-one-covariate-out conditional randomization test
- Title(参考訳): 条件付き無作為化試験
- Authors: Eugene Katsevich and Aaditya Ramdas
- Abstract要約: 条件付き独立テストは重要な問題ですが、仮定なしでは間違いなく難しいです。
Knockoffsは、このフレームワークに関連する一般的な方法論であるが、2つの大きな欠点に悩まされている。
条件付きランダム化テスト(CRT)はモデルXの下では「正しい」解であると考えられているが、通常は計算的に非効率であると見なされる。
- 参考スコア(独自算出の注目度): 36.9351790405311
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Conditional independence testing is an important problem, yet provably hard
without assumptions. One of the assumptions that has become popular of late is
called "model-X", where we assume we know the joint distribution of the
covariates, but assume nothing about the conditional distribution of the
outcome given the covariates. Knockoffs is a popular methodology associated
with this framework, but it suffers from two main drawbacks: only one-bit
$p$-values are available for inference on each variable, and the method is
randomized with significant variability across runs in practice. The
conditional randomization test (CRT) is thought to be the "right" solution
under model-X, but usually viewed as computationally inefficient. This paper
proposes a computationally efficient leave-one-covariate-out (LOCO) CRT that
addresses both drawbacks of knockoffs. LOCO CRT produces valid $p$-values that
can be used to control the familywise error rate, and has nearly zero
algorithmic variability. For L1 regularized M-estimators, we develop an even
faster variant called L1ME CRT, which reuses computation by leveraging a novel
observation about the stability of the cross-validated lasso to removing
inactive variables. Last, for multivariate Gaussian covariates, we present a
closed form expression for the LOCO CRT $p$-value, thus completely eliminating
resampling in this important special case.
- Abstract(参考訳): 条件付き独立性テストは重要な問題ですが、仮定なしでは難しくなります。
遅くから人気になった仮定の1つは「モデルX」と呼ばれ、共変数の共分散を知っていると仮定するが、共変数が与えられた結果の条件分布については何も仮定しない。
knockoffsは、このフレームワークに関連する一般的な方法論であるが、2つの主な欠点に苦しんでいる。 各変数の推論には1ビット$p$-valuesしか使えず、メソッドは、実際に実行中にかなりの可変性を持つランダム化されている。
条件付きランダム化テスト(crt)はモデルxの「正しい」解であると考えられているが、通常は計算効率が悪いと見なされる。
本稿では,ノックオフの両欠点に対処する計算効率のよいLOCO(Left-one-covariate-out)CRTを提案する。
loco crtは、ファミリーワイズエラー率を制御するのに使用できる有効な$p$-valueを生成し、アルゴリズム的変動はほぼゼロである。
L1ME CRTとよばれるより高速な変種を考案し,不活性変数の除去にクロスバリデーションラッソの安定性に関する新たな観測を生かして計算を再利用する。
最後に、多変量ガウス共変量に対して、LOCO CRT $p$-値の閉形式式を提示する。
関連論文リスト
- Relaxed Quantile Regression: Prediction Intervals for Asymmetric Noise [51.87307904567702]
量子レグレッション(Quantile regression)は、出力の分布における量子の実験的推定を通じてそのような間隔を得るための主要なアプローチである。
本稿では、この任意の制約を除去する量子回帰に基づく区間構成の直接的な代替として、Relaxed Quantile Regression (RQR)を提案する。
これにより、柔軟性が向上し、望ましい品質が向上することが実証された。
論文 参考訳(メタデータ) (2024-06-05T13:36:38Z) - Wasserstein F-tests for Fréchet regression on Bures-Wasserstein manifolds [0.9514940899499753]
ビュール・ワッサーシュタイン多様体上のフレシェレグレッションが発展する。
非関連性の零仮説のテストが提案されている。
結果は,提案した試験が所望の有意な程度に有意であることを示している。
論文 参考訳(メタデータ) (2024-04-05T04:01:51Z) - Towards Faster Non-Asymptotic Convergence for Diffusion-Based Generative
Models [49.81937966106691]
我々は拡散モデルのデータ生成過程を理解するための非漸近理論のスイートを開発する。
従来の研究とは対照的に,本理論は基本的だが多目的な非漸近的アプローチに基づいて開発されている。
論文 参考訳(メタデータ) (2023-06-15T16:30:08Z) - Nearest-Neighbor Sampling Based Conditional Independence Testing [15.478671471695794]
条件付きランダム化テスト (CRT) は、2つの確率変数 X と Y が条件付き独立な与えられた確率変数 Z であるかどうかをテストするために最近提案された。
本研究の目的は, 与えられたXの分布の正確な形式を仮定することなく, 隣り合うサンプリングを用いて, CRTの新たな代替品を開発することである。
論文 参考訳(メタデータ) (2023-04-09T07:54:36Z) - The Projected Covariance Measure for assumption-lean variable significance testing [3.8936058127056357]
単純だが一般的なアプローチは、線形モデルを指定し、次に$X$の回帰係数が 0 でないかどうかをテストすることである。
条件付き平均独立性のモデルフリーなnullをテストする問題、すなわち条件付き平均の$Y$$$X$と$Z$は$X$に依存しない。
本稿では,加法モデルやランダムフォレストなど,柔軟な非パラメトリックあるいは機械学習手法を活用可能な,シンプルで汎用的なフレームワークを提案する。
論文 参考訳(メタデータ) (2022-11-03T17:55:50Z) - DIET: Conditional independence testing with marginal dependence measures
of residual information [30.99595500331328]
条件付きランダム化テスト(CRT)は、変数$x$が他の変数$y$の予測値であるかどうかを評価する。
CRTのコストを削減する既存のソリューションは通常、データセットを列車とテスト部分に分割する。
両問題を回避するアルゴリズムとして,分離独立テスト(DIET)を提案する。
論文 参考訳(メタデータ) (2022-08-18T00:48:04Z) - A Conditional Randomization Test for Sparse Logistic Regression in
High-Dimension [36.00360315353985]
emphCRT-logitは、変数蒸留ステップとデコレーションステップを組み合わせたアルゴリズムである。
本手法の理論的解析を行い,大規模な脳画像とゲノムデータセットの実験とともにシミュレーションにおける有効性を示す。
論文 参考訳(メタデータ) (2022-05-29T09:37:16Z) - Optimal policy evaluation using kernel-based temporal difference methods [78.83926562536791]
カーネルヒルベルト空間を用いて、無限水平割引マルコフ報酬過程の値関数を推定する。
我々は、関連するカーネル演算子の固有値に明示的に依存した誤差の非漸近上界を導出する。
MRP のサブクラスに対する minimax の下位境界を証明する。
論文 参考訳(メタデータ) (2021-09-24T14:48:20Z) - Multivariate Probabilistic Regression with Natural Gradient Boosting [63.58097881421937]
多変量予測分布の条件パラメータを非パラメトリックにモデル化したNatural Gradient Boosting (NGBoost) 手法を提案する。
提案手法は頑健で, 広範囲なチューニングを伴わず, 推定対象分布に対してモジュール構造であり, 既存の手法と比較して競争力がある。
論文 参考訳(メタデータ) (2021-06-07T17:44:49Z) - FANOK: Knockoffs in Linear Time [73.5154025911318]
本稿では,ガウスモデル-Xノックオフを効率的に実装し,大規模特徴選択問題における誤発見率を制御するアルゴリズムについて述べる。
当社のメソッドは、最大50,000ドルという問題でテストしています。
論文 参考訳(メタデータ) (2020-06-15T21:55:34Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。