論文の概要: Asymptotic FDR Control with Model-X Knockoffs: Is Moments Matching Sufficient?
- arxiv url: http://arxiv.org/abs/2502.05969v1
- Date: Sun, 09 Feb 2025 17:36:00 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-02-11 14:34:02.047584
- Title: Asymptotic FDR Control with Model-X Knockoffs: Is Moments Matching Sufficient?
- Title(参考訳): Model-X Knockoffsを用いた漸近的FDR制御:モーメントマッチングは十分か?
- Authors: Yingying Fan, Lan Gao, Jinchi Lv, Xiaocong Xu,
- Abstract要約: モデル-Xノックオフフレームワークの堅牢性を研究するための統一理論フレームワークを提案する。
論文の中では初めて,ガウスノックオフ発生器の有効性と推測を理論的に正当化した。
- 参考スコア(独自算出の注目度): 6.6716279375012295
- License:
- Abstract: We propose a unified theoretical framework for studying the robustness of the model-X knockoffs framework by investigating the asymptotic false discovery rate (FDR) control of the practically implemented approximate knockoffs procedure. This procedure deviates from the model-X knockoffs framework by substituting the true covariate distribution with a user-specified distribution that can be learned using in-sample observations. By replacing the distributional exchangeability condition of the model-X knockoff variables with three conditions on the approximate knockoff statistics, we establish that the approximate knockoffs procedure achieves the asymptotic FDR control. Using our unified framework, we further prove that an arguably most popularly used knockoff variable generation method--the Gaussian knockoffs generator based on the first two moments matching--achieves the asymptotic FDR control when the two-moment-based knockoff statistics are employed in the knockoffs inference procedure. For the first time in the literature, our theoretical results justify formally the effectiveness and robustness of the Gaussian knockoffs generator. Simulation and real data examples are conducted to validate the theoretical findings.
- Abstract(参考訳): そこで,本研究では,本手法を実用的に実装した近似ノックオフ手法の漸近的偽発見率(FDR)制御を検証し,モデル-Xノックオフフレームワークの堅牢性を研究するための統一理論フレームワークを提案する。
この手順は、真共変量分布を、サンプル内観測を用いて学習可能なユーザ特定分布に置換することにより、モデル-Xノックオフフレームワークから逸脱する。
モデル-Xノックオフ変数の分布交換性条件を近似ノックオフ統計上の3つの条件に置き換えることで、近似ノックオフ処理が漸近的なFDR制御を実現することを確かめる。
我々の統合フレームワークを用いて、最もよく使われているノックオフ変数生成法である、最初の2つのモーメントマッチングに基づくガウスノックオフ生成法が、2モーメントベースのノックオフ統計をノックオフ推論手順に用いた場合、漸近的なFDR制御を実現することを証明した。
論文の中では初めて,ガウスノックオフ発生器の有効性とロバスト性について理論的に検証した。
シミュレーションと実データを用いて理論的な結果の検証を行う。
関連論文リスト
- Rectified Diffusion Guidance for Conditional Generation [62.00207951161297]
CFGの背後にある理論を再検討し、組合せ係数の不適切な構成(すなわち、広く使われている和対1バージョン)が生成分布の期待シフトをもたらすことを厳密に確認する。
本稿では,誘導係数を緩和したReCFGを提案する。
このようにして、修正された係数は観測されたデータをトラバースすることで容易に事前計算でき、サンプリング速度はほとんど影響を受けない。
論文 参考訳(メタデータ) (2024-10-24T13:41:32Z) - Provable Guarantees for Generative Behavior Cloning: Bridging Low-Level
Stability and High-Level Behavior [51.60683890503293]
生成モデルを用いた複雑な専門家による実演の行動クローニングに関する理論的枠組みを提案する。
任意の専門的軌跡の時間ごとのステップ分布に一致するトラジェクトリを生成することができることを示す。
論文 参考訳(メタデータ) (2023-07-27T04:27:26Z) - ARK: Robust Knockoffs Inference with Coupling [7.288274235236948]
本稿では,モデル-Xノックオフフレームワークの,不特定あるいは推定された特徴分布に対するロバスト性について検討する。
鍵となる手法は、近似ノックオフ手順とモデル-Xノックオフ手順を結合して、これらの2つのプロシージャのランダム変数が実現時に近いようにすることである。
このような結合モデル-Xノックオフ手順が存在する場合、その近似ノックオフ手順は、目標レベルのFDRまたは$k$-FWER制御を達成することができる。
論文 参考訳(メタデータ) (2023-07-10T08:01:59Z) - Towards Faster Non-Asymptotic Convergence for Diffusion-Based Generative
Models [49.81937966106691]
我々は拡散モデルのデータ生成過程を理解するための非漸近理論のスイートを開発する。
従来の研究とは対照的に,本理論は基本的だが多目的な非漸近的アプローチに基づいて開発されている。
論文 参考訳(メタデータ) (2023-06-15T16:30:08Z) - Near-optimal multiple testing in Bayesian linear models with
finite-sample FDR control [11.011242089340438]
高次元変数選択問題では、統計学者はしばしば偽発見率(FDR)を制御する複数の試験手順を設計しようと試みる。
モデルが誤って特定された場合でも、有限サンプルから頻繁なFDRを確実に制御するModel-Xプロシージャを導入する。
提案手法であるPoEdCeは, 後期待, 蒸留ランダム化試験 (dCRT) , およびE値を用いたBenjamini-Hochberg法である。
論文 参考訳(メタデータ) (2022-11-04T22:56:41Z) - Error-based Knockoffs Inference for Controlled Feature Selection [49.99321384855201]
本手法では, ノックオフ特徴量, エラーベース特徴重要度統計量, ステップダウン手順を一体化して, エラーベースのノックオフ推定手法を提案する。
提案手法では回帰モデルを指定する必要はなく,理論的保証で特徴選択を処理できる。
論文 参考訳(メタデータ) (2022-03-09T01:55:59Z) - Learning generative models for valid knockoffs using novel
multivariate-rank based statistics [12.528602250193206]
ランクエネルギー (RE) は、Monge's Optimal Transport (OT) 問題における最適写像を特徴付ける理論的結果を用いて導出される。
我々は、ソフトランクエネルギー(sRE)と呼ばれるREの変種と、ソフトランク最大平均誤差(sRMMD)と呼ばれるカーネル変種を提案する。
次に、sRMMDを用いて深いノックオフを生成し、有効なノックオフを生成するための新規かつ効果的な方法であることを示す。
論文 参考訳(メタデータ) (2021-10-29T18:51:19Z) - Random quantum circuits anti-concentrate in log depth [118.18170052022323]
本研究では,典型的な回路インスタンスにおける測定結果の分布に要するゲート数について検討する。
我々の反集中の定義は、予測衝突確率が分布が均一である場合よりも大きい定数因子に過ぎないということである。
ゲートが1D環上で最寄りである場合と、ゲートが長距離である場合の両方において、$O(n log(n))ゲートも十分であることを示す。
論文 参考訳(メタデータ) (2020-11-24T18:44:57Z) - The leave-one-covariate-out conditional randomization test [36.9351790405311]
条件付き独立テストは重要な問題ですが、仮定なしでは間違いなく難しいです。
Knockoffsは、このフレームワークに関連する一般的な方法論であるが、2つの大きな欠点に悩まされている。
条件付きランダム化テスト(CRT)はモデルXの下では「正しい」解であると考えられているが、通常は計算的に非効率であると見なされる。
論文 参考訳(メタデータ) (2020-06-15T15:38:24Z) - Lower bounds in multiple testing: A framework based on derandomized
proxies [107.69746750639584]
本稿では, 各種コンクリートモデルへの適用例を示す, デランドマイズに基づく分析戦略を提案する。
これらの下界のいくつかを数値シミュレーションし、Benjamini-Hochberg (BH) アルゴリズムの実際の性能と密接な関係を示す。
論文 参考訳(メタデータ) (2020-05-07T19:59:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。