論文の概要: Variable Selection with the Knockoffs: Composite Null Hypotheses
- arxiv url: http://arxiv.org/abs/2203.02849v4
- Date: Mon, 27 Nov 2023 06:42:31 GMT
- ステータス: 処理完了
- システム内更新日: 2023-11-30 18:06:49.303534
- Title: Variable Selection with the Knockoffs: Composite Null Hypotheses
- Title(参考訳): ノックオフによる変数選択:コンポジットヌル仮説
- Authors: Mehrdad Pournaderi and Yu Xiang
- Abstract要約: 我々は、ノックオフ手順の理論を合成ヌル仮説を用いたテストに拡張する。
主な技術的課題は、任意の設計から依存した特徴と組み合わせて合成ヌルを扱うことである。
- 参考スコア(独自算出の注目度): 2.725698729450241
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: The fixed-X knockoff filter is a flexible framework for variable selection
with false discovery rate (FDR) control in linear models with arbitrary design
matrices (of full column rank) and it allows for finite-sample selective
inference via the Lasso estimates. In this paper, we extend the theory of the
knockoff procedure to tests with composite null hypotheses, which are usually
more relevant to real-world problems. The main technical challenge lies in
handling composite nulls in tandem with dependent features from arbitrary
designs. We develop two methods for composite inference with the knockoffs,
namely, shifted ordinary least-squares (S-OLS) and feature-response product
perturbation (FRPP), building on new structural properties of test statistics
under composite nulls. We also propose two heuristic variants of S-OLS method
that outperform the celebrated Benjamini-Hochberg (BH) procedure for composite
nulls, which serves as a heuristic baseline under dependent test statistics.
Finally, we analyze the loss in FDR when the original knockoff procedure is
naively applied on composite tests.
- Abstract(参考訳): 固定Xノックオフフィルタは、任意の設計行列(全列ランク)を持つ線形モデルにおける偽発見率(FDR)制御による可変選択のための柔軟なフレームワークであり、ラッソ推定による有限サンプル選択推論を可能にする。
本稿では、ノックオフ手順の理論を、実世界の問題によく関係する複合的ヌル仮説を用いたテストに拡張する。
主な技術的課題は、任意の設計から依存した特徴と組み合わせて合成ヌルを扱うことである。
本研究では, 合成ヌルの下での試験統計の新たな構造特性を基盤として, 最小二乗シフト (S-OLS) と特徴応答型製品摂動 (FRPP) の2つの手法を開発した。
また,S-OLS法の2つのヒューリスティックな変種を提案し,この手法は複合ヌルに対する有名なBenjamini-Hochberg(BH)法よりも優れており,従属試験統計の下ではヒューリスティックなベースラインとして機能する。
最後に, 元のノックオフ手順を合成試験に適用した場合のFDRの損失を解析する。
関連論文リスト
- Optimal Multi-Distribution Learning [88.3008613028333]
マルチディストリビューション学習は、$k$の異なるデータ分散における最悪のリスクを最小限に抑える共有モデルを学ぶことを目指している。
本稿では, (d+k)/varepsilon2の順に, サンプルの複雑さを伴って, ヴァレプシロン最適ランダム化仮説を導出するアルゴリズムを提案する。
論文 参考訳(メタデータ) (2023-12-08T16:06:29Z) - Sequential Predictive Two-Sample and Independence Testing [114.4130718687858]
逐次的非パラメトリック2サンプルテストと独立テストの問題点について検討する。
私たちは賭けによる(非パラメトリックな)テストの原則に基づいています。
論文 参考訳(メタデータ) (2023-04-29T01:30:33Z) - Auto-Encoding Goodness of Fit [11.543670549371361]
2段階の仮説テストを含むGoFAE(Goodness of Fit Autoencoder)を開発した。
GoFAEは、競合する深層生成モデルと同等のFIDスコアと平均2乗誤差を達成する。
論文 参考訳(メタデータ) (2022-10-12T19:21:57Z) - Error-based Knockoffs Inference for Controlled Feature Selection [49.99321384855201]
本手法では, ノックオフ特徴量, エラーベース特徴重要度統計量, ステップダウン手順を一体化して, エラーベースのノックオフ推定手法を提案する。
提案手法では回帰モデルを指定する必要はなく,理論的保証で特徴選択を処理できる。
論文 参考訳(メタデータ) (2022-03-09T01:55:59Z) - AdaPT-GMM: Powerful and robust covariate-assisted multiple testing [0.7614628596146599]
偽発見率(FDR)制御を用いた複数検定の実証的ベイズ法を提案する。
本手法は,アダプティブp値しきい値法(AdaPT)をマスク方式の一般化により洗練する。
我々は、AdaPT-GMMと呼ばれる新しい手法が一貫して高出力を実現することを、広範囲にわたるシミュレーションと実データ例で示す。
論文 参考訳(メタデータ) (2021-06-30T05:06:18Z) - LSDAT: Low-Rank and Sparse Decomposition for Decision-based Adversarial
Attack [74.5144793386864]
LSDATは、入力サンプルのスパース成分と対向サンプルのスパース成分によって形成される低次元部分空間における摂動を加工する。
LSDは画像ピクセル領域で直接動作し、スパース性などの非$ell$制約が満たされることを保証します。
論文 参考訳(メタデータ) (2021-03-19T13:10:47Z) - Sparse Feature Selection Makes Batch Reinforcement Learning More Sample
Efficient [62.24615324523435]
本稿では,スパース線形関数近似を用いた高次元バッチ強化学習(RL)の統計的解析を行う。
候補となる機能が多数存在する場合,提案手法がバッチRLをより効率的にサンプリングできるという事実に光を当てる。
論文 参考訳(メタデータ) (2020-11-08T16:48:02Z) - Lower bounds in multiple testing: A framework based on derandomized
proxies [107.69746750639584]
本稿では, 各種コンクリートモデルへの適用例を示す, デランドマイズに基づく分析戦略を提案する。
これらの下界のいくつかを数値シミュレーションし、Benjamini-Hochberg (BH) アルゴリズムの実際の性能と密接な関係を示す。
論文 参考訳(メタデータ) (2020-05-07T19:59:51Z) - Fundamental Limits of Testing the Independence of Irrelevant
Alternatives in Discrete Choice [9.13127392774573]
MNL(Multinomial Logit)モデルとIIA(Independent of Irrelevant Alternatives)モデルが最も広く使われているツールである。
最低ケース誤差が低いIIAの一般的なテストは、選択問題の代替案の数で指数関数的に多くのサンプルを必要とすることを示す。
我々の下限は構造に依存しており、最適化の潜在的な原因として、特定の選択集合の集合で起こりうる違反にIIAのテストを制限すると、より悲観的でない構造に依存した下限が得られる。
論文 参考訳(メタデータ) (2020-01-20T10:15:28Z) - Safe Testing [0.9634859579172255]
e-value に基づいた仮説テスト理論を開発した。
e値に基づくテストは安全、すなわちType-Iエラーの保証を保持する。
論文 参考訳(メタデータ) (2019-06-18T20:39:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。