論文の概要: AdaPT-GMM: Powerful and robust covariate-assisted multiple testing
- arxiv url: http://arxiv.org/abs/2106.15812v1
- Date: Wed, 30 Jun 2021 05:06:18 GMT
- ステータス: 処理完了
- システム内更新日: 2021-07-01 15:21:03.982602
- Title: AdaPT-GMM: Powerful and robust covariate-assisted multiple testing
- Title(参考訳): AdaPT-GMM:強力でロバストな共変量支援多重試験
- Authors: Patrick Chao, William Fithian
- Abstract要約: 偽発見率(FDR)制御を用いた複数検定の実証的ベイズ法を提案する。
本手法は,アダプティブp値しきい値法(AdaPT)をマスク方式の一般化により洗練する。
我々は、AdaPT-GMMと呼ばれる新しい手法が一貫して高出力を実現することを、広範囲にわたるシミュレーションと実データ例で示す。
- 参考スコア(独自算出の注目度): 0.7614628596146599
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We propose a new empirical Bayes method for covariate-assisted multiple
testing with false discovery rate (FDR) control, where we model the local false
discovery rate for each hypothesis as a function of both its covariates and
p-value. Our method refines the adaptive p-value thresholding (AdaPT) procedure
by generalizing its masking scheme to reduce the bias and variance of its false
discovery proportion estimator, improving the power when the rejection set is
small or some null p-values concentrate near 1. We also introduce a Gaussian
mixture model for the conditional distribution of the test statistics given
covariates, modeling the mixing proportions with a generic user-specified
classifier, which we implement using a two-layer neural network. Like AdaPT,
our method provably controls the FDR in finite samples even if the classifier
or the Gaussian mixture model is misspecified. We show in extensive simulations
and real data examples that our new method, which we call AdaPT-GMM,
consistently delivers high power relative to competing state-of-the-art
methods. In particular, it performs well in scenarios where AdaPT is
underpowered, and is especially well-suited for testing composite null
hypothesis, such as whether the effect size exceeds a practical significance
threshold.
- Abstract(参考訳): そこで我々は,共変量とp値の両方の関数として,各仮説の局所的偽発見率をモデル化する手法を提案する。
提案手法は, マスク方式を一般化し, 擬似発見率推定器の偏差と分散を低減し, 拒否集合が小さい場合や, ヌルp値が1付近に集中する場合のパワーを向上させることにより, 適応的p値閾値決定法(AdaPT)を改良する。
また、2層ニューラルネットワークを用いて実装した汎用ユーザ特定分類器を用いて混合比率をモデル化し、共変量によるテスト統計の条件分布に関するガウス混合モデルも導入する。
adaptと同様に、この手法は分類器やガウス混合モデルが誤った場合であっても有限サンプルでfdrを確実に制御する。
我々は、AdaPT-GMMと呼ばれる新しい手法が、競合する最先端の手法と比較して一貫して高い電力を供給できることを、広範囲にわたるシミュレーションおよび実データ例で示す。
特に、AdaPTがパワー不足のシナリオではよく機能し、特に効果サイズが実用上重要なしきい値を超えるかどうかといった複合ヌル仮説のテストに適している。
関連論文リスト
- CKD: Contrastive Knowledge Distillation from A Sample-wise Perspective [48.99488315273868]
本研究では,試料内およびサンプル間制約によるサンプルワイドアライメント問題として定式化できる,対照的な知識蒸留手法を提案する。
本手法は, 数値を考慮し, 同一試料中のロジット差を最小化する。
CIFAR-100, ImageNet-1K, MS COCOの3つのデータセットについて総合的な実験を行った。
論文 参考訳(メタデータ) (2024-04-22T11:52:40Z) - A Semi-Bayesian Nonparametric Estimator of the Maximum Mean Discrepancy
Measure: Applications in Goodness-of-Fit Testing and Generative Adversarial
Networks [3.623570119514559]
そこで我々は,GoF(Goness-of-fit)テストのための半ベイズ非パラメトリック(セミBNP)手順を提案する。
提案手法は,最大平均誤差(MMD)測定のための新しいベイズ推定器を提案する。
提案手法は, 誤り仮説の誤認率と受理率を低くすることで, 頻繁なMDD法よりも優れていることを示す。
論文 参考訳(メタデータ) (2023-03-05T10:36:21Z) - Convergence of uncertainty estimates in Ensemble and Bayesian sparse
model discovery [4.446017969073817]
ブートストラップに基づく逐次しきい値最小二乗推定器による雑音に対する精度と頑健性の観点から経験的成功を示す。
このブートストラップに基づくアンサンブル手法は,誤差率の指数収束率で,確率的に正しい可変選択を行うことができることを示す。
論文 参考訳(メタデータ) (2023-01-30T04:07:59Z) - Learning Multivariate CDFs and Copulas using Tensor Factorization [39.24470798045442]
データの多変量分布を学習することは、統計学と機械学習における中核的な課題である。
本研究では,多変量累積分布関数(CDF)を学習し,混合確率変数を扱えるようにすることを目的とする。
混合確率変数の合同CDFの任意のグリッドサンプリング版は、単純ベイズモデルとして普遍表現を許容することを示す。
提案モデルの性能を,回帰,サンプリング,データ計算を含むいくつかの合成および実データおよびアプリケーションで実証する。
論文 参考訳(メタデータ) (2022-10-13T16:18:46Z) - Distributionally Robust Models with Parametric Likelihood Ratios [123.05074253513935]
3つの単純なアイデアにより、より広いパラメトリックな確率比のクラスを用いてDROでモデルを訓練することができる。
パラメトリック逆数を用いてトレーニングしたモデルは、他のDROアプローチと比較して、サブポピュレーションシフトに対して一貫して頑健であることがわかった。
論文 参考訳(メタデータ) (2022-04-13T12:43:12Z) - Error-based Knockoffs Inference for Controlled Feature Selection [49.99321384855201]
本手法では, ノックオフ特徴量, エラーベース特徴重要度統計量, ステップダウン手順を一体化して, エラーベースのノックオフ推定手法を提案する。
提案手法では回帰モデルを指定する必要はなく,理論的保証で特徴選択を処理できる。
論文 参考訳(メタデータ) (2022-03-09T01:55:59Z) - Learning generative models for valid knockoffs using novel
multivariate-rank based statistics [12.528602250193206]
ランクエネルギー (RE) は、Monge's Optimal Transport (OT) 問題における最適写像を特徴付ける理論的結果を用いて導出される。
我々は、ソフトランクエネルギー(sRE)と呼ばれるREの変種と、ソフトランク最大平均誤差(sRMMD)と呼ばれるカーネル変種を提案する。
次に、sRMMDを用いて深いノックオフを生成し、有効なノックオフを生成するための新規かつ効果的な方法であることを示す。
論文 参考訳(メタデータ) (2021-10-29T18:51:19Z) - A One-step Approach to Covariate Shift Adaptation [82.01909503235385]
多くの機械学習シナリオにおけるデフォルトの前提は、トレーニングとテストサンプルは同じ確率分布から引き出されることである。
予測モデルと関連する重みを1つの最適化で共同で学習する新しいワンステップアプローチを提案する。
論文 参考訳(メタデータ) (2020-07-08T11:35:47Z) - Good Classifiers are Abundant in the Interpolating Regime [64.72044662855612]
補間分類器間のテストエラーの完全な分布を正確に計算する手法を開発した。
テストエラーは、最悪の補間モデルのテストエラーから大きく逸脱する、小さな典型的な$varepsilon*$に集中する傾向にある。
以上の結果から,統計的学習理論における通常の解析手法は,実際に観測された優れた一般化性能を捉えるのに十分な粒度にはならない可能性が示唆された。
論文 参考訳(メタデータ) (2020-06-22T21:12:31Z) - Lower bounds in multiple testing: A framework based on derandomized
proxies [107.69746750639584]
本稿では, 各種コンクリートモデルへの適用例を示す, デランドマイズに基づく分析戦略を提案する。
これらの下界のいくつかを数値シミュレーションし、Benjamini-Hochberg (BH) アルゴリズムの実際の性能と密接な関係を示す。
論文 参考訳(メタデータ) (2020-05-07T19:59:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。