論文の概要: Directional FDR Control for Sub-Gaussian Sparse GLMs
- arxiv url: http://arxiv.org/abs/2105.00393v1
- Date: Sun, 2 May 2021 05:34:32 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-04 13:46:53.081128
- Title: Directional FDR Control for Sub-Gaussian Sparse GLMs
- Title(参考訳): サブガウシアンスパースglmの方向性fdr制御
- Authors: Chang Cui, Jinzhu Jia, Yijun Xiao, Huiming Zhang
- Abstract要約: 偽発見率(FDR)制御は、統計的に有意にゼロでない結果の少ない数を特定することを目的とする。
偏りのある行列ラッソ推定器を構築し、スパースGLMの最小レートオーラクル不等式による正規性を証明する。
- 参考スコア(独自算出の注目度): 4.229179009157074
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: High-dimensional sparse generalized linear models (GLMs) have emerged in the
setting that the number of samples and the dimension of variables are large,
and even the dimension of variables grows faster than the number of samples.
False discovery rate (FDR) control aims to identify some small number of
statistically significantly nonzero results after getting the sparse penalized
estimation of GLMs. Using the CLIME method for precision matrix estimations, we
construct the debiased-Lasso estimator and prove the asymptotical normality by
minimax-rate oracle inequalities for sparse GLMs. In practice, it is often
needed to accurately judge each regression coefficient's positivity and
negativity, which determines whether the predictor variable is positively or
negatively related to the response variable conditionally on the rest
variables. Using the debiased estimator, we establish multiple testing
procedures. Under mild conditions, we show that the proposed debiased
statistics can asymptotically control the directional (sign) FDR and
directional false discovery variables at a pre-specified significance level.
Moreover, it can be shown that our multiple testing procedure can approximately
achieve a statistical power of 1. We also extend our methods to the two-sample
problems and propose the two-sample test statistics. Under suitable conditions,
we can asymptotically achieve directional FDR control and directional FDV
control at the specified significance level for two-sample problems. Some
numerical simulations have successfully verified the FDR control effects of our
proposed testing procedures, which sometimes outperforms the classical knockoff
method.
- Abstract(参考訳): 高次元スパース一般化線形モデル (GLMs) は、サンプルの数と変数の次元が大きく、変数の次元もサンプルの数よりも早く増加するという設定で現れる。
偽発見率 (FDR) の制御は, GLM の粗末なペナル化推定を行い, 統計的に有意な非ゼロな結果の少数を同定することを目的としている。
精度行列推定のためのCLIME法を用いて, 脱バイアスラッソ推定器を構築し, スパースGLMの極小レートオラクル不等式を用いて漸近正規性を証明する。
実際には、各回帰係数の肯定性と否定性を正確に判断することがしばしば必要であり、これは、予測変数が残りの変数に条件付きで応答変数と正あるいは負の関係があるかどうかを決定する。
偏り推定器を用いて複数の試験手順を確立する。
軽度条件下では,提案した偏り統計は,予め特定された意味レベルで,方向FDRと方向偽発見変数を漸近的に制御できることを示す。
さらに、我々の多重検定法は1の統計的パワーをほぼ達成できることを示すことができる。
また,本手法を2サンプル問題に拡張し,2サンプルテスト統計値を提案する。
適切な条件下では、2つのサンプル問題の特定重要度レベルで方向fdr制御と方向fdv制御を漸近的に達成することができる。
いくつかの数値シミュレーションにより提案手法のFDR制御効果が検証され,古典的ノックオフ法よりも優れた結果が得られた。
関連論文リスト
- REAL Sampling: Boosting Factuality and Diversity of Open-Ended Generation via Asymptotic Entropy [93.8400683020273]
大規模言語モデル(LLM)の復号法は通常、事実性の確保と多様性の維持のトレードオフに苦慮する。
核サンプリングにおける事実性および多様性を向上させる復号法であるREALサンプリングを提案する。
論文 参考訳(メタデータ) (2024-06-11T21:44:49Z) - On High dimensional Poisson models with measurement error: hypothesis
testing for nonlinear nonconvex optimization [13.369004892264146]
我々は高次元の回帰モデルの推定と検証を行い、データ解析に広く応用する。
ペナル化された一貫性を最小化することで回帰パラメータを推定する。
提案手法はアルツハイマー病イニシアチブに適用される。
論文 参考訳(メタデータ) (2022-12-31T06:58:42Z) - Near-optimal multiple testing in Bayesian linear models with
finite-sample FDR control [11.011242089340438]
高次元変数選択問題では、統計学者はしばしば偽発見率(FDR)を制御する複数の試験手順を設計しようと試みる。
モデルが誤って特定された場合でも、有限サンプルから頻繁なFDRを確実に制御するModel-Xプロシージャを導入する。
提案手法であるPoEdCeは, 後期待, 蒸留ランダム化試験 (dCRT) , およびE値を用いたBenjamini-Hochberg法である。
論文 参考訳(メタデータ) (2022-11-04T22:56:41Z) - Two-stage Hypothesis Tests for Variable Interactions with FDR Control [10.750902543185802]
本稿では,偽発見率(FDR)を制御した2段階テスト手法を提案する。
我々の2段階の手順は古典的BH法よりも効率的であり、比較または改善された統計力を持つという総合的なシミュレーション研究を通して実証する。
論文 参考訳(メタデータ) (2022-08-31T19:17:00Z) - On the Double Descent of Random Features Models Trained with SGD [78.0918823643911]
勾配降下(SGD)により最適化された高次元におけるランダム特徴(RF)回帰特性について検討する。
本研究では, RF回帰の高精度な非漸近誤差境界を, 定常および適応的なステップサイズSGD設定の下で導出する。
理論的にも経験的にも二重降下現象を観察する。
論文 参考訳(メタデータ) (2021-10-13T17:47:39Z) - Near-optimal inference in adaptive linear regression [60.08422051718195]
最小二乗法のような単純な方法でさえ、データが適応的に収集されるときの非正規な振る舞いを示すことができる。
我々は,これらの分布異常を少なくとも2乗推定で補正するオンラインデバイアス推定器のファミリーを提案する。
我々は,マルチアームバンディット,自己回帰時系列推定,探索による能動的学習などの応用を通して,我々の理論の有用性を実証する。
論文 参考訳(メタデータ) (2021-07-05T21:05:11Z) - AdaPT-GMM: Powerful and robust covariate-assisted multiple testing [0.7614628596146599]
偽発見率(FDR)制御を用いた複数検定の実証的ベイズ法を提案する。
本手法は,アダプティブp値しきい値法(AdaPT)をマスク方式の一般化により洗練する。
我々は、AdaPT-GMMと呼ばれる新しい手法が一貫して高出力を実現することを、広範囲にわたるシミュレーションと実データ例で示す。
論文 参考訳(メタデータ) (2021-06-30T05:06:18Z) - SLOE: A Faster Method for Statistical Inference in High-Dimensional
Logistic Regression [68.66245730450915]
実用データセットに対する予測の偏見を回避し、頻繁な不確実性を推定する改善された手法を開発している。
私たちの主な貢献は、推定と推論の計算時間をマグニチュードの順序で短縮する収束保証付き信号強度の推定器SLOEです。
論文 参考訳(メタデータ) (2021-03-23T17:48:56Z) - Sparse Feature Selection Makes Batch Reinforcement Learning More Sample
Efficient [62.24615324523435]
本稿では,スパース線形関数近似を用いた高次元バッチ強化学習(RL)の統計的解析を行う。
候補となる機能が多数存在する場合,提案手法がバッチRLをより効率的にサンプリングできるという事実に光を当てる。
論文 参考訳(メタデータ) (2020-11-08T16:48:02Z) - Tracking disease outbreaks from sparse data with Bayesian inference [55.82986443159948]
新型コロナウイルス(COVID-19)のパンデミックは、感染発生時の感染率を推定する新たな動機を与える。
標準的な手法は、より細かいスケールで共通する部分的な観測可能性とスパースなデータに対応するのに苦労する。
原理的に部分観測可能なベイズ的枠組みを提案する。
論文 参考訳(メタデータ) (2020-09-12T20:37:33Z) - Interpretable random forest models through forward variable selection [0.0]
損失関数としてCRPS(Continuous Rank probability score)を用いた前方変数選択法を開発した。
本手法のオランダにおける日次最大気温予測の統計的後処理への応用を実証する。
論文 参考訳(メタデータ) (2020-05-11T13:56:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。