論文の概要: Robust High-dimensional Tuning Free Multiple Testing
- arxiv url: http://arxiv.org/abs/2211.11959v1
- Date: Tue, 22 Nov 2022 02:35:28 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-23 17:26:11.812114
- Title: Robust High-dimensional Tuning Free Multiple Testing
- Title(参考訳): ロバストな高次元チューニングフリー多重テスト
- Authors: Jianqing Fan, Zhipeng Lou, Mengxin Yu
- Abstract要約: 本稿では,一サンプル問題と二サンプル問題の両方における位置パラメータを推定するために,Hodges-Lehmann (HL) 推定器を再検討する。
新たに開発された非漸近的バハドゥール表現に基づいて,Berry-Esseen不等式とCram'er型のHL推定器の適度偏差を開発する。
得られたチューニングフリーおよびモーメントフリーの手法が、所定のレベルで偽発見率を制御することを説得的に示している。
- 参考スコア(独自算出の注目度): 0.49416305961918056
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: A stylized feature of high-dimensional data is that many variables have heavy
tails, and robust statistical inference is critical for valid large-scale
statistical inference. Yet, the existing developments such as Winsorization,
Huberization and median of means require the bounded second moments and involve
variable-dependent tuning parameters, which hamper their fidelity in
applications to large-scale problems. To liberate these constraints, this paper
revisits the celebrated Hodges-Lehmann (HL) estimator for estimating location
parameters in both the one- and two-sample problems, from a non-asymptotic
perspective. Our study develops Berry-Esseen inequality and Cram\'{e}r type
moderate deviation for the HL estimator based on newly developed non-asymptotic
Bahadur representation, and builds data-driven confidence intervals via a
weighted bootstrap approach. These results allow us to extend the HL estimator
to large-scale studies and propose \emph{tuning-free} and \emph{moment-free}
high-dimensional inference procedures for testing global null and for
large-scale multiple testing with false discovery proportion control. It is
convincingly shown that the resulting tuning-free and moment-free methods
control false discovery proportion at a prescribed level. The simulation
studies lend further support to our developed theory.
- Abstract(参考訳): 高次元データのスタイリングの特徴は、多くの変数が重い尾を持ち、ロバストな統計的推論が大規模な統計的推論の有効性にとって重要であることである。
しかし、Winsorization、Huberization、Central of meansといった既存の開発では、境界付けられた第2モーメントが必要であり、変数依存のチューニングパラメータが伴うため、大規模な問題への応用が困難になる。
これらの制約を解放するために,本論文では,非漸近的な視点から,一点と二点の両問題における位置パラメータを推定するための有名なHodges-Lehmann (HL) 推定器を再検討する。
本研究では,新たに開発した非漸近的バハドゥル表現に基づくhl推定器に対するberry-esseen不等式と cram\'{e}r型不等式を開発し,重み付きブートストラップアプローチによるデータ駆動信頼区間を構築する。
これらの結果から、HL推定器を大規模研究に拡張し、グローバルヌルのテストや偽発見比例制御による大規模多重検定のための \emph{tuning-free} と \emph{moment-free} の高次元推論手順を提案する。
結果として得られるチューニングフリーおよびモーメントフリーの方法は、所定のレベルで偽発見比率を制御することが説得力強く示される。
シミュレーション研究は、我々の進歩した理論をさらに支持する。
関連論文リスト
- Quantifying predictive uncertainty of aphasia severity in stroke
patients with sparse heteroscedastic Bayesian high-dimensional regression [49.504432873468254]
高次元データに対する疎線型回帰法は、通常、残留物が一定の分散を持つと仮定するが、これは実際には破ることができる。
本稿では,ヘテロセダスティック分割経験的ベイズ期待条件最大化アルゴリズムを用いて,高次元ヘテロセダスティック線形回帰モデルを推定する。
論文 参考訳(メタデータ) (2023-09-15T22:06:29Z) - Online Bootstrap Inference with Nonconvex Stochastic Gradient Descent
Estimator [0.0]
本稿では,凸問題の文脈における統計的推論のための勾配降下(SGD)の理論的性質について検討する。
多重誤差最小値を含む2つの干渉手順を提案する。
論文 参考訳(メタデータ) (2023-06-03T22:08:10Z) - Convergence of uncertainty estimates in Ensemble and Bayesian sparse
model discovery [4.446017969073817]
ブートストラップに基づく逐次しきい値最小二乗推定器による雑音に対する精度と頑健性の観点から経験的成功を示す。
このブートストラップに基づくアンサンブル手法は,誤差率の指数収束率で,確率的に正しい可変選択を行うことができることを示す。
論文 参考訳(メタデータ) (2023-01-30T04:07:59Z) - On High dimensional Poisson models with measurement error: hypothesis
testing for nonlinear nonconvex optimization [13.369004892264146]
我々は高次元の回帰モデルの推定と検証を行い、データ解析に広く応用する。
ペナル化された一貫性を最小化することで回帰パラメータを推定する。
提案手法はアルツハイマー病イニシアチブに適用される。
論文 参考訳(メタデータ) (2022-12-31T06:58:42Z) - High-dimensional Measurement Error Models for Lipschitz Loss [2.6415509201394283]
リプシッツ損失関数のクラスに対する高次元計測誤差モデルを開発する。
我々の推定器は、適切な実現可能な集合に属するすべての推定器の中で、$L_1$ノルムを最小化するように設計されている。
有限標本統計誤差境界と符号の整合性の観点から理論的な保証を導出する。
論文 参考訳(メタデータ) (2022-10-26T20:06:05Z) - Heavy-tailed Streaming Statistical Estimation [58.70341336199497]
ストリーミング$p$のサンプルから重み付き統計推定の課題を考察する。
そこで我々は,傾きの雑音に対して,よりニュアンスな条件下での傾きの傾きの低下を設計し,より詳細な解析を行う。
論文 参考訳(メタデータ) (2021-08-25T21:30:27Z) - Divergence Frontiers for Generative Models: Sample Complexity,
Quantization Level, and Frontier Integral [58.434753643798224]
多様性フロンティアは生成モデルの評価フレームワークとして提案されている。
分岐フロンティアのプラグイン推定器のサンプル複雑性の非漸近的境界を確立する。
また,スムーズな分布推定器の統計的性能を調べることにより,分散フロンティアの枠組みも強化する。
論文 参考訳(メタデータ) (2021-06-15T06:26:25Z) - SLOE: A Faster Method for Statistical Inference in High-Dimensional
Logistic Regression [68.66245730450915]
実用データセットに対する予測の偏見を回避し、頻繁な不確実性を推定する改善された手法を開発している。
私たちの主な貢献は、推定と推論の計算時間をマグニチュードの順序で短縮する収束保証付き信号強度の推定器SLOEです。
論文 参考訳(メタデータ) (2021-03-23T17:48:56Z) - Leveraging Global Parameters for Flow-based Neural Posterior Estimation [90.21090932619695]
実験観測に基づくモデルのパラメータを推定することは、科学的方法の中心である。
特に困難な設定は、モデルが強く不確定であるとき、すなわち、パラメータの異なるセットが同一の観測をもたらすときである。
本稿では,グローバルパラメータを共有する観測の補助的セットによって伝達される付加情報を利用して,その不確定性を破る手法を提案する。
論文 参考訳(メタデータ) (2021-02-12T12:23:13Z) - Support estimation in high-dimensional heteroscedastic mean regression [2.28438857884398]
ランダムな設計と、潜在的にヘテロセダスティックで重み付きエラーを伴う線形平均回帰モデルを考える。
我々は,問題のパラメータに依存するチューニングパラメータを備えた,厳密な凸・滑らかなHuber損失関数の変種を用いる。
得られた推定器に対して、$ell_infty$ノルムにおける符号一貫性と最適収束率を示す。
論文 参考訳(メタデータ) (2020-11-03T09:46:31Z) - Machine learning for causal inference: on the use of cross-fit
estimators [77.34726150561087]
より優れた統計特性を得るために、二重ローバストなクロスフィット推定器が提案されている。
平均因果効果(ACE)に対する複数の推定器の性能評価のためのシミュレーション研究を行った。
機械学習で使用する場合、二重確率のクロスフィット推定器は、バイアス、分散、信頼区間のカバレッジで他のすべての推定器よりも大幅に優れていた。
論文 参考訳(メタデータ) (2020-04-21T23:09:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。