論文の概要: Robust High-dimensional Tuning Free Multiple Testing
- arxiv url: http://arxiv.org/abs/2211.11959v1
- Date: Tue, 22 Nov 2022 02:35:28 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-23 17:26:11.812114
- Title: Robust High-dimensional Tuning Free Multiple Testing
- Title(参考訳): ロバストな高次元チューニングフリー多重テスト
- Authors: Jianqing Fan, Zhipeng Lou, Mengxin Yu
- Abstract要約: 本稿では,一サンプル問題と二サンプル問題の両方における位置パラメータを推定するために,Hodges-Lehmann (HL) 推定器を再検討する。
新たに開発された非漸近的バハドゥール表現に基づいて,Berry-Esseen不等式とCram'er型のHL推定器の適度偏差を開発する。
得られたチューニングフリーおよびモーメントフリーの手法が、所定のレベルで偽発見率を制御することを説得的に示している。
- 参考スコア(独自算出の注目度): 0.49416305961918056
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: A stylized feature of high-dimensional data is that many variables have heavy
tails, and robust statistical inference is critical for valid large-scale
statistical inference. Yet, the existing developments such as Winsorization,
Huberization and median of means require the bounded second moments and involve
variable-dependent tuning parameters, which hamper their fidelity in
applications to large-scale problems. To liberate these constraints, this paper
revisits the celebrated Hodges-Lehmann (HL) estimator for estimating location
parameters in both the one- and two-sample problems, from a non-asymptotic
perspective. Our study develops Berry-Esseen inequality and Cram\'{e}r type
moderate deviation for the HL estimator based on newly developed non-asymptotic
Bahadur representation, and builds data-driven confidence intervals via a
weighted bootstrap approach. These results allow us to extend the HL estimator
to large-scale studies and propose \emph{tuning-free} and \emph{moment-free}
high-dimensional inference procedures for testing global null and for
large-scale multiple testing with false discovery proportion control. It is
convincingly shown that the resulting tuning-free and moment-free methods
control false discovery proportion at a prescribed level. The simulation
studies lend further support to our developed theory.
- Abstract(参考訳): 高次元データのスタイリングの特徴は、多くの変数が重い尾を持ち、ロバストな統計的推論が大規模な統計的推論の有効性にとって重要であることである。
しかし、Winsorization、Huberization、Central of meansといった既存の開発では、境界付けられた第2モーメントが必要であり、変数依存のチューニングパラメータが伴うため、大規模な問題への応用が困難になる。
これらの制約を解放するために,本論文では,非漸近的な視点から,一点と二点の両問題における位置パラメータを推定するための有名なHodges-Lehmann (HL) 推定器を再検討する。
本研究では,新たに開発した非漸近的バハドゥル表現に基づくhl推定器に対するberry-esseen不等式と cram\'{e}r型不等式を開発し,重み付きブートストラップアプローチによるデータ駆動信頼区間を構築する。
これらの結果から、HL推定器を大規模研究に拡張し、グローバルヌルのテストや偽発見比例制御による大規模多重検定のための \emph{tuning-free} と \emph{moment-free} の高次元推論手順を提案する。
結果として得られるチューニングフリーおよびモーメントフリーの方法は、所定のレベルで偽発見比率を制御することが説得力強く示される。
シミュレーション研究は、我々の進歩した理論をさらに支持する。
関連論文リスト
- Estimation and Inference for Causal Functions with Multiway Clustered Data [6.988496457312806]
本稿では,一般的な因果関数のクラスに対する推定法と一様推論法を提案する。
因果関数は、調整された(Neyman-orthogonal)信号の条件付き期待値として同定される。
提案手法をアフリカにおける水準と歴史的奴隷貿易の因果関係の分析に適用する。
論文 参考訳(メタデータ) (2024-09-10T17:17:53Z) - A sparse PAC-Bayesian approach for high-dimensional quantile prediction [0.0]
本稿では,高次元量子化予測のための確率論的機械学習手法を提案する。
擬似ベイズ的フレームワークとスケールした学生tとランゲヴィン・モンテカルロを併用して効率的な計算を行う。
その効果はシミュレーションや実世界のデータを通じて検証され、そこでは確立された頻繁な手法やベイズ的手法と競合する。
論文 参考訳(メタデータ) (2024-09-03T08:01:01Z) - Risk and cross validation in ridge regression with correlated samples [72.59731158970894]
我々は,データポイントが任意の相関関係を持つ場合,リッジ回帰のイン・オブ・サンプルリスクのトレーニング例を提供する。
さらに、テストポイントがトレーニングセットと非自明な相関を持ち、時系列予測で頻繁に発生するような場合まで分析を拡張します。
我々は多種多様な高次元データにまたがって理論を検証する。
論文 参考訳(メタデータ) (2024-08-08T17:27:29Z) - Multivariate root-n-consistent smoothing parameter free matching estimators and estimators of inverse density weighted expectations [51.000851088730684]
我々は、パラメトリックな$sqrt n $-rateで収束する、最も近い隣人の新しい修正とマッチング推定器を開発する。
我々は,非パラメトリック関数推定器は含まないこと,特に標本サイズ依存パラメータの平滑化には依存していないことを強調する。
論文 参考訳(メタデータ) (2024-07-11T13:28:34Z) - Online Bootstrap Inference with Nonconvex Stochastic Gradient Descent
Estimator [0.0]
本稿では,凸問題の文脈における統計的推論のための勾配降下(SGD)の理論的性質について検討する。
多重誤差最小値を含む2つの干渉手順を提案する。
論文 参考訳(メタデータ) (2023-06-03T22:08:10Z) - Convergence of uncertainty estimates in Ensemble and Bayesian sparse
model discovery [4.446017969073817]
ブートストラップに基づく逐次しきい値最小二乗推定器による雑音に対する精度と頑健性の観点から経験的成功を示す。
このブートストラップに基づくアンサンブル手法は,誤差率の指数収束率で,確率的に正しい可変選択を行うことができることを示す。
論文 参考訳(メタデータ) (2023-01-30T04:07:59Z) - Heavy-tailed Streaming Statistical Estimation [58.70341336199497]
ストリーミング$p$のサンプルから重み付き統計推定の課題を考察する。
そこで我々は,傾きの雑音に対して,よりニュアンスな条件下での傾きの傾きの低下を設計し,より詳細な解析を行う。
論文 参考訳(メタデータ) (2021-08-25T21:30:27Z) - Divergence Frontiers for Generative Models: Sample Complexity,
Quantization Level, and Frontier Integral [58.434753643798224]
多様性フロンティアは生成モデルの評価フレームワークとして提案されている。
分岐フロンティアのプラグイン推定器のサンプル複雑性の非漸近的境界を確立する。
また,スムーズな分布推定器の統計的性能を調べることにより,分散フロンティアの枠組みも強化する。
論文 参考訳(メタデータ) (2021-06-15T06:26:25Z) - Leveraging Global Parameters for Flow-based Neural Posterior Estimation [90.21090932619695]
実験観測に基づくモデルのパラメータを推定することは、科学的方法の中心である。
特に困難な設定は、モデルが強く不確定であるとき、すなわち、パラメータの異なるセットが同一の観測をもたらすときである。
本稿では,グローバルパラメータを共有する観測の補助的セットによって伝達される付加情報を利用して,その不確定性を破る手法を提案する。
論文 参考訳(メタデータ) (2021-02-12T12:23:13Z) - Support estimation in high-dimensional heteroscedastic mean regression [2.28438857884398]
ランダムな設計と、潜在的にヘテロセダスティックで重み付きエラーを伴う線形平均回帰モデルを考える。
我々は,問題のパラメータに依存するチューニングパラメータを備えた,厳密な凸・滑らかなHuber損失関数の変種を用いる。
得られた推定器に対して、$ell_infty$ノルムにおける符号一貫性と最適収束率を示す。
論文 参考訳(メタデータ) (2020-11-03T09:46:31Z) - Machine learning for causal inference: on the use of cross-fit
estimators [77.34726150561087]
より優れた統計特性を得るために、二重ローバストなクロスフィット推定器が提案されている。
平均因果効果(ACE)に対する複数の推定器の性能評価のためのシミュレーション研究を行った。
機械学習で使用する場合、二重確率のクロスフィット推定器は、バイアス、分散、信頼区間のカバレッジで他のすべての推定器よりも大幅に優れていた。
論文 参考訳(メタデータ) (2020-04-21T23:09:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。