論文の概要: CLT and Edgeworth Expansion for m-out-of-n Bootstrap Estimators of The Studentized Median
- arxiv url: http://arxiv.org/abs/2505.11725v1
- Date: Fri, 16 May 2025 22:14:49 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-20 14:57:10.80721
- Title: CLT and Edgeworth Expansion for m-out-of-n Bootstrap Estimators of The Studentized Median
- Title(参考訳): 学生メディアにおけるm-of-nブートストラップ推定器のCLTとエッジワース拡張
- Authors: Imon Banerjee, Sayak Chakrabarty,
- Abstract要約: m-out-of-nブートストラップはmサブサンプルをnサイズの元のサンプルから置き換えることなく繰り返し描画することで統計量の分布を近似する。
エコノメトリ、バイオ統計学、機械学習にまたがる幅広い適用性にもかかわらず、ブートストラップの音質に対する厳密なパラメータなし保証はいまだに解明されていない。
本稿では,n 個のデータセットの m-of-n 再サンプリングから得られたサンプル定量値の推定器を解析することにより,そのような保証を確立する。
- 参考スコア(独自算出の注目度): 4.174296652683762
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The m-out-of-n bootstrap, originally proposed by Bickel, Gotze, and Zwet (1992), approximates the distribution of a statistic by repeatedly drawing m subsamples (with m much smaller than n) without replacement from an original sample of size n. It is now routinely used for robust inference with heavy-tailed data, bandwidth selection, and other large-sample applications. Despite its broad applicability across econometrics, biostatistics, and machine learning, rigorous parameter-free guarantees for the soundness of the m-out-of-n bootstrap when estimating sample quantiles have remained elusive. This paper establishes such guarantees by analyzing the estimator of sample quantiles obtained from m-out-of-n resampling of a dataset of size n. We first prove a central limit theorem for a fully data-driven version of the estimator that holds under a mild moment condition and involves no unknown nuisance parameters. We then show that the moment assumption is essentially tight by constructing a counter-example in which the CLT fails. Strengthening the assumptions slightly, we derive an Edgeworth expansion that provides exact convergence rates and, as a corollary, a Berry Esseen bound on the bootstrap approximation error. Finally, we illustrate the scope of our results by deriving parameter-free asymptotic distributions for practical statistics, including the quantiles for random walk Metropolis-Hastings and the rewards of ergodic Markov decision processes, thereby demonstrating the usefulness of our theory in modern estimation and learning tasks.
- Abstract(参考訳): もともとBickel, Gotze, Zwet (1992) によって提唱された m-out-of-n ブートストラップは、n の元の標本から置き換えることなく m の部分サンプル (m は n よりずっと小さい) を繰り返すことによって統計量の分布を近似している。
現在は、重み付きデータや帯域幅の選択、その他大規模なアプリケーションによる堅牢な推論に日常的に使用されている。
エコノメトリ、バイオ統計学、機械学習にまたがる幅広い適用性にもかかわらず、サンプルの定量値の推定時にm-of-nブートストラップの音質が厳密なパラメータフリーで保証されている。
本稿では,n 個のデータセットの m-of-n 再サンプリングから得られたサンプル定量値の推定器を解析することにより,そのような保証を確立する。
まず、軽度モーメント条件下で、未知のニュアンスパラメータを含まない推定器の完全データ駆動版に対する中心極限定理を証明した。
次に、CLTが失敗する反例を構築することにより、モーメント仮定が本質的に厳密であることを示す。
仮定をわずかに強化すると、正確な収束率を提供するエッジワース展開が導き出され、結果として、ブートストラップ近似誤差にバウンドされたベリー・エッセインが導かれる。
最後に, パラメータフリーな漸近分布を, ランダムウォーキングの量子化やエルゴード的マルコフ決定過程の報奨など, 実践統計学におけるパラメータフリーな漸近分布を導出し, 現代の推定・学習タスクにおける我々の理論の有用性を示す。
関連論文リスト
- Unveiling the Statistical Foundations of Chain-of-Thought Prompting Methods [59.779795063072655]
CoT(Chain-of-Thought)の促進とその変種は、多段階推論問題を解決する効果的な方法として人気を集めている。
統計的推定の観点からCoTのプロンプトを解析し,その複雑さを包括的に評価する。
論文 参考訳(メタデータ) (2024-08-25T04:07:18Z) - Quasi-Bayes meets Vines [2.3124143670964448]
我々は、スクラーの定理を用いて、準ベイズ予想を高次元に拡張する別の方法を提案する。
提案した準ベイジアンVine (QB-Vine) は完全に非パラメトリックな密度推定器であることを示す。
論文 参考訳(メタデータ) (2024-06-18T16:31:02Z) - Relaxed Quantile Regression: Prediction Intervals for Asymmetric Noise [51.87307904567702]
量子レグレッション(Quantile regression)は、出力の分布における量子の実験的推定を通じてそのような間隔を得るための主要なアプローチである。
本稿では、この任意の制約を除去する量子回帰に基づく区間構成の直接的な代替として、Relaxed Quantile Regression (RQR)を提案する。
これにより、柔軟性が向上し、望ましい品質が向上することが実証された。
論文 参考訳(メタデータ) (2024-06-05T13:36:38Z) - Robust High-dimensional Tuning Free Multiple Testing [0.49416305961918056]
本稿では,一サンプル問題と二サンプル問題の両方における位置パラメータを推定するために,Hodges-Lehmann (HL) 推定器を再検討する。
新たに開発された非漸近的バハドゥール表現に基づいて,Berry-Esseen不等式とCram'er型のHL推定器の適度偏差を開発する。
得られたチューニングフリーおよびモーメントフリーの手法が、所定のレベルで偽発見率を制御することを説得的に示している。
論文 参考訳(メタデータ) (2022-11-22T02:35:28Z) - Random Forest Weighted Local Fréchet Regression with Random Objects [18.128663071848923]
本稿では,新しいランダム森林重み付き局所Fr'echet回帰パラダイムを提案する。
最初の方法は、これらの重みを局所平均として、条件付きFr'echet平均を解くことである。
第二の手法は局所線形Fr'echet回帰を行い、どちらも既存のFr'echet回帰法を大幅に改善した。
論文 参考訳(メタデータ) (2022-02-10T09:10:59Z) - Keep it Tighter -- A Story on Analytical Mean Embeddings [0.6445605125467574]
カーネル技術は、データサイエンスにおいて最も人気があり柔軟なアプローチの一つである。
平均埋め込みは、最大平均不一致(MMD)と呼ばれる分岐測度をもたらす。
本稿では,基礎となる分布の1つの平均埋め込みが解析的に利用可能である場合のMDD推定の問題に焦点をあてる。
論文 参考訳(メタデータ) (2021-10-15T21:29:27Z) - Optimal policy evaluation using kernel-based temporal difference methods [78.83926562536791]
カーネルヒルベルト空間を用いて、無限水平割引マルコフ報酬過程の値関数を推定する。
我々は、関連するカーネル演算子の固有値に明示的に依存した誤差の非漸近上界を導出する。
MRP のサブクラスに対する minimax の下位境界を証明する。
論文 参考訳(メタデータ) (2021-09-24T14:48:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。