論文の概要: Data augmented bootstrap: Unifying confidence interval construction by approximate invariance
- arxiv url: http://arxiv.org/abs/2606.09049v1
- Date: Mon, 08 Jun 2026 05:39:02 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-09 14:42:06.715884
- Title: Data augmented bootstrap: Unifying confidence interval construction by approximate invariance
- Title(参考訳): データ強化ブートストラップ:近似不変性による信頼区間構築の統一
- Authors: Kevin Han Huang,
- Abstract要約: ほぼ不変なデータ変換から信頼区間を構築するためのフレームワークであるデータ拡張ブートストラップ(DAB)を提案する。
特にDABは、最大平均離散 U-統計量に対する共形予測や自然普遍性など、正確な群対称性に依存する一般的な手法を復元する。
画像,言語,科学データだけでなく,ブートストラップ,ワイルドブートストラップ,共形予測にDAを組み込むことの性能を実証的に検証した。
- 参考スコア(独自算出の注目度): 1.9358078031092691
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We propose the data augmented bootstrap (DAB), a framework for constructing confidence intervals from approximately invariant transformations of the data. As special cases, DAB recovers popular methods that rely on exact group symmetries, such as conformal prediction, wild bootstrap for Maximum Mean Discrepancy U-statistics and the recently proposed SymmPI. Meanwhile, DAB also recovers the classical bootstrap method, which exploits the dataset's approximate invariance under uniform sampling of data indices as the dataset size grows. For all DAB methods, we establish theoretical coverage results that interpolate between finite-sample and asymptotic guarantees according to the strength of the invariance, and without assuming a group structure. The approximate invariance is measured in the Kolmogorov distance and, for statistics that satisfy Gaussian universality, reduces to conditional mean and variance matching. This allows us to incorporate data augmentation (DA), a widely used machine learning heuristic based on approximate invariances, into known statistical methods. We empirically test the performance of incorporating DA into bootstrap, wild bootstrap and conformal prediction for simulated settings as well as for image, language and scientific data.
- Abstract(参考訳): ほぼ不変なデータ変換から信頼区間を構築するためのフレームワークであるデータ拡張ブートストラップ(DAB)を提案する。
特別の場合として、DABは、共形予測、最大平均離散U統計のためのワイルドブートストラップ、最近提案されたSymbPIといった、正確なグループ対称性に依存する一般的な手法を復元する。
一方、DABは、データセットのサイズが大きくなるにつれて、データインデックスの均一なサンプリングの下でデータセットの近似的不変性を利用する古典的なブートストラップ法を復元する。
すべてのDAB法に対して、群構造を仮定することなく、不変性の強さに応じて有限サンプルと漸近保証を補間する理論的カバレッジ結果を確立する。
近似不変性はコルモゴロフ距離で測定され、ガウスの普遍性を満たす統計量に対して条件平均と分散マッチングに還元される。
これにより、近似不変量に基づく機械学習ヒューリスティックであるデータ拡張(DA)を、既知の統計的手法に組み込むことができる。
画像,言語,科学データだけでなく,ブートストラップ,ワイルドブートストラップ,共形予測にDAを組み込むことの性能を実証的に検証した。
関連論文リスト
- Self-Supervised Laplace Approximation for Bayesian Uncertainty Quantification [45.61685127984694]
我々は,ベイズモデルの予測不確実性を,自己予測データに基づいて定量化する。
Self-Supervised Laplace Approximation (SSLA)のモジュール構造は、さまざまな事前仕様をプラグインすることができます。
高価なリフィットを回避すべく、ASSLAと呼ばれるSSLAの近似バージョンをさらに導入する。
論文 参考訳(メタデータ) (2026-05-12T14:46:08Z) - Variance-Gated Ensembles: An Epistemic-Aware Framework for Uncertainty Estimation [0.6340400318304492]
VGE(Variance-Gated Ensembles)は、アンサンブル統計から計算した信号-雑音ゲートを介して、てんかん感受性を注入する直感的なフレームワークである。
我々は、アンサンブルサンプル平均と分散によるエンドツーエンドのトレーニングを可能にする閉形式ベクトル-ヤコビアン積を導出した。
論文 参考訳(メタデータ) (2026-02-08T22:05:23Z) - MIST: Mutual Information Via Supervised Training [41.02529625643583]
我々は、相互情報(MI)推定器を設計するための完全なデータ駆動アプローチを提案する。
任意のMI推定器は、2つの確率変数から観測されたサンプルの関数であるため、ニューラルネットワーク(MIST)を用いてこの関数をパラメータ化する。
625,000の合成関節分布の大規模なメタデータセット上で、既知の接地トラスMIを用いてトレーニングを行う。
論文 参考訳(メタデータ) (2025-11-24T09:55:28Z) - Robust and Scalable Variational Bayes [2.014089835498735]
本稿では,大規模なデータセットにおいて,外れ値や任意の性質の汚染を効果的に処理する変動ベイズ(VB)のための頑健なフレームワークを提案する。
提案手法では,データセットを解離部分集合に分割し,各部分集合の後方を計算し,これらの部分集合に独立してVB近似を適用する。
この新しいアグリゲーション法は、変分媒介後(VM-Posterior)分布を生成する。
論文 参考訳(メタデータ) (2025-04-16T23:20:43Z) - Geometry-Aware Instrumental Variable Regression [56.16884466478886]
本稿では,データ導出情報によるデータ多様体の幾何を考慮した移動型IV推定器を提案する。
本手法のプラグイン・アンド・プレイ実装は,標準設定で関連する推定器と同等に動作する。
論文 参考訳(メタデータ) (2024-05-19T17:49:33Z) - Collaborative Heterogeneous Causal Inference Beyond Meta-analysis [68.4474531911361]
異種データを用いた因果推論のための協調的逆確率スコア推定器を提案する。
異質性の増加に伴うメタアナリシスに基づく手法に対して,本手法は有意な改善を示した。
論文 参考訳(メタデータ) (2024-04-24T09:04:36Z) - Statistical Inference with Stochastic Gradient Methods under
$\phi$-mixing Data [9.77185962310918]
データが$phi$-mixingの場合の統計的推測のためのミニバッチSGD推定器を提案する。
信頼区間は、関連するミニバッチSGDプロシージャを用いて構成される。
提案手法はメモリ効率が高く,実装が容易である。
論文 参考訳(メタデータ) (2023-02-24T16:16:43Z) - Equivariance Discovery by Learned Parameter-Sharing [153.41877129746223]
データから解釈可能な等価性を発見する方法について検討する。
具体的には、モデルのパラメータ共有方式に対する最適化問題として、この発見プロセスを定式化する。
また,ガウスデータの手法を理論的に解析し,研究された発見スキームとオラクルスキームの間の平均2乗ギャップを限定する。
論文 参考訳(メタデータ) (2022-04-07T17:59:19Z) - Distributional Reinforcement Learning via Moment Matching [54.16108052278444]
ニューラルネットワークを用いて各戻り分布から統計量の有限集合を学習する手法を定式化する。
我々の手法は、戻り分布とベルマン目標の間のモーメントの全ての順序を暗黙的に一致させるものとして解釈できる。
Atariゲームスイートの実験により,本手法は標準分布RLベースラインよりも優れていることが示された。
論文 参考訳(メタデータ) (2020-07-24T05:18:17Z) - Domain Adaptive Bootstrap Aggregating [5.444459446244819]
ブートストラップ集約(英: bootstrap aggregating)は、予測アルゴリズムの安定性を改善する一般的な方法である。
本稿では, ドメイン適応型バッグング手法と, 隣り合う新しい反復型サンプリング手法を提案する。
論文 参考訳(メタデータ) (2020-01-12T20:02:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。