論文の概要: Data-driven Error Estimation: Upper Bounding Multiple Errors without Class Complexity as Input
- arxiv url: http://arxiv.org/abs/2405.04636v2
- Date: Fri, 28 Feb 2025 17:10:30 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-03-03 13:39:25.953803
- Title: Data-driven Error Estimation: Upper Bounding Multiple Errors without Class Complexity as Input
- Title(参考訳): データ駆動誤差推定:入力としてのクラス複雑性のない上界多重誤差
- Authors: Sanath Kumar Krishnamurthy, Anan Lyubarskaja, Emma Brunskill, Susan Athey,
- Abstract要約: 私たちはこれを「エラー推定問題」と捉えています。
目標は、推定クラスの最大誤差の高確率上限を決定することである。
有限なクラス設定と無限なクラス設定の両方にそのような境界を導出する、完全にデータ駆動のアプローチを提案する。
- 参考スコア(独自算出の注目度): 24.549751508566565
- License:
- Abstract: Constructing confidence intervals that are simultaneously valid across a class of estimates is central for tasks such as multiple mean estimation, bounding generalization error in machine learning, and adaptive experimental design. We frame this as an "error estimation problem," where the goal is to determine a high-probability upper bound on the maximum error for a class of estimates. We propose an entirely data-driven approach that derives such bounds for both finite and infinite class settings, naturally adapting to a potentially unknown correlation structure of random errors. Notably, our method does not require class complexity as an input, overcoming a major limitation of existing approaches such as union bounding and bounds based on Talagrand's inequality. In this paper, we present our simple yet general solution and demonstrate its flexibility through applications ranging from constructing multiple simultaneously valid confidence intervals to optimizing exploration in contextual bandit algorithms.
- Abstract(参考訳): 信頼区間の構築は、複数の平均推定、機械学習における境界一般化誤差、適応的な実験設計などのタスクにおいて、同時に有効である。
我々はこれを「エラー推定問題」とみなし、推定クラスの最大誤差に対する高い確率上の上限を決定することを目標としている。
ランダムエラーの潜在的に未知の相関構造に自然に適応して、有限および無限のクラス設定の両方にそのような境界を導出する、完全にデータ駆動のアプローチを提案する。
特に、我々の手法は入力としてクラス複雑性を必要とせず、タラグランドの不等式に基づく結合境界や境界といった既存のアプローチの大きな制限を克服する。
本稿では,複数の有効信頼区間の構築から,文脈的帯域幅アルゴリズムによる探索の最適化に至るまで,その柔軟性を示す。
関連論文リスト
- In-Context Parametric Inference: Point or Distribution Estimators? [66.22308335324239]
償却点推定器は一般に後部推論より優れているが、後者は低次元問題では競争力がある。
実験の結果, 償却点推定器は一般に後部推定より優れているが, 後者は低次元問題では競争力があることがわかった。
論文 参考訳(メタデータ) (2025-02-17T10:00:24Z) - Maximum a Posteriori Inference for Factor Graphs via Benders' Decomposition [0.38233569758620056]
一般ベイズ因子モデルにおける最大a-ポストペリオーリ推定法を提案する。
ベイジアン・ガウス混合モデルと潜在ディリクレ割り当てに対するMAP推定アルゴリズムを導出する。
論文 参考訳(メタデータ) (2024-10-24T19:57:56Z) - Precise Error Rates for Computationally Efficient Testing [75.63895690909241]
本稿では,計算複雑性に着目した単純な対数-単純仮説テストの問題を再考する。
線形スペクトル統計に基づく既存の試験は、I型とII型の誤差率の間の最良のトレードオフ曲線を達成する。
論文 参考訳(メタデータ) (2023-11-01T04:41:16Z) - Error Estimation for Random Fourier Features [14.27855002079769]
本稿では, RFF近似の誤差を数値的に推定するブートストラップ手法を提案する。
誤差推定は問題に特異的であり、最悪のケース境界の悲観性を避ける。
この手法により、適応計算が可能となり、ユーザは粗い初期カーネル近似の誤差を迅速に検査できる。
論文 参考訳(メタデータ) (2023-02-22T06:54:27Z) - Minimax rate of consistency for linear models with missing values [0.0]
多くの実世界のデータセットでは、複数のソースが集約され、本質的に欠落した情報(センサーの故障、調査における未回答の疑問...)が欠落する。
本稿では,広範に研究された線形モデルに焦点をあてるが,不足する値が存在する場合には,非常に難しい課題であることが判明した。
最終的には、多くの学習タスクを解決し、入力機能の数を指数関数的にすることで、現在の現実世界のデータセットでは予測が不可能になる。
論文 参考訳(メタデータ) (2022-02-03T08:45:34Z) - Amortized Conditional Normalized Maximum Likelihood: Reliable Out of
Distribution Uncertainty Estimation [99.92568326314667]
本研究では,不確実性推定のための拡張性のある汎用的アプローチとして,償却条件正規化最大値(ACNML)法を提案する。
提案アルゴリズムは条件付き正規化最大度(CNML)符号化方式に基づいており、最小記述長の原理に従って最小値の最適特性を持つ。
我々は、ACNMLが、分布外入力のキャリブレーションの観点から、不確実性推定のための多くの手法と好意的に比較することを示した。
論文 参考訳(メタデータ) (2020-11-05T08:04:34Z) - Multi-exponential Error Extrapolation and Combining Error Mitigation
Techniques for NISQ Applications [0.0]
量子ハードウェアにおけるノイズは、量子コンピュータの実装における最大の障害である。
誤り補間は、実験的に実装された誤り軽減手法である。
我々はこれを多重指数誤差外挿に拡張し、パウリ雑音下での有効性のより厳密な証明を提供する。
論文 参考訳(メタデータ) (2020-07-02T17:18:47Z) - Good Classifiers are Abundant in the Interpolating Regime [64.72044662855612]
補間分類器間のテストエラーの完全な分布を正確に計算する手法を開発した。
テストエラーは、最悪の補間モデルのテストエラーから大きく逸脱する、小さな典型的な$varepsilon*$に集中する傾向にある。
以上の結果から,統計的学習理論における通常の解析手法は,実際に観測された優れた一般化性能を捉えるのに十分な粒度にはならない可能性が示唆された。
論文 参考訳(メタデータ) (2020-06-22T21:12:31Z) - Matrix Completion with Quantified Uncertainty through Low Rank Gaussian
Copula [30.84155327760468]
本稿では,不確かさを定量化した値計算の欠如に対する枠組みを提案する。
モデルに適合するために必要な時間は、データセット内の行数や列数と線形にスケールする。
実験結果から,本手法は様々な種類のデータに対して最先端の計算精度が得られることがわかった。
論文 参考訳(メタデータ) (2020-06-18T19:51:42Z) - Machine learning for causal inference: on the use of cross-fit
estimators [77.34726150561087]
より優れた統計特性を得るために、二重ローバストなクロスフィット推定器が提案されている。
平均因果効果(ACE)に対する複数の推定器の性能評価のためのシミュレーション研究を行った。
機械学習で使用する場合、二重確率のクロスフィット推定器は、バイアス、分散、信頼区間のカバレッジで他のすべての推定器よりも大幅に優れていた。
論文 参考訳(メタデータ) (2020-04-21T23:09:55Z) - Error Estimation for Sketched SVD via the Bootstrap [60.67199274260768]
本稿では,スケッチ化された特異ベクトル/値の実際の誤差を数値的に推定する完全データ駆動型ブートストラップ法を開発した。
この方法は、スケッチされたオブジェクトのみで動作するため、計算コストが安い。
論文 参考訳(メタデータ) (2020-03-10T19:14:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。