論文の概要: Likelihood-Free Frequentist Inference: Confidence Sets with Correct
Conditional Coverage
- arxiv url: http://arxiv.org/abs/2107.03920v6
- Date: Thu, 6 Apr 2023 23:34:42 GMT
- ステータス: 処理完了
- システム内更新日: 2023-04-10 15:50:43.268183
- Title: Likelihood-Free Frequentist Inference: Confidence Sets with Correct
Conditional Coverage
- Title(参考訳): Likelihood-free Frequentist推論: 正しい条件付きカバー付き信頼セット
- Authors: Niccol\`o Dalmasso, Luca Masserano, David Zhao, Rafael Izbicki, Ann B.
Lee
- Abstract要約: 本論文は,古典統計学を現代機械学習と統合して提示する(ネマンの信頼集合構築のための実用的手続きと有限サンプルの公称カバレッジの保証)。
我々は、我々のフレームワークを、可能性のない頻繁な推論(LF2I)と呼ぶ。
本稿では,LF2Iの信頼性セットにおける誤りの原因を概説し,LF2Iのメリットと課題について論じる。
- 参考スコア(独自算出の注目度): 4.491083687014879
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Many areas of science make extensive use of computer simulators that
implicitly encode likelihood functions of complex systems. Classical
statistical methods are poorly suited for these so-called likelihood-free
inference (LFI) settings, particularly outside asymptotic and low-dimensional
regimes. Although new machine learning methods, such as normalizing flows, have
revolutionized the sample efficiency and capacity of LFI methods, it remains an
open question whether they produce confidence sets with correct conditional
coverage for small sample sizes. This paper unifies classical statistics with
modern machine learning to present (i) a practical procedure for the Neyman
construction of confidence sets with finite-sample guarantees of nominal
coverage, and (ii) diagnostics that estimate conditional coverage over the
entire parameter space. We refer to our framework as likelihood-free
frequentist inference (LF2I). Any method that defines a test statistic, like
the likelihood ratio, can leverage the LF2I machinery to create valid
confidence sets and diagnostics without costly Monte Carlo samples at fixed
parameter settings. We study the power of two test statistics (ACORE and BFF),
which, respectively, maximize versus integrate an odds function over the
parameter space. Our paper discusses the benefits and challenges of LF2I, with
a breakdown of the sources of errors in LF2I confidence sets.
- Abstract(参考訳): 多くの科学分野において、複雑なシステムの可能性関数を暗黙的に符号化するコンピュータシミュレータが広く使われている。
古典的な統計手法は、いわゆる「可能性のない推論」(LFI)の設定、特に漸近的および低次元のレギュレーションの外部にはあまり適していない。
フローの正規化のような新しい機械学習手法は、LFI法のサンプル効率とキャパシティに革命をもたらしたが、小さなサンプルサイズに対して適切な条件付き信頼セットを生成するかどうかには疑問が残る。
本稿では,古典統計学を現代機械学習と統合して提示する。
(i)名目範囲の有限サンプル保証付き信頼集合のニーマン構成の実際的手順
(ii)パラメータ空間全体の条件付きカバレッジを推定する診断。
我々はこの枠組みを「確率自由頻発的推論(lf2i)」と呼んでいる。
確率比のようなテスト統計を定義するあらゆる方法は、LF2I機械を利用して、固定パラメータ設定でモンテカルロの高価なサンプルを使わずに有効な信頼セットと診断を作成することができる。
パラメータ空間上のオッズ関数の最大化と積分を行う2つのテスト統計(acoreとbff)のパワーについて検討した。
本稿では,LF2Iの信頼性セットにおける誤りの原因を概説し,LF2Iのメリットと課題について論じる。
関連論文リスト
- Distribution-Free Calibration of Statistical Confidence Sets [2.283561089098417]
本研究では,TRUSTとTRUST++という2つの新しい手法を導入する。
我々は,本手法が既存のアプローチ,特に小サンプル方式よりも優れていることを実証した。
論文 参考訳(メタデータ) (2024-11-28T20:45:59Z) - Statistical Inference for Temporal Difference Learning with Linear Function Approximation [62.69448336714418]
The consistency properties of TD learning with Polyak-Ruppert averaging and linear function approximation。
まず、分散に明示的に依存し、弱い条件下で保持する新しい高次元確率収束保証を導出する。
さらに、文献よりも高速な速度を保証する凸集合のクラスに対して、洗練された高次元ベリー-エッセイン境界を確立する。
論文 参考訳(メタデータ) (2024-10-21T15:34:44Z) - Cycles of Thought: Measuring LLM Confidence through Stable Explanations [53.15438489398938]
大規模言語モデル(LLM)は、様々なベンチマークで人間レベルの精度に到達し、さらに超えることができるが、不正確な応答における過度な自信は、依然として十分に文書化された障害モードである。
本稿では,LLMの不確実性を測定するためのフレームワークを提案する。
論文 参考訳(メタデータ) (2024-06-05T16:35:30Z) - Online non-parametric likelihood-ratio estimation by Pearson-divergence
functional minimization [55.98760097296213]
iid 観測のペア $(x_t sim p, x'_t sim q)$ が時間の経過とともに観測されるような,オンラインな非パラメトリック LRE (OLRE) のための新しいフレームワークを提案する。
本稿では,OLRE法の性能に関する理論的保証と,合成実験における実証的検証について述べる。
論文 参考訳(メタデータ) (2023-11-03T13:20:11Z) - Fast Entropy-Based Methods of Word-Level Confidence Estimation for
End-To-End Automatic Speech Recognition [86.21889574126878]
本研究では,フレーム単位のエントロピー値を正規化して集約し,単位単位当たりの信頼度と単語毎の信頼度を求める方法を示す。
提案手法をLibriSpeechテストセット上で評価した結果,最大フレーム当たりの信頼度推定値の最大値から,信頼度推定値の最大値の最大値の最大値の最大値の最大値の2倍,4倍の精度を示した。
論文 参考訳(メタデータ) (2022-12-16T20:27:40Z) - Data-Driven Reachability analysis and Support set Estimation with
Christoffel Functions [8.183446952097528]
動的システムの前方到達可能な集合を推定するためのアルゴリズムを提案する。
生成された推定は、経験的逆クリストッフェル函数と呼ばれる関数の部分レベル集合である。
到達可能性解析に加えて、確率変数の支持を推定する一般的な問題にも同様のアプローチを適用することができる。
論文 参考訳(メタデータ) (2021-12-18T20:25:34Z) - Locally Valid and Discriminative Confidence Intervals for Deep Learning
Models [37.57296694423751]
不確実性情報は有効(保証対象)で差別的(予想されるリスクが高い場合にさらに不確実)でなければならない
既存のベイジアン法の多くは、頻繁なカバレッジ保証がなく、通常モデルのパフォーマンスに影響を与える。
ほぼどんな深層学習モデルに対しても,識別的信頼区間(CI)を構築するための簡易かつ効率的かつ軽量な手法であるLVD(Locally Valid and Discriminative confidence intervals)を提案する。
論文 参考訳(メタデータ) (2021-06-01T04:39:56Z) - Estimating Structural Target Functions using Machine Learning and
Influence Functions [103.47897241856603]
統計モデルから特定可能な関数として生じる対象関数の統計的機械学習のための新しい枠組みを提案する。
このフレームワークは問題とモデルに依存しないものであり、応用統計学における幅広い対象パラメータを推定するのに使用できる。
我々は、部分的に観測されていない情報を持つランダム/二重ロバストな問題において、いわゆる粗大化に特に焦点をあてた。
論文 参考訳(メタデータ) (2020-08-14T16:48:29Z) - Good Classifiers are Abundant in the Interpolating Regime [64.72044662855612]
補間分類器間のテストエラーの完全な分布を正確に計算する手法を開発した。
テストエラーは、最悪の補間モデルのテストエラーから大きく逸脱する、小さな典型的な$varepsilon*$に集中する傾向にある。
以上の結果から,統計的学習理論における通常の解析手法は,実際に観測された優れた一般化性能を捉えるのに十分な粒度にはならない可能性が示唆された。
論文 参考訳(メタデータ) (2020-06-22T21:12:31Z) - Confidence Sets and Hypothesis Testing in a Likelihood-Free Inference
Setting [5.145741425164947]
$texttACORE$ は LFI に対する頻繁なアプローチであり、最初はパラメータ化された分類問題として古典的確率比テスト (LRT) を定式化する。
$texttACORE$は、統計学、テストの拒絶確率、信頼セットのカバレッジが条件分布関数である、というキーオブザーバに基づいている。
論文 参考訳(メタデータ) (2020-02-24T17:34:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。