論文の概要: Likelihood-Free Frequentist Inference: Bridging Classical Statistics and
Machine Learning in Simulation and Uncertainty Quantification
- arxiv url: http://arxiv.org/abs/2107.03920v1
- Date: Thu, 8 Jul 2021 15:52:18 GMT
- ステータス: 処理完了
- システム内更新日: 2021-07-09 15:21:07.911634
- Title: Likelihood-Free Frequentist Inference: Bridging Classical Statistics and
Machine Learning in Simulation and Uncertainty Quantification
- Title(参考訳): 古典統計学のブリッジングとシミュレーションと不確かさ定量化における機械学習
- Authors: Niccol\`o Dalmasso, David Zhao, Rafael Izbicki, Ann B. Lee
- Abstract要約: 確率自由頻度推論(LF2I)の統計的枠組みを提案する。
我々は、有限サンプル保証(I型エラー制御)とパワーを用いた頻繁な信頼セットと仮説テストを構築した。
理論的および実証的な結果は、エラー源の多面的視点と、可能性のない頻繁な推論における課題を提供する。
- 参考スコア(独自算出の注目度): 6.182914423822558
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Many areas of science make extensive use of computer simulators that
implicitly encode likelihood functions for complex systems. Classical
statistical methods are poorly suited for these so-called likelihood-free
inference (LFI) settings, outside the asymptotic and low-dimensional regimes.
Although new machine learning methods, such as normalizing flows, have
revolutionized the sample efficiency and capacity of LFI methods, it remains an
open question whether they produce reliable measures of uncertainty. In this
paper, we present a statistical framework for LFI that unifies classical
statistics with modern machine learning to: (1) construct frequentist
confidence sets and hypothesis tests with finite-sample guarantees of nominal
coverage (type I error control) and power, and (2) provide rigorous diagnostics
for assessing empirical coverage over the entire parameter space. We refer to
our framework as likelihood-free frequentist inference (LF2I). Any method that
estimates a test statistic, such as the likelihood ratio, can be plugged into
our framework to create powerful tests and confidence sets with correct
coverage. In this work, we specifically study two test statistics (ACORE and
BFF), which, respectively, maximize versus integrate an odds function over the
parameter space. Our theoretical and empirical results offer multifaceted
perspectives on error sources and challenges in likelihood-free frequentist
inference.
- Abstract(参考訳): 科学の多くの分野は、複雑なシステムの可能性関数を暗黙的にエンコードするコンピュータシミュレータを広範囲に活用している。
古典的な統計手法は、漸近的および低次元のレギュレーションの外側のいわゆる「可能性のない推論(LFI)」設定にはあまり適していない。
フローの正規化などの新しい機械学習手法は、LFI法のサンプル効率とキャパシティに革命をもたらしたが、信頼性の高い不確実性尺度を作成するかどうかには疑問が残る。
本稿では,古典統計学を現代機械学習と統合するLFIの統計的枠組みについて述べる。(1) パラメータ空間全体にわたる経験的カバレッジを評価するための厳密な診断を行うための,名目的カバレッジ(I型エラー制御)とパワーの有限サンプル保証による頻繁な信頼度セットと仮説テストを構築する。
我々はこの枠組みを「確率自由頻発的推論(lf2i)」と呼んでいる。
可能性比率などのテスト統計を見積もるメソッドは、私たちのフレームワークにプラグインして、強力なテストと信頼性セットを適切なカバレッジで作成できます。
本研究では,パラメータ空間上のオッズ関数の最大値と積分値の2つのテスト統計値(ACOREとBFF)について検討する。
理論的および実証的な結果は、エラー源の多面的視点と、可能性のない頻繁な推論における課題を提供する。
関連論文リスト
- Statistical Inference for Temporal Difference Learning with Linear Function Approximation [62.69448336714418]
時間差差(TD)学習は、おそらく政策評価に最も広く使用されるものであり、この目的の自然な枠組みとして機能する。
本稿では,Polyak-Ruppert平均化と線形関数近似によるTD学習の整合性について検討し,既存の結果よりも3つの重要な改善点を得た。
論文 参考訳(メタデータ) (2024-10-21T15:34:44Z) - Cycles of Thought: Measuring LLM Confidence through Stable Explanations [53.15438489398938]
大規模言語モデル(LLM)は、様々なベンチマークで人間レベルの精度に到達し、さらに超えることができるが、不正確な応答における過度な自信は、依然として十分に文書化された障害モードである。
本稿では,LLMの不確実性を測定するためのフレームワークを提案する。
論文 参考訳(メタデータ) (2024-06-05T16:35:30Z) - Online non-parametric likelihood-ratio estimation by Pearson-divergence
functional minimization [55.98760097296213]
iid 観測のペア $(x_t sim p, x'_t sim q)$ が時間の経過とともに観測されるような,オンラインな非パラメトリック LRE (OLRE) のための新しいフレームワークを提案する。
本稿では,OLRE法の性能に関する理論的保証と,合成実験における実証的検証について述べる。
論文 参考訳(メタデータ) (2023-11-03T13:20:11Z) - Overlapping Batch Confidence Intervals on Statistical Functionals
Constructed from Time Series: Application to Quantiles, Optimization, and
Estimation [5.068678962285631]
定常時系列データを用いて構築した統計関数に対する信頼区間手順を提案する。
OBx制限は、バッチのサイズと重複の程度によってパラメータ化されたWienerプロセスの特定の機能であり、依存を特徴づけるための必須の機械を形成する。
論文 参考訳(メタデータ) (2023-07-17T16:21:48Z) - Fast Entropy-Based Methods of Word-Level Confidence Estimation for
End-To-End Automatic Speech Recognition [86.21889574126878]
本研究では,フレーム単位のエントロピー値を正規化して集約し,単位単位当たりの信頼度と単語毎の信頼度を求める方法を示す。
提案手法をLibriSpeechテストセット上で評価した結果,最大フレーム当たりの信頼度推定値の最大値から,信頼度推定値の最大値の最大値の最大値の最大値の最大値の2倍,4倍の精度を示した。
論文 参考訳(メタデータ) (2022-12-16T20:27:40Z) - Data-Driven Reachability analysis and Support set Estimation with
Christoffel Functions [8.183446952097528]
動的システムの前方到達可能な集合を推定するためのアルゴリズムを提案する。
生成された推定は、経験的逆クリストッフェル函数と呼ばれる関数の部分レベル集合である。
到達可能性解析に加えて、確率変数の支持を推定する一般的な問題にも同様のアプローチを適用することができる。
論文 参考訳(メタデータ) (2021-12-18T20:25:34Z) - Locally Valid and Discriminative Confidence Intervals for Deep Learning
Models [37.57296694423751]
不確実性情報は有効(保証対象)で差別的(予想されるリスクが高い場合にさらに不確実)でなければならない
既存のベイジアン法の多くは、頻繁なカバレッジ保証がなく、通常モデルのパフォーマンスに影響を与える。
ほぼどんな深層学習モデルに対しても,識別的信頼区間(CI)を構築するための簡易かつ効率的かつ軽量な手法であるLVD(Locally Valid and Discriminative confidence intervals)を提案する。
論文 参考訳(メタデータ) (2021-06-01T04:39:56Z) - Extending the statistical software package Engine for Likelihood-Free
Inference [0.0]
この論文は、ソフトウェアパッケージ Engine for Likelihood-Free Inference (ELFI) におけるRobust optimisation Monte Carlo (ROMC) メソッドの実装に焦点を当てている。
我々の実装は、シミュレーターベースのモデルで推論を実行したい実践者に対して、堅牢で効率的なソリューションを提供します。
論文 参考訳(メタデータ) (2020-11-08T13:22:37Z) - Estimating Structural Target Functions using Machine Learning and
Influence Functions [103.47897241856603]
統計モデルから特定可能な関数として生じる対象関数の統計的機械学習のための新しい枠組みを提案する。
このフレームワークは問題とモデルに依存しないものであり、応用統計学における幅広い対象パラメータを推定するのに使用できる。
我々は、部分的に観測されていない情報を持つランダム/二重ロバストな問題において、いわゆる粗大化に特に焦点をあてた。
論文 参考訳(メタデータ) (2020-08-14T16:48:29Z) - Good Classifiers are Abundant in the Interpolating Regime [64.72044662855612]
補間分類器間のテストエラーの完全な分布を正確に計算する手法を開発した。
テストエラーは、最悪の補間モデルのテストエラーから大きく逸脱する、小さな典型的な$varepsilon*$に集中する傾向にある。
以上の結果から,統計的学習理論における通常の解析手法は,実際に観測された優れた一般化性能を捉えるのに十分な粒度にはならない可能性が示唆された。
論文 参考訳(メタデータ) (2020-06-22T21:12:31Z) - Confidence Sets and Hypothesis Testing in a Likelihood-Free Inference
Setting [5.145741425164947]
$texttACORE$ は LFI に対する頻繁なアプローチであり、最初はパラメータ化された分類問題として古典的確率比テスト (LRT) を定式化する。
$texttACORE$は、統計学、テストの拒絶確率、信頼セットのカバレッジが条件分布関数である、というキーオブザーバに基づいている。
論文 参考訳(メタデータ) (2020-02-24T17:34:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。