論文の概要: Likelihood-Free Frequentist Inference: Confidence Sets with Correct
Conditional Coverage
- arxiv url: http://arxiv.org/abs/2107.03920v6
- Date: Thu, 6 Apr 2023 23:34:42 GMT
- ステータス: 処理完了
- システム内更新日: 2023-04-10 15:50:43.268183
- Title: Likelihood-Free Frequentist Inference: Confidence Sets with Correct
Conditional Coverage
- Title(参考訳): Likelihood-free Frequentist推論: 正しい条件付きカバー付き信頼セット
- Authors: Niccol\`o Dalmasso, Luca Masserano, David Zhao, Rafael Izbicki, Ann B.
Lee
- Abstract要約: 本論文は,古典統計学を現代機械学習と統合して提示する(ネマンの信頼集合構築のための実用的手続きと有限サンプルの公称カバレッジの保証)。
我々は、我々のフレームワークを、可能性のない頻繁な推論(LF2I)と呼ぶ。
本稿では,LF2Iの信頼性セットにおける誤りの原因を概説し,LF2Iのメリットと課題について論じる。
- 参考スコア(独自算出の注目度): 4.491083687014879
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Many areas of science make extensive use of computer simulators that
implicitly encode likelihood functions of complex systems. Classical
statistical methods are poorly suited for these so-called likelihood-free
inference (LFI) settings, particularly outside asymptotic and low-dimensional
regimes. Although new machine learning methods, such as normalizing flows, have
revolutionized the sample efficiency and capacity of LFI methods, it remains an
open question whether they produce confidence sets with correct conditional
coverage for small sample sizes. This paper unifies classical statistics with
modern machine learning to present (i) a practical procedure for the Neyman
construction of confidence sets with finite-sample guarantees of nominal
coverage, and (ii) diagnostics that estimate conditional coverage over the
entire parameter space. We refer to our framework as likelihood-free
frequentist inference (LF2I). Any method that defines a test statistic, like
the likelihood ratio, can leverage the LF2I machinery to create valid
confidence sets and diagnostics without costly Monte Carlo samples at fixed
parameter settings. We study the power of two test statistics (ACORE and BFF),
which, respectively, maximize versus integrate an odds function over the
parameter space. Our paper discusses the benefits and challenges of LF2I, with
a breakdown of the sources of errors in LF2I confidence sets.
- Abstract(参考訳): 多くの科学分野において、複雑なシステムの可能性関数を暗黙的に符号化するコンピュータシミュレータが広く使われている。
古典的な統計手法は、いわゆる「可能性のない推論」(LFI)の設定、特に漸近的および低次元のレギュレーションの外部にはあまり適していない。
フローの正規化のような新しい機械学習手法は、LFI法のサンプル効率とキャパシティに革命をもたらしたが、小さなサンプルサイズに対して適切な条件付き信頼セットを生成するかどうかには疑問が残る。
本稿では,古典統計学を現代機械学習と統合して提示する。
(i)名目範囲の有限サンプル保証付き信頼集合のニーマン構成の実際的手順
(ii)パラメータ空間全体の条件付きカバレッジを推定する診断。
我々はこの枠組みを「確率自由頻発的推論(lf2i)」と呼んでいる。
確率比のようなテスト統計を定義するあらゆる方法は、LF2I機械を利用して、固定パラメータ設定でモンテカルロの高価なサンプルを使わずに有効な信頼セットと診断を作成することができる。
パラメータ空間上のオッズ関数の最大化と積分を行う2つのテスト統計(acoreとbff)のパワーについて検討した。
本稿では,LF2Iの信頼性セットにおける誤りの原因を概説し,LF2Iのメリットと課題について論じる。
関連論文リスト
- LTAU-FF: Loss Trajectory Analysis for Uncertainty in Atomistic Force
Fields [5.895479908315789]
モデルアンサンブルを効率的に表現するために,トレーニング中に得られたサンプルごとの誤差の累積分布関数(CDF)を利用する。
LTAUと呼ばれる単純なUQメトリックを開発し、トレーニングや推論で複数のモデルの評価を必要とせず、アンサンブルベースの技法の強みを活用する。
論文 参考訳(メタデータ) (2024-02-01T18:50:42Z) - Prototype-based Aleatoric Uncertainty Quantification for Cross-modal
Retrieval [139.21955930418815]
クロスモーダル検索手法は、共通表現空間を共同学習することにより、視覚と言語モダリティの類似性関係を構築する。
しかし、この予測は、低品質なデータ、例えば、腐敗した画像、速いペースの動画、詳細でないテキストによって引き起こされるアレタリック不確実性のために、しばしば信頼性が低い。
本稿では, 原型に基づくAleatoric Uncertainity Quantification (PAU) フレームワークを提案する。
論文 参考訳(メタデータ) (2023-09-29T09:41:19Z) - Overlapping Batch Confidence Intervals on Statistical Functionals
Constructed from Time Series: Application to Quantiles, Optimization, and
Estimation [5.068678962285631]
定常時系列データを用いて構築した統計関数に対する信頼区間手順を提案する。
OBx制限は、バッチのサイズと重複の程度によってパラメータ化されたWienerプロセスの特定の機能であり、依存を特徴づけるための必須の機械を形成する。
論文 参考訳(メタデータ) (2023-07-17T16:21:48Z) - The Normalized Cross Density Functional: A Framework to Quantify
Statistical Dependence for Random Processes [6.625320950808605]
正規化クロス密度(NCD)と呼ばれる正定関数を用いて、2つのランダムプロセス(r.p.)間の統計的依存を測定する新しい手法を提案する。
NCDは2つのr.p.の確率密度関数から直接導出され、データ依存ヒルベルト空間、正規化クロス密度ヒルベルト空間(NCD-HS)を構成する。
我々は,FMCAがNCDの固有値と固有関数を直接実現したことを数学的に証明する。
論文 参考訳(メタデータ) (2022-12-09T02:12:41Z) - Validation Diagnostics for SBI algorithms based on Normalizing Flows [55.41644538483948]
本研究は,NFに基づく多次元条件(後)密度推定器の検証診断を容易にすることを提案する。
また、局所的な一貫性の結果に基づいた理論的保証も提供する。
この作業は、より良い特定モデルの設計を支援したり、新しいSBIアルゴリズムの開発を促進するのに役立つだろう。
論文 参考訳(メタデータ) (2022-11-17T15:48:06Z) - Learning Summary Statistics for Bayesian Inference with Autoencoders [58.720142291102135]
我々は,ディープニューラルネットワークに基づくオートエンコーダの内部次元を要約統計として利用する。
パラメータ関連情報を全て符号化するエンコーダのインセンティブを作成するため,トレーニングデータの生成に使用した暗黙的情報にデコーダがアクセスできるようにする。
論文 参考訳(メタデータ) (2022-01-28T12:00:31Z) - Data-Driven Reachability analysis and Support set Estimation with
Christoffel Functions [8.183446952097528]
動的システムの前方到達可能な集合を推定するためのアルゴリズムを提案する。
生成された推定は、経験的逆クリストッフェル函数と呼ばれる関数の部分レベル集合である。
到達可能性解析に加えて、確率変数の支持を推定する一般的な問題にも同様のアプローチを適用することができる。
論文 参考訳(メタデータ) (2021-12-18T20:25:34Z) - Estimating Structural Target Functions using Machine Learning and
Influence Functions [103.47897241856603]
統計モデルから特定可能な関数として生じる対象関数の統計的機械学習のための新しい枠組みを提案する。
このフレームワークは問題とモデルに依存しないものであり、応用統計学における幅広い対象パラメータを推定するのに使用できる。
我々は、部分的に観測されていない情報を持つランダム/二重ロバストな問題において、いわゆる粗大化に特に焦点をあてた。
論文 参考訳(メタデータ) (2020-08-14T16:48:29Z) - Good Classifiers are Abundant in the Interpolating Regime [64.72044662855612]
補間分類器間のテストエラーの完全な分布を正確に計算する手法を開発した。
テストエラーは、最悪の補間モデルのテストエラーから大きく逸脱する、小さな典型的な$varepsilon*$に集中する傾向にある。
以上の結果から,統計的学習理論における通常の解析手法は,実際に観測された優れた一般化性能を捉えるのに十分な粒度にはならない可能性が示唆された。
論文 参考訳(メタデータ) (2020-06-22T21:12:31Z) - Machine learning for causal inference: on the use of cross-fit
estimators [77.34726150561087]
より優れた統計特性を得るために、二重ローバストなクロスフィット推定器が提案されている。
平均因果効果(ACE)に対する複数の推定器の性能評価のためのシミュレーション研究を行った。
機械学習で使用する場合、二重確率のクロスフィット推定器は、バイアス、分散、信頼区間のカバレッジで他のすべての推定器よりも大幅に優れていた。
論文 参考訳(メタデータ) (2020-04-21T23:09:55Z) - Confidence Sets and Hypothesis Testing in a Likelihood-Free Inference
Setting [5.145741425164947]
$texttACORE$ は LFI に対する頻繁なアプローチであり、最初はパラメータ化された分類問題として古典的確率比テスト (LRT) を定式化する。
$texttACORE$は、統計学、テストの拒絶確率、信頼セットのカバレッジが条件分布関数である、というキーオブザーバに基づいている。
論文 参考訳(メタデータ) (2020-02-24T17:34:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。