Fugu-MT 論文翻訳(概要): Likelihood-Free Frequentist Inference: Bridging Classical Statistics and Machine Learning for Reliable Simulator-Based Inference

論文の概要: Likelihood-Free Frequentist Inference: Bridging Classical Statistics and Machine Learning for Reliable Simulator-Based Inference

arxiv url: http://arxiv.org/abs/2107.03920v8
Date: Sun, 19 Nov 2023 22:13:06 GMT
ステータス: 翻訳完了
システム内更新日: 2023-11-22 21:25:09.171092
Title: Likelihood-Free Frequentist Inference: Bridging Classical Statistics and Machine Learning for Reliable Simulator-Based Inference
Title（参考訳）: 確率のない頻繁な推論:信頼性のあるシミュレータに基づく推論のための古典統計と機械学習の橋渡し
Authors: Niccol\`o Dalmasso, Luca Masserano, David Zhao, Rafael Izbicki, Ann B. Lee
Abstract要約: 古典統計学と現代の機械学習を橋渡しする統一的でモジュール化された推論フレームワークを提案する。我々は、一般のフレームワークを、可能性のない頻繁な推論(LF2I)と呼ぶ。
参考スコア（独自算出の注目度）: 3.9927092855811983
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Many areas of science make extensive use of computer simulators that implicitly encode intractable likelihood functions of complex systems. Classical statistical methods are poorly suited for these so-called likelihood-free inference (LFI) settings, especially outside asymptotic and low-dimensional regimes. At the same time, traditional LFI methods - such as Approximate Bayesian Computation or more recent machine learning techniques - do not guarantee confidence sets with nominal coverage in general settings (i.e., with high-dimensional data, finite sample sizes, and for any parameter value). In addition, there are no diagnostic tools to check the empirical coverage of confidence sets provided by such methods across the entire parameter space. In this work, we propose a unified and modular inference framework that bridges classical statistics and modern machine learning providing (i) a practical approach to the Neyman construction of confidence sets with frequentist finite-sample coverage for any value of the unknown parameters; and (ii) interpretable diagnostics that estimate the empirical coverage across the entire parameter space. We refer to the general framework as likelihood-free frequentist inference (LF2I). Any method that defines a test statistic can leverage LF2I to create valid confidence sets and diagnostics without costly Monte Carlo samples at fixed parameter settings. We study the power of two likelihood-based test statistics (ACORE and BFF) and demonstrate their empirical performance on high-dimensional, complex data. Code is available at https://github.com/lee-group-cmu/lf2i.
Abstract（参考訳）: 科学の多くの分野は、複雑なシステムの難解な可能性関数を暗黙的にエンコードするコンピュータシミュレータを多用している。古典的な統計手法は、いわゆる「可能性のない推論(LFI)」設定、特に漸近的および低次元のレジームの外では不適当である。同時に、近似ベイズ計算やより最近の機械学習技術のような従来のlfi法は、一般的な設定(高次元データ、有限サンプルサイズ、任意のパラメータ値)において名目カバレッジを持つ信頼セットを保証しない。さらに、パラメータ空間全体にわたってそのような手法によって提供される信頼セットの実証的カバレッジを確認するための診断ツールも存在しない。本研究では,古典統計と現代の機械学習提供を橋渡しする統一的モジュール型推論フレームワークを提案する。 (i)未知のパラメータの任意の値に対して、頻繁な有限サンプル被覆を持つ信頼集合のニーマン構成への実践的アプローチ (ii)パラメータ空間全体の経験的カバレッジを推定する解釈可能な診断。一般のフレームワークを、LF2I ( chance-free frequentist inference) と呼ぶ。テスト統計を定義する任意のメソッドはLF2Iを利用して、固定パラメータ設定のモンテカルロサンプルを犠牲にすることなく、有効な信頼セットと診断を作成することができる。 2つの確率ベーステスト統計(acoreとbff)のパワーを調査し,その経験的性能を高次元複雑なデータで実証する。コードはhttps://github.com/lee-group-cmu/lf2iで入手できる。

関連論文リスト

Sparse Semantic Dimension as a Generalization Certificate for LLMs [53.681678236115836]
Sparse Semantic Dimension (SSD)は,モデル層上で訓練されたSparse Autoencoder (SAE)のアクティブな特徴語彙から導かれる複雑性尺度である。我々はGPT-2 Small と Gemma-2B でこの枠組みを検証し、実際のサンプルサイズで非空き証明書を提供することを実証した。
論文参考訳（メタデータ） (2026-02-11T21:45:18Z)
Semiparametric Learning from Open-Set Label Shift Data [14.537408547515627]
オープンセットラベルシフト問題について検討し、テストデータにはトレーニングに欠席した新しいクラスが含まれる可能性がある。この設定は、クラス比率と新しいクラスの分布の両方が余分な仮定なしでは識別できないため、難しい。本稿では,新しいクラスと既知のクラス間の重なりを許容しながら,識別可能性を保証する半パラメトリック密度比モデルフレームワークを提案する。
論文参考訳（メタデータ） (2025-09-18T01:32:29Z)
A kernel conditional two-sample test [5.503626337185689]
学習手法の信頼性境界を条件付き2サンプルテストに変換する。アクセス不能なパラメータのチューニングを避けるためにブートストラップ方式を導入する。その結果,条件付き2サンプルテストの総合的な基盤が確立された。
論文参考訳（メタデータ） (2025-06-04T12:53:13Z)
Active Learning For Repairable Hardware Systems With Partial Coverage [5.493546563993988]
本稿では,診断カバレッジ(DC),魚情報行列(FIM),診断試験予算を組み込んだMISDP(Mised Semidefinite Program)を提案する。文献(エントロピー)において最も広く使われているAL AFに対する提案手法の評価を行った。提案するAFは, 6,000の実験構成において, 代替AFの中では, 平均で最多であった。
論文参考訳（メタデータ） (2025-03-20T16:38:16Z)
Distribution-Free Calibration of Statistical Confidence Sets [2.283561089098417]
本研究では,TRUSTとTRUST++という2つの新しい手法を導入する。我々は,本手法が既存のアプローチ,特に小サンプル方式よりも優れていることを実証した。
論文参考訳（メタデータ） (2024-11-28T20:45:59Z)
Statistical Inference for Temporal Difference Learning with Linear Function Approximation [62.69448336714418]
時間差差(TD)学習は、おそらく政策評価に最も広く使用されるものであり、この目的の自然な枠組みとして機能する。本稿では,Polyak-Ruppert平均化と線形関数近似によるTD学習の整合性について検討し,既存の結果よりも3つの重要な改善点を得た。
論文参考訳（メタデータ） (2024-10-21T15:34:44Z)
Cycles of Thought: Measuring LLM Confidence through Stable Explanations [53.15438489398938]
大規模言語モデル(LLM)は、様々なベンチマークで人間レベルの精度に到達し、さらに超えることができるが、不正確な応答における過度な自信は、依然として十分に文書化された障害モードである。本稿では,LLMの不確実性を測定するためのフレームワークを提案する。
論文参考訳（メタデータ） (2024-06-05T16:35:30Z)
The Power of Resets in Online Reinforcement Learning [73.64852266145387]
ローカルシミュレータアクセス(あるいはローカルプランニング)を用いたオンライン強化学習を通してシミュレータのパワーを探求する。カバー性が低いMPPは,Qstar$-realizabilityのみのサンプル効率で学習可能であることを示す。ローカルシミュレーターアクセス下では, 悪名高いExogenous Block MDP問題が抽出可能であることを示す。
論文参考訳（メタデータ） (2024-04-23T18:09:53Z)
Online non-parametric likelihood-ratio estimation by Pearson-divergence functional minimization [55.98760097296213]
iid 観測のペア $(x_t sim p, x'_t sim q)$ が時間の経過とともに観測されるような,オンラインな非パラメトリック LRE (OLRE) のための新しいフレームワークを提案する。本稿では,OLRE法の性能に関する理論的保証と,合成実験における実証的検証について述べる。
論文参考訳（メタデータ） (2023-11-03T13:20:11Z)
Overlapping Batch Confidence Intervals on Statistical Functionals Constructed from Time Series: Application to Quantiles, Optimization, and Estimation [5.068678962285631]
定常時系列データを用いて構築した統計関数に対する信頼区間手順を提案する。 OBx制限は、バッチのサイズと重複の程度によってパラメータ化されたWienerプロセスの特定の機能であり、依存を特徴づけるための必須の機械を形成する。
論文参考訳（メタデータ） (2023-07-17T16:21:48Z)
Fast Entropy-Based Methods of Word-Level Confidence Estimation for End-To-End Automatic Speech Recognition [86.21889574126878]
本研究では,フレーム単位のエントロピー値を正規化して集約し,単位単位当たりの信頼度と単語毎の信頼度を求める方法を示す。提案手法をLibriSpeechテストセット上で評価した結果,最大フレーム当たりの信頼度推定値の最大値から,信頼度推定値の最大値の最大値の最大値の最大値の最大値の2倍,4倍の精度を示した。
論文参考訳（メタデータ） (2022-12-16T20:27:40Z)
Data-Driven Reachability analysis and Support set Estimation with Christoffel Functions [8.183446952097528]
動的システムの前方到達可能な集合を推定するためのアルゴリズムを提案する。生成された推定は、経験的逆クリストッフェル函数と呼ばれる関数の部分レベル集合である。到達可能性解析に加えて、確率変数の支持を推定する一般的な問題にも同様のアプローチを適用することができる。
論文参考訳（メタデータ） (2021-12-18T20:25:34Z)
Locally Valid and Discriminative Confidence Intervals for Deep Learning Models [37.57296694423751]
不確実性情報は有効(保証対象)で差別的(予想されるリスクが高い場合にさらに不確実)でなければならない既存のベイジアン法の多くは、頻繁なカバレッジ保証がなく、通常モデルのパフォーマンスに影響を与える。ほぼどんな深層学習モデルに対しても,識別的信頼区間(CI)を構築するための簡易かつ効率的かつ軽量な手法であるLVD(Locally Valid and Discriminative confidence intervals)を提案する。
論文参考訳（メタデータ） (2021-06-01T04:39:56Z)
Extending the statistical software package Engine for Likelihood-Free Inference [0.0]
この論文は、ソフトウェアパッケージ Engine for Likelihood-Free Inference (ELFI) におけるRobust optimisation Monte Carlo (ROMC) メソッドの実装に焦点を当てている。我々の実装は、シミュレーターベースのモデルで推論を実行したい実践者に対して、堅牢で効率的なソリューションを提供します。
論文参考訳（メタデータ） (2020-11-08T13:22:37Z)
Estimating Structural Target Functions using Machine Learning and Influence Functions [103.47897241856603]
統計モデルから特定可能な関数として生じる対象関数の統計的機械学習のための新しい枠組みを提案する。このフレームワークは問題とモデルに依存しないものであり、応用統計学における幅広い対象パラメータを推定するのに使用できる。我々は、部分的に観測されていない情報を持つランダム/二重ロバストな問題において、いわゆる粗大化に特に焦点をあてた。
論文参考訳（メタデータ） (2020-08-14T16:48:29Z)
Good Classifiers are Abundant in the Interpolating Regime [64.72044662855612]
補間分類器間のテストエラーの完全な分布を正確に計算する手法を開発した。テストエラーは、最悪の補間モデルのテストエラーから大きく逸脱する、小さな典型的な$varepsilon*$に集中する傾向にある。以上の結果から,統計的学習理論における通常の解析手法は,実際に観測された優れた一般化性能を捉えるのに十分な粒度にはならない可能性が示唆された。
論文参考訳（メタデータ） (2020-06-22T21:12:31Z)
Confidence Sets and Hypothesis Testing in a Likelihood-Free Inference Setting [5.145741425164947]
$texttACORE$ は LFI に対する頻繁なアプローチであり、最初はパラメータ化された分類問題として古典的確率比テスト (LRT) を定式化する。 $texttACORE$は、統計学、テストの拒絶確率、信頼セットのカバレッジが条件分布関数である、というキーオブザーバに基づいている。
論文参考訳（メタデータ） (2020-02-24T17:34:49Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。