論文の概要: Confidence Sets and Hypothesis Testing in a Likelihood-Free Inference
Setting
- arxiv url: http://arxiv.org/abs/2002.10399v2
- Date: Fri, 14 Aug 2020 02:56:38 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-29 03:39:59.939277
- Title: Confidence Sets and Hypothesis Testing in a Likelihood-Free Inference
Setting
- Title(参考訳): 確率-自由推論設定における信頼度集合と仮説検定
- Authors: Niccol\`o Dalmasso and Rafael Izbicki and Ann B. Lee
- Abstract要約: $texttACORE$ は LFI に対する頻繁なアプローチであり、最初はパラメータ化された分類問題として古典的確率比テスト (LRT) を定式化する。
$texttACORE$は、統計学、テストの拒絶確率、信頼セットのカバレッジが条件分布関数である、というキーオブザーバに基づいている。
- 参考スコア(独自算出の注目度): 5.145741425164947
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Parameter estimation, statistical tests and confidence sets are the
cornerstones of classical statistics that allow scientists to make inferences
about the underlying process that generated the observed data. A key question
is whether one can still construct hypothesis tests and confidence sets with
proper coverage and high power in a so-called likelihood-free inference (LFI)
setting; that is, a setting where the likelihood is not explicitly known but
one can forward-simulate observable data according to a stochastic model. In
this paper, we present $\texttt{ACORE}$ (Approximate Computation via Odds Ratio
Estimation), a frequentist approach to LFI that first formulates the classical
likelihood ratio test (LRT) as a parametrized classification problem, and then
uses the equivalence of tests and confidence sets to build confidence regions
for parameters of interest. We also present a goodness-of-fit procedure for
checking whether the constructed tests and confidence regions are valid.
$\texttt{ACORE}$ is based on the key observation that the LRT statistic, the
rejection probability of the test, and the coverage of the confidence set are
conditional distribution functions which often vary smoothly as a function of
the parameters of interest. Hence, instead of relying solely on samples
simulated at fixed parameter settings (as is the convention in standard Monte
Carlo solutions), one can leverage machine learning tools and data simulated in
the neighborhood of a parameter to improve estimates of quantities of interest.
We demonstrate the efficacy of $\texttt{ACORE}$ with both theoretical and
empirical results. Our implementation is available on Github.
- Abstract(参考訳): パラメータ推定、統計テスト、信頼セットは、科学者が観測されたデータを生成する基礎となるプロセスについて推測できる古典的な統計の基盤である。
重要な疑問は、いわゆるlfi設定において、適切なカバレッジと高いパワーで仮説テストと信頼セットを構築できるかどうかである。つまり、確率が明示的に知られていないが、確率モデルに従って観測可能なデータを前方にシミュレーションできるような設定である。
本稿では、古典的確率比検定(LRT)をパラメトリズド分類問題として定式化し、次に、テストと信頼セットの同値性を用いて、興味のあるパラメータの信頼領域を構築するLFIに対する頻繁なアプローチである$\texttt{ACORE}$を提案する。
また、構築されたテストと信頼領域が有効かどうかを確認するための適度な手順も提示する。
$\texttt{acore}$ は lrt の統計値、テストの拒絶確率、信頼度集合のカバレッジが条件分布関数であり、しばしば興味のあるパラメータの関数としてスムーズに変化するという重要な観察に基づいている。
したがって、固定パラメータ設定でシミュレーションされたサンプルのみに頼るのではなく(標準モンテカルロソリューションの慣例)、パラメータの近傍でシミュレーションされた機械学習ツールとデータを活用して、関心量の見積もりを改善することができる。
理論的および経験的結果の両方で$\texttt{ACORE}$の有効性を示す。
実装はgithubから入手できます。
関連論文リスト
- Model-free Methods for Event History Analysis and Efficient Adjustment (PhD Thesis) [55.2480439325792]
この論文は、モデルフリーの観点から統一された統計学への独立した貢献のシリーズである。
第1章では、機械学習から予測技術を活用する柔軟なメソッドを定式化するために、モデルフリーの視点をどのように利用できるか、詳しく説明している。
第2章では、あるプロセスの進化が他のプロセスに直接影響されるかどうかを記述した地域独立の概念を研究している。
論文 参考訳(メタデータ) (2025-02-11T19:24:09Z) - Distribution-Free Calibration of Statistical Confidence Sets [2.283561089098417]
本研究では,TRUSTとTRUST++という2つの新しい手法を導入する。
我々は,本手法が既存のアプローチ,特に小サンプル方式よりも優れていることを実証した。
論文 参考訳(メタデータ) (2024-11-28T20:45:59Z) - A Novel Characterization of the Population Area Under the Risk Coverage Curve (AURC) and Rates of Finite Sample Estimators [15.294324192338484]
AURC(Area Under the Risk-Coverage Curve)は、SCシステムの性能を評価するための最前線評価指標として登場した。
有限サンプルシナリオに対する実験的なAURCプラグイン推定器を導出する。
複数のデータセットにまたがる実験により,推定器の有効性を実証的に検証した。
論文 参考訳(メタデータ) (2024-10-20T11:14:51Z) - Mitigating LLM Hallucinations via Conformal Abstention [70.83870602967625]
我々は,大言語モデルが一般ドメインでの応答をいつ無視すべきかを決定するための,原則化された手順を開発する。
我々は、幻覚率(エラー率)の厳密な理論的保証の恩恵を受けるため、共形予測手法を活用して、禁忌手順を開発する。
実験によって得られた共形禁忌法は, 種々の閉書, オープンドメイン生成質問応答データセットに, 幻覚率を確実に拘束する。
論文 参考訳(メタデータ) (2024-04-04T11:32:03Z) - Finite Sample Confidence Regions for Linear Regression Parameters Using
Arbitrary Predictors [1.6860963320038902]
線形モデルのパラメータに対する信頼領域を構築するための新しい手法を任意の予測器からの予測を用いて検討する。
導出された信頼領域は、混合線形プログラミングフレームワーク内の制約としてキャストすることができ、線形目的の最適化を可能にする。
従来の手法とは異なり、信頼領域は空であり、仮説テストに使用できる。
論文 参考訳(メタデータ) (2024-01-27T00:15:48Z) - Calibrating Neural Simulation-Based Inference with Differentiable
Coverage Probability [50.44439018155837]
ニューラルモデルのトレーニング目的に直接キャリブレーション項を含めることを提案する。
古典的なキャリブレーション誤差の定式化を緩和することにより、エンドツーエンドのバックプロパゲーションを可能にする。
既存の計算パイプラインに直接適用でき、信頼性の高いブラックボックス後部推論が可能である。
論文 参考訳(メタデータ) (2023-10-20T10:20:45Z) - When Does Confidence-Based Cascade Deferral Suffice? [69.28314307469381]
カスケードは、推論コストをサンプル毎に適応的に変化させる古典的な戦略である。
deferralルールは、シーケンス内の次の分類子を呼び出すか、または予測を終了するかを決定する。
カスケードの構造に執着しているにもかかわらず、信頼に基づく推論は実際は極めてうまく機能することが多い。
論文 参考訳(メタデータ) (2023-07-06T04:13:57Z) - Stable Probability Weighting: Large-Sample and Finite-Sample Estimation
and Inference Methods for Heterogeneous Causal Effects of Multivalued
Treatments Under Limited Overlap [0.0]
異種因果効果を推定・推定するための実用的大サンプルおよび有限サンプル法を提案する。
安定確率重み付け(Stable Probability Weighting)という一般原理を考案する。
また、弱null仮説の一般クラスをテストするための新しい有限サンプル推論手法を提案する。
論文 参考訳(メタデータ) (2023-01-13T18:52:18Z) - Nonparametric Conditional Local Independence Testing [69.31200003384122]
条件付き局所独立は、連続的な時間プロセス間の独立関係である。
条件付き地域独立の非パラメトリックテストは行われていない。
二重機械学習に基づく非パラメトリックテストを提案する。
論文 参考訳(メタデータ) (2022-03-25T10:31:02Z) - Likelihood-Free Frequentist Inference: Bridging Classical Statistics and Machine Learning for Reliable Simulator-Based Inference [4.525512100042707]
古典統計学と現代の機械学習を橋渡しするモジュラー推論フレームワークを提案する。
我々は、このフレームワークを、可能性のない頻繁性推論(LF2I)と呼ぶ。
論文 参考訳(メタデータ) (2021-07-08T15:52:18Z) - Binary Classification from Positive Data with Skewed Confidence [85.18941440826309]
肯定的信頼度(Pconf)分類は、有望な弱教師付き学習法である。
実際には、信頼はアノテーションプロセスで生じるバイアスによって歪められることがある。
本稿では、スキュード信頼度のパラメータ化モデルを導入し、ハイパーパラメータを選択する方法を提案する。
論文 参考訳(メタデータ) (2020-01-29T00:04:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。