論文の概要: Confidence Sets and Hypothesis Testing in a Likelihood-Free Inference
Setting
- arxiv url: http://arxiv.org/abs/2002.10399v2
- Date: Fri, 14 Aug 2020 02:56:38 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-29 03:39:59.939277
- Title: Confidence Sets and Hypothesis Testing in a Likelihood-Free Inference
Setting
- Title(参考訳): 確率-自由推論設定における信頼度集合と仮説検定
- Authors: Niccol\`o Dalmasso and Rafael Izbicki and Ann B. Lee
- Abstract要約: $texttACORE$ は LFI に対する頻繁なアプローチであり、最初はパラメータ化された分類問題として古典的確率比テスト (LRT) を定式化する。
$texttACORE$は、統計学、テストの拒絶確率、信頼セットのカバレッジが条件分布関数である、というキーオブザーバに基づいている。
- 参考スコア(独自算出の注目度): 5.145741425164947
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Parameter estimation, statistical tests and confidence sets are the
cornerstones of classical statistics that allow scientists to make inferences
about the underlying process that generated the observed data. A key question
is whether one can still construct hypothesis tests and confidence sets with
proper coverage and high power in a so-called likelihood-free inference (LFI)
setting; that is, a setting where the likelihood is not explicitly known but
one can forward-simulate observable data according to a stochastic model. In
this paper, we present $\texttt{ACORE}$ (Approximate Computation via Odds Ratio
Estimation), a frequentist approach to LFI that first formulates the classical
likelihood ratio test (LRT) as a parametrized classification problem, and then
uses the equivalence of tests and confidence sets to build confidence regions
for parameters of interest. We also present a goodness-of-fit procedure for
checking whether the constructed tests and confidence regions are valid.
$\texttt{ACORE}$ is based on the key observation that the LRT statistic, the
rejection probability of the test, and the coverage of the confidence set are
conditional distribution functions which often vary smoothly as a function of
the parameters of interest. Hence, instead of relying solely on samples
simulated at fixed parameter settings (as is the convention in standard Monte
Carlo solutions), one can leverage machine learning tools and data simulated in
the neighborhood of a parameter to improve estimates of quantities of interest.
We demonstrate the efficacy of $\texttt{ACORE}$ with both theoretical and
empirical results. Our implementation is available on Github.
- Abstract(参考訳): パラメータ推定、統計テスト、信頼セットは、科学者が観測されたデータを生成する基礎となるプロセスについて推測できる古典的な統計の基盤である。
重要な疑問は、いわゆるlfi設定において、適切なカバレッジと高いパワーで仮説テストと信頼セットを構築できるかどうかである。つまり、確率が明示的に知られていないが、確率モデルに従って観測可能なデータを前方にシミュレーションできるような設定である。
本稿では、古典的確率比検定(LRT)をパラメトリズド分類問題として定式化し、次に、テストと信頼セットの同値性を用いて、興味のあるパラメータの信頼領域を構築するLFIに対する頻繁なアプローチである$\texttt{ACORE}$を提案する。
また、構築されたテストと信頼領域が有効かどうかを確認するための適度な手順も提示する。
$\texttt{acore}$ は lrt の統計値、テストの拒絶確率、信頼度集合のカバレッジが条件分布関数であり、しばしば興味のあるパラメータの関数としてスムーズに変化するという重要な観察に基づいている。
したがって、固定パラメータ設定でシミュレーションされたサンプルのみに頼るのではなく(標準モンテカルロソリューションの慣例)、パラメータの近傍でシミュレーションされた機械学習ツールとデータを活用して、関心量の見積もりを改善することができる。
理論的および経験的結果の両方で$\texttt{ACORE}$の有効性を示す。
実装はgithubから入手できます。
関連論文リスト
- Extended Fiducial Inference: Toward an Automated Process of Statistical Inference [9.277340234795801]
拡張フィデューシャル推論(EFI)と呼ばれる新しい統計的推論法を開発した。
提案手法は,高度な統計計算技術を活用することにより,フィデューシャル推論の目標を達成する。
EFIはパラメータ推定と仮説テストにおいて大きなアドバンテージを提供する。
論文 参考訳(メタデータ) (2024-07-31T14:15:42Z) - Mitigating LLM Hallucinations via Conformal Abstention [70.83870602967625]
我々は,大言語モデルが一般ドメインでの応答をいつ無視すべきかを決定するための,原則化された手順を開発する。
我々は、幻覚率(エラー率)の厳密な理論的保証の恩恵を受けるため、共形予測手法を活用して、禁忌手順を開発する。
実験によって得られた共形禁忌法は, 種々の閉書, オープンドメイン生成質問応答データセットに, 幻覚率を確実に拘束する。
論文 参考訳(メタデータ) (2024-04-04T11:32:03Z) - Finite Sample Confidence Regions for Linear Regression Parameters Using
Arbitrary Predictors [1.6860963320038902]
線形モデルのパラメータに対する信頼領域を構築するための新しい手法を任意の予測器からの予測を用いて検討する。
導出された信頼領域は、混合線形プログラミングフレームワーク内の制約としてキャストすることができ、線形目的の最適化を可能にする。
従来の手法とは異なり、信頼領域は空であり、仮説テストに使用できる。
論文 参考訳(メタデータ) (2024-01-27T00:15:48Z) - SMURF-THP: Score Matching-based UnceRtainty quantiFication for
Transformer Hawkes Process [76.98721879039559]
SMURF-THPは,変圧器ホークス過程を学習し,予測の不確かさを定量化するスコアベース手法である。
具体的には、SMURF-THPは、スコアマッチング目標に基づいて、イベントの到着時刻のスコア関数を学習する。
我々は,イベントタイプ予測と到着時刻の不確実性定量化の両方において,広範な実験を行う。
論文 参考訳(メタデータ) (2023-10-25T03:33:45Z) - Calibrating Neural Simulation-Based Inference with Differentiable
Coverage Probability [50.44439018155837]
ニューラルモデルのトレーニング目的に直接キャリブレーション項を含めることを提案する。
古典的なキャリブレーション誤差の定式化を緩和することにより、エンドツーエンドのバックプロパゲーションを可能にする。
既存の計算パイプラインに直接適用でき、信頼性の高いブラックボックス後部推論が可能である。
論文 参考訳(メタデータ) (2023-10-20T10:20:45Z) - When Does Confidence-Based Cascade Deferral Suffice? [69.28314307469381]
カスケードは、推論コストをサンプル毎に適応的に変化させる古典的な戦略である。
deferralルールは、シーケンス内の次の分類子を呼び出すか、または予測を終了するかを決定する。
カスケードの構造に執着しているにもかかわらず、信頼に基づく推論は実際は極めてうまく機能することが多い。
論文 参考訳(メタデータ) (2023-07-06T04:13:57Z) - Stable Probability Weighting: Large-Sample and Finite-Sample Estimation
and Inference Methods for Heterogeneous Causal Effects of Multivalued
Treatments Under Limited Overlap [0.0]
異種因果効果を推定・推定するための実用的大サンプルおよび有限サンプル法を提案する。
安定確率重み付け(Stable Probability Weighting)という一般原理を考案する。
また、弱null仮説の一般クラスをテストするための新しい有限サンプル推論手法を提案する。
論文 参考訳(メタデータ) (2023-01-13T18:52:18Z) - Nonparametric Conditional Local Independence Testing [69.31200003384122]
条件付き局所独立は、連続的な時間プロセス間の独立関係である。
条件付き地域独立の非パラメトリックテストは行われていない。
二重機械学習に基づく非パラメトリックテストを提案する。
論文 参考訳(メタデータ) (2022-03-25T10:31:02Z) - Likelihood-Free Frequentist Inference: Bridging Classical Statistics and Machine Learning for Reliable Simulator-Based Inference [4.525512100042707]
古典統計学と現代の機械学習を橋渡しするモジュラー推論フレームワークを提案する。
我々は、このフレームワークを、可能性のない頻繁性推論(LF2I)と呼ぶ。
論文 参考訳(メタデータ) (2021-07-08T15:52:18Z) - Testing for Outliers with Conformal p-values [14.158078752410182]
目標は、新しい独立したサンプルが参照データセットと同じ分布に属するかどうかをテストすることである。
そこで本論文では,p-値が有意であるが,異なるテストポイントに対して互いに依存する,広く適用可能なフレームワークである共形推論に基づく解を提案する。
我々は、これらのp値が正に依存し、正確な誤発見率制御を可能にすることを証明している。
論文 参考訳(メタデータ) (2021-04-16T17:59:21Z) - Binary Classification from Positive Data with Skewed Confidence [85.18941440826309]
肯定的信頼度(Pconf)分類は、有望な弱教師付き学習法である。
実際には、信頼はアノテーションプロセスで生じるバイアスによって歪められることがある。
本稿では、スキュード信頼度のパラメータ化モデルを導入し、ハイパーパラメータを選択する方法を提案する。
論文 参考訳(メタデータ) (2020-01-29T00:04:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。