論文の概要: Confidence Sets and Hypothesis Testing in a Likelihood-Free Inference
Setting
- arxiv url: http://arxiv.org/abs/2002.10399v2
- Date: Fri, 14 Aug 2020 02:56:38 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-29 03:39:59.939277
- Title: Confidence Sets and Hypothesis Testing in a Likelihood-Free Inference
Setting
- Title(参考訳): 確率-自由推論設定における信頼度集合と仮説検定
- Authors: Niccol\`o Dalmasso and Rafael Izbicki and Ann B. Lee
- Abstract要約: $texttACORE$ は LFI に対する頻繁なアプローチであり、最初はパラメータ化された分類問題として古典的確率比テスト (LRT) を定式化する。
$texttACORE$は、統計学、テストの拒絶確率、信頼セットのカバレッジが条件分布関数である、というキーオブザーバに基づいている。
- 参考スコア(独自算出の注目度): 5.145741425164947
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Parameter estimation, statistical tests and confidence sets are the
cornerstones of classical statistics that allow scientists to make inferences
about the underlying process that generated the observed data. A key question
is whether one can still construct hypothesis tests and confidence sets with
proper coverage and high power in a so-called likelihood-free inference (LFI)
setting; that is, a setting where the likelihood is not explicitly known but
one can forward-simulate observable data according to a stochastic model. In
this paper, we present $\texttt{ACORE}$ (Approximate Computation via Odds Ratio
Estimation), a frequentist approach to LFI that first formulates the classical
likelihood ratio test (LRT) as a parametrized classification problem, and then
uses the equivalence of tests and confidence sets to build confidence regions
for parameters of interest. We also present a goodness-of-fit procedure for
checking whether the constructed tests and confidence regions are valid.
$\texttt{ACORE}$ is based on the key observation that the LRT statistic, the
rejection probability of the test, and the coverage of the confidence set are
conditional distribution functions which often vary smoothly as a function of
the parameters of interest. Hence, instead of relying solely on samples
simulated at fixed parameter settings (as is the convention in standard Monte
Carlo solutions), one can leverage machine learning tools and data simulated in
the neighborhood of a parameter to improve estimates of quantities of interest.
We demonstrate the efficacy of $\texttt{ACORE}$ with both theoretical and
empirical results. Our implementation is available on Github.
- Abstract(参考訳): パラメータ推定、統計テスト、信頼セットは、科学者が観測されたデータを生成する基礎となるプロセスについて推測できる古典的な統計の基盤である。
重要な疑問は、いわゆるlfi設定において、適切なカバレッジと高いパワーで仮説テストと信頼セットを構築できるかどうかである。つまり、確率が明示的に知られていないが、確率モデルに従って観測可能なデータを前方にシミュレーションできるような設定である。
本稿では、古典的確率比検定(LRT)をパラメトリズド分類問題として定式化し、次に、テストと信頼セットの同値性を用いて、興味のあるパラメータの信頼領域を構築するLFIに対する頻繁なアプローチである$\texttt{ACORE}$を提案する。
また、構築されたテストと信頼領域が有効かどうかを確認するための適度な手順も提示する。
$\texttt{acore}$ は lrt の統計値、テストの拒絶確率、信頼度集合のカバレッジが条件分布関数であり、しばしば興味のあるパラメータの関数としてスムーズに変化するという重要な観察に基づいている。
したがって、固定パラメータ設定でシミュレーションされたサンプルのみに頼るのではなく(標準モンテカルロソリューションの慣例)、パラメータの近傍でシミュレーションされた機械学習ツールとデータを活用して、関心量の見積もりを改善することができる。
理論的および経験的結果の両方で$\texttt{ACORE}$の有効性を示す。
実装はgithubから入手できます。
関連論文リスト
- Finite Sample Confidence Regions for Linear Regression Parameters Using
Arbitrary Predictors [1.6860963320038902]
線形モデルのパラメータに対する信頼領域を構築するための新しい手法を任意の予測器からの予測を用いて検討する。
導出された信頼領域は、混合線形プログラミングフレームワーク内の制約としてキャストすることができ、線形目的の最適化を可能にする。
従来の手法とは異なり、信頼領域は空であり、仮説テストに使用できる。
論文 参考訳(メタデータ) (2024-01-27T00:15:48Z) - Online non-parametric likelihood-ratio estimation by Pearson-divergence
functional minimization [55.98760097296213]
iid 観測のペア $(x_t sim p, x'_t sim q)$ が時間の経過とともに観測されるような,オンラインな非パラメトリック LRE (OLRE) のための新しいフレームワークを提案する。
本稿では,OLRE法の性能に関する理論的保証と,合成実験における実証的検証について述べる。
論文 参考訳(メタデータ) (2023-11-03T13:20:11Z) - SMURF-THP: Score Matching-based UnceRtainty quantiFication for
Transformer Hawkes Process [76.98721879039559]
SMURF-THPは,変圧器ホークス過程を学習し,予測の不確かさを定量化するスコアベース手法である。
具体的には、SMURF-THPは、スコアマッチング目標に基づいて、イベントの到着時刻のスコア関数を学習する。
我々は,イベントタイプ予測と到着時刻の不確実性定量化の両方において,広範な実験を行う。
論文 参考訳(メタデータ) (2023-10-25T03:33:45Z) - Calibrating Neural Simulation-Based Inference with Differentiable
Coverage Probability [50.44439018155837]
ニューラルモデルのトレーニング目的に直接キャリブレーション項を含めることを提案する。
古典的なキャリブレーション誤差の定式化を緩和することにより、エンドツーエンドのバックプロパゲーションを可能にする。
既存の計算パイプラインに直接適用でき、信頼性の高いブラックボックス後部推論が可能である。
論文 参考訳(メタデータ) (2023-10-20T10:20:45Z) - When Does Confidence-Based Cascade Deferral Suffice? [69.28314307469381]
カスケードは、推論コストをサンプル毎に適応的に変化させる古典的な戦略である。
deferralルールは、シーケンス内の次の分類子を呼び出すか、または予測を終了するかを決定する。
カスケードの構造に執着しているにもかかわらず、信頼に基づく推論は実際は極めてうまく機能することが多い。
論文 参考訳(メタデータ) (2023-07-06T04:13:57Z) - Stable Probability Weighting: Large-Sample and Finite-Sample Estimation
and Inference Methods for Heterogeneous Causal Effects of Multivalued
Treatments Under Limited Overlap [0.0]
異種因果効果を推定・推定するための実用的大サンプルおよび有限サンプル法を提案する。
安定確率重み付け(Stable Probability Weighting)という一般原理を考案する。
また、弱null仮説の一般クラスをテストするための新しい有限サンプル推論手法を提案する。
論文 参考訳(メタデータ) (2023-01-13T18:52:18Z) - Nonparametric Conditional Local Independence Testing [69.31200003384122]
条件付き局所独立は、連続的な時間プロセス間の独立関係である。
条件付き地域独立の非パラメトリックテストは行われていない。
二重機械学習に基づく非パラメトリックテストを提案する。
論文 参考訳(メタデータ) (2022-03-25T10:31:02Z) - Likelihood-Free Frequentist Inference: Bridging Classical Statistics and
Machine Learning for Reliable Simulator-Based Inference [3.9927092855811983]
古典統計学と現代の機械学習を橋渡しする統一的でモジュール化された推論フレームワークを提案する。
我々は、一般のフレームワークを、可能性のない頻繁な推論(LF2I)と呼ぶ。
論文 参考訳(メタデータ) (2021-07-08T15:52:18Z) - Testing for Outliers with Conformal p-values [14.158078752410182]
目標は、新しい独立したサンプルが参照データセットと同じ分布に属するかどうかをテストすることである。
そこで本論文では,p-値が有意であるが,異なるテストポイントに対して互いに依存する,広く適用可能なフレームワークである共形推論に基づく解を提案する。
我々は、これらのp値が正に依存し、正確な誤発見率制御を可能にすることを証明している。
論文 参考訳(メタデータ) (2021-04-16T17:59:21Z) - Robust Validation: Confident Predictions Even When Distributions Shift [24.211408049646153]
本稿では,モデルが点予測ではなく,その予測に対して不確実な推定を行うような,頑健な予測推論の手順について述べる。
本稿では, トレーニング集団の周囲に$f$-divergence のボールを用いて, 任意のテスト分布に対して適切なカバレッジレベルを与える予測セットを生成する手法を提案する。
私たちの方法論の重要な構成要素は、将来のデータシフトの量を見積り、それに対する堅牢性を構築することです。
論文 参考訳(メタデータ) (2020-08-10T17:09:16Z) - Binary Classification from Positive Data with Skewed Confidence [85.18941440826309]
肯定的信頼度(Pconf)分類は、有望な弱教師付き学習法である。
実際には、信頼はアノテーションプロセスで生じるバイアスによって歪められることがある。
本稿では、スキュード信頼度のパラメータ化モデルを導入し、ハイパーパラメータを選択する方法を提案する。
論文 参考訳(メタデータ) (2020-01-29T00:04:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。