論文の概要: Estimating prevalence with precision and accuracy
- arxiv url: http://arxiv.org/abs/2507.06061v1
- Date: Tue, 08 Jul 2025 15:06:02 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-09 16:34:38.242146
- Title: Estimating prevalence with precision and accuracy
- Title(参考訳): 精度と精度で精度を推定する
- Authors: Aime Bienfait Igiraneza, Christophe Fraser, Robert Hinch,
- Abstract要約: 有病率推定における2つの主な課題は、トレーニングデータセットの有病率による偏りの調整と、その推定の不確かさの定量化である。
精度(すなわち、信頼区間の幅)とカバレッジ(すなわち、信頼区間が十分に校正されている)の点で、どのアプローチが理想的なのかは明らかでない。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Unlike classification, whose goal is to estimate the class of each data point in a dataset, prevalence estimation or quantification is a task that aims to estimate the distribution of classes in a dataset. The two main tasks in prevalence estimation are to adjust for bias, due to the prevalence in the training dataset, and to quantify the uncertainty in the estimate. The standard methods used to quantify uncertainty in prevalence estimates are bootstrapping and Bayesian quantification methods. It is not clear which approach is ideal in terms of precision (i.e. the width of confidence intervals) and coverage (i.e. the confidence intervals being well-calibrated). Here, we propose Precise Quantifier (PQ), a Bayesian quantifier that is more precise than existing quantifiers and with well-calibrated coverage. We discuss the theory behind PQ and present experiments based on simulated and real-world datasets. Through these experiments, we establish the factors which influence quantification precision: the discriminatory power of the underlying classifier; the size of the labeled dataset used to train the quantifier; and the size of the unlabeled dataset for which prevalence is estimated. Our analysis provides deep insights into uncertainty quantification for quantification learning.
- Abstract(参考訳): データセット内の各データポイントのクラスを推定することを目的としている分類とは異なり、有病率推定または定量化はデータセット内のクラスの分布を推定することを目的としたタスクである。
有病率推定における2つの主な課題は、トレーニングデータセットの有病率によるバイアスの調整と、その推定の不確かさの定量化である。
有病率推定の不確実性を定量化する標準的な方法は、ブートストラップ法とベイズ量化法である。
精度(すなわち、信頼区間の幅)とカバレッジ(すなわち、信頼区間が十分に校正されている)の点で、どのアプローチが理想的なのかは明らかでない。
本稿では,既存の量化器よりも精度の高いベイズ量化器である精密量化器(PQ)を提案する。
PQの背後にある理論と、シミュレーションと実世界のデータセットに基づく実験について論じる。
これらの実験を通じて、定量化精度に影響を与える要因、基礎となる分類器の識別能力、定量化器の訓練に用いるラベル付きデータセットのサイズ、精度を推定するラベル付きデータセットのサイズを確立する。
我々の分析は、定量化学習のための不確実性定量化に関する深い洞察を提供する。
関連論文リスト
- Provably Reliable Conformal Prediction Sets in the Presence of Data Poisoning [53.42244686183879]
コンフォーマル予測は、モデルに依存しない、分布のない不確実性定量化を提供する。
しかし、敵が訓練データと校正データを操作した場合の毒殺攻撃では、共形予測は信頼性が低い。
信頼性予測セット (RPS): 汚染下での信頼性保証を証明可能な共形予測セットを構築するための最初の効率的な方法を提案する。
論文 参考訳(メタデータ) (2024-10-13T15:37:11Z) - Trustworthy Classification through Rank-Based Conformal Prediction Sets [9.559062601251464]
本稿では,分類モデルに適したランクベーススコア関数を用いた新しいコンフォメーション予測手法を提案する。
提案手法は,そのサイズを管理しながら,所望のカバレッジ率を達成する予測セットを構築する。
コントリビューションには、新しい共形予測法、理論的解析、経験的評価が含まれる。
論文 参考訳(メタデータ) (2024-07-05T10:43:41Z) - Score Matching-based Pseudolikelihood Estimation of Neural Marked
Spatio-Temporal Point Process with Uncertainty Quantification [59.81904428056924]
我々は、不確実な定量化を伴うmarkPsを学習するためのスコアMAtching推定器であるSMASHを紹介する。
具体的には,スコアマッチングによるマークPsの擬似的類似度を推定することにより,正規化自由度を推定する。
提案手法の優れた性能は、事象予測と不確実性定量化の両方において広範な実験によって実証される。
論文 参考訳(メタデータ) (2023-10-25T02:37:51Z) - DBCal: Density Based Calibration of classifier predictions for
uncertainty quantification [0.0]
本稿では,機械学習手法を用いて予測の不確かさを定量化する手法を提案する。
提案手法は,2つのニューラルネットワークの出力が正しい確率を正確に推定する。
論文 参考訳(メタデータ) (2022-04-01T01:03:41Z) - Dense Uncertainty Estimation [62.23555922631451]
本稿では,ニューラルネットワークと不確実性推定手法について検討し,正確な決定論的予測と確実性推定の両方を実現する。
本研究では,アンサンブルに基づく手法と生成モデルに基づく手法の2つの不確実性推定法について検討し,それらの長所と短所を,完全/半端/弱度に制御されたフレームワークを用いて説明する。
論文 参考訳(メタデータ) (2021-10-13T01:23:48Z) - Minimising quantifier variance under prior probability shift [2.1320960069210475]
テストデータセットの分布における特徴に対して,クラスラベルの回帰に対するブライアスコアの関数であることが判明した。
この観察結果から,学習データセット上での基底分類器の精度の最適化は,テストデータセット上での関連量化器のばらつきを低減するのに役立つことが示唆された。
論文 参考訳(メタデータ) (2021-07-17T09:28:06Z) - Estimation and Applications of Quantiles in Deep Binary Classification [0.0]
チェック損失に基づく量子回帰は統計学において広く使われている推論パラダイムである。
二項分類設定におけるチェック損失の類似について考察する。
我々は、予測が信頼できるかどうかを判断するために使用できる個別信頼度スコアを開発する。
論文 参考訳(メタデータ) (2021-02-09T07:07:42Z) - Unlabelled Data Improves Bayesian Uncertainty Calibration under
Covariate Shift [100.52588638477862]
後続正則化に基づく近似ベイズ推定法を開発した。
前立腺癌の予後モデルを世界規模で導入する上で,本手法の有用性を実証する。
論文 参考訳(メタデータ) (2020-06-26T13:50:19Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。