論文の概要: Classification under Nuisance Parameters and Generalized Label Shift in
Likelihood-Free Inference
- arxiv url: http://arxiv.org/abs/2402.05330v1
- Date: Thu, 8 Feb 2024 00:12:18 GMT
- ステータス: 処理完了
- システム内更新日: 2024-02-09 16:56:24.785144
- Title: Classification under Nuisance Parameters and Generalized Label Shift in
Likelihood-Free Inference
- Title(参考訳): 確率自由推論におけるニュアサンスパラメータと一般化ラベルシフトに基づく分類
- Authors: Luca Masserano, Alex Shen, Michele Doro, Tommaso Dorigo, Rafael
Izbicki, Ann B. Lee
- Abstract要約: 本稿では,不確実性定量化のための新しい手法を提案する。
提案手法は,ドメイン適応能力を持つ事前学習型分類器を効果的に提供し,高出力を維持しながら有効な予測セットを返却する。
現実的な力学モデルから得られたデータを用いて、生物学と天体物理学における2つの挑戦的な科学的問題に対して、その性能を実証する。
- 参考スコア(独自算出の注目度): 3.7166121807265053
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: An open scientific challenge is how to classify events with reliable measures
of uncertainty, when we have a mechanistic model of the data-generating process
but the distribution over both labels and latent nuisance parameters is
different between train and target data. We refer to this type of
distributional shift as generalized label shift (GLS). Direct classification
using observed data $\mathbf{X}$ as covariates leads to biased predictions and
invalid uncertainty estimates of labels $Y$. We overcome these biases by
proposing a new method for robust uncertainty quantification that casts
classification as a hypothesis testing problem under nuisance parameters. The
key idea is to estimate the classifier's receiver operating characteristic
(ROC) across the entire nuisance parameter space, which allows us to devise
cutoffs that are invariant under GLS. Our method effectively endows a
pre-trained classifier with domain adaptation capabilities and returns valid
prediction sets while maintaining high power. We demonstrate its performance on
two challenging scientific problems in biology and astroparticle physics with
data from realistic mechanistic models.
- Abstract(参考訳): オープン・サイエンティフィック・チャレンジは、データ生成過程の機械論的モデルがあるが、ラベルと潜在ニュアサンスパラメータの分布が列車とターゲットデータで異なる場合、不確実性の信頼できる尺度でイベントを分類する方法である。
このタイプの分布シフトを一般化ラベルシフト(GLS)と呼ぶ。
観測データ$\mathbf{x}$を共変量として用いた直接分類は、バイアス付き予測とラベルの不正不確実性推定に繋がる。
これらのバイアスを克服するために, ニュアサンスパラメータ下での仮説検定問題としてキャスト分類を適用できる新しいロバスト不確実性定量化法を提案する。
鍵となる考え方は、Nuisanceパラメータ空間全体にわたって分類器の受信動作特性(ROC)を推定することであり、GLSの下で不変なカットオフを考案することができる。
提案手法は,ドメイン適応能力を持つ事前学習型分類器を効果的に提供し,高い出力を維持しながら有効な予測セットを返す。
現実的な力学モデルから得られたデータを用いて、生物学と天体物理学における2つの挑戦的な科学的問題にその性能を実証する。
関連論文リスト
- Probabilistic Safety Regions Via Finite Families of Scalable Classifiers [2.431537995108158]
監視された分類は、データのパターンを認識して、振る舞いのクラスを分離する。
正準解は、機械学習の数値近似の性質に固有の誤分類誤差を含む。
本稿では,確率論的安全性領域の概念を導入し,入力空間のサブセットとして,誤分類されたインスタンスの数を確率論的に制御する手法を提案する。
論文 参考訳(メタデータ) (2023-09-08T22:40:19Z) - Variational Classification [51.2541371924591]
我々は,変分オートエンコーダの訓練に用いるエビデンスローバウンド(ELBO)に類似した,モデルの訓練を目的とした変分目的を導出する。
軟質マックス層への入力を潜伏変数のサンプルとして扱うことで, 抽象化された視点から, 潜在的な矛盾が明らかとなった。
我々は、標準ソフトマックス層に見られる暗黙の仮定の代わりに、選択された潜在分布を誘導する。
論文 参考訳(メタデータ) (2023-05-17T17:47:19Z) - Leveraging Unlabeled Data to Predict Out-of-Distribution Performance [63.740181251997306]
実世界の機械学習デプロイメントは、ソース(トレーニング)とターゲット(テスト)ディストリビューションのミスマッチによって特徴づけられる。
本研究では,ラベル付きソースデータとラベルなしターゲットデータのみを用いて,対象領域の精度を予測する手法を検討する。
本稿では,モデルの信頼度をしきい値として学習し,精度をラベルなし例のごく一部として予測する実践的手法である平均閾値保持信頼度(ATC)を提案する。
論文 参考訳(メタデータ) (2022-01-11T23:01:12Z) - Training on Test Data with Bayesian Adaptation for Covariate Shift [96.3250517412545]
ディープニューラルネットワークは、信頼できない不確実性推定で不正確な予測を行うことが多い。
分布シフトの下でのラベルなし入力とモデルパラメータとの明確に定義された関係を提供するベイズモデルを導出する。
本手法は精度と不確実性の両方を向上することを示す。
論文 参考訳(メタデータ) (2021-09-27T01:09:08Z) - Classification and Uncertainty Quantification of Corrupted Data using
Semi-Supervised Autoencoders [11.300365160909879]
本稿では,強い破損したデータを分類し,不確実性を定量化する確率論的手法を提案する。
破損しないデータに基づいてトレーニングされた半教師付きオートエンコーダが基盤となるアーキテクチャである。
モデルの不確実性は、その分類が正しいか間違っているかに強く依存していることを示す。
論文 参考訳(メタデータ) (2021-05-27T18:47:55Z) - Distribution-free uncertainty quantification for classification under
label shift [105.27463615756733]
2つの経路による分類問題に対する不確実性定量化(UQ)に焦点を当てる。
まず、ラベルシフトはカバレッジとキャリブレーションの低下を示すことでuqを損なうと論じる。
これらの手法を, 理論上, 分散性のない枠組みで検討し, その優れた実用性を示す。
論文 参考訳(メタデータ) (2021-03-04T20:51:03Z) - Unlabelled Data Improves Bayesian Uncertainty Calibration under
Covariate Shift [100.52588638477862]
後続正則化に基づく近似ベイズ推定法を開発した。
前立腺癌の予後モデルを世界規模で導入する上で,本手法の有用性を実証する。
論文 参考訳(メタデータ) (2020-06-26T13:50:19Z) - Certified Robustness to Label-Flipping Attacks via Randomized Smoothing [105.91827623768724]
機械学習アルゴリズムは、データ中毒攻撃の影響を受けやすい。
任意の関数に対するランダム化スムージングの統一的なビューを示す。
本稿では,一般的なデータ中毒攻撃に対して,ポイントワイズで確実に堅牢な分類器を構築するための新しい戦略を提案する。
論文 参考訳(メタデータ) (2020-02-07T21:28:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。