論文の概要: SCOD: From Heuristics to Theory
- arxiv url: http://arxiv.org/abs/2403.16916v1
- Date: Mon, 25 Mar 2024 16:36:13 GMT
- ステータス: 処理完了
- システム内更新日: 2024-03-27 20:34:33.672825
- Title: SCOD: From Heuristics to Theory
- Title(参考訳): SCOD:ヒューリスティックスから理論へ
- Authors: Vojtech Franc, Jakub Paplham, Daniel Prusa,
- Abstract要約: 本稿では,不確かさやアウト・オブ・ディストリビューション・サンプルに直面する場合の予測を無視する信頼性のある予測モデルを設計する上での問題に対処する。
SCOD(Out-of-Distribution Data)の存在下では,選択分類に3つの重要な貢献をしている。
- 参考スコア(独自算出の注目度): 4.512926716151403
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This paper addresses the problem of designing reliable prediction models that abstain from predictions when faced with uncertain or out-of-distribution samples - a recently proposed problem known as Selective Classification in the presence of Out-of-Distribution data (SCOD). We make three key contributions to SCOD. Firstly, we demonstrate that the optimal SCOD strategy involves a Bayes classifier for in-distribution (ID) data and a selector represented as a stochastic linear classifier in a 2D space, using i) the conditional risk of the ID classifier, and ii) the likelihood ratio of ID and out-of-distribution (OOD) data as input. This contrasts with suboptimal strategies from current OOD detection methods and the Softmax Information Retaining Combination (SIRC), specifically developed for SCOD. Secondly, we establish that in a distribution-free setting, the SCOD problem is not Probably Approximately Correct learnable when relying solely on an ID data sample. Third, we introduce POSCOD, a simple method for learning a plugin estimate of the optimal SCOD strategy from both an ID data sample and an unlabeled mixture of ID and OOD data. Our empirical results confirm the theoretical findings and demonstrate that our proposed method, POSCOD, out performs existing OOD methods in effectively addressing the SCOD problem.
- Abstract(参考訳): 本稿では,不確かさや不確実性に直面する場合の予測を無視する信頼性のある予測モデルを設計する上での課題について論じる - SCOD(Out-of-distriion Data)の存在下での選択分類(Selective Classification)として知られる最近提案された問題である。
我々はSCODに3つの重要な貢献をしている。
まず、最適SCOD戦略は、分布内(ID)データに対するベイズ分類器と、2次元空間における確率線形分類器として表されるセレクタとが関係していることを示す。
一 ID分類器の条件付リスク及び
二 入力としてのID及びアウト・オブ・ディストリビューション(OOD)データの確率比
これは、SCOD専用に開発された現在のOOD検出方法とSoftmax Information Retaining Combination(SIRC)の亜最適戦略とは対照的である。
第二に、分布のない環境では、SCOD問題は、IDデータサンプルのみに依存する場合、ほぼ正確には学習できない。
第三にPOSCODは、IDデータサンプルと未ラベルの混合IDとOODデータの両方から、最適なSCOD戦略のプラグイン推定を学習する簡単な方法である。
実験結果から,提案手法であるPOSCODが既存のOOD法を有効活用できることが確認された。
関連論文リスト
- Meta-learning for Positive-unlabeled Classification [40.11462237689747]
提案手法は,モデルがPUデータに適用された後のテスト分類リスクを最小限に抑える。
この方法は各インスタンスをニューラルネットワークを使ってタスク固有の空間に埋め込む。
提案手法は1つの実世界のデータセットと3つの実世界のデータセットで既存の手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2024-06-06T01:50:01Z) - Semi-Supervised Object Detection with Uncurated Unlabeled Data for
Remote Sensing Images [16.660668160785615]
半教師付きオブジェクト検出(SSOD)手法は、ラベルのないデータに対して擬似ラベルを生成することでこの問題に対処する。
しかし、現実の状況では、ラベルなしデータセット内の分布外サンプル(OOD)と分布内サンプル(ID)が混在する可能性がある。
未ラベルデータに対するOpen-Set Semi-Supervised Object Detection (OSSOD)を提案する。
論文 参考訳(メタデータ) (2023-10-09T07:59:31Z) - Score-based Source Separation with Applications to Digital Communication
Signals [72.6570125649502]
拡散モデルを用いた重畳音源の分離手法を提案する。
高周波(RF)システムへの応用によって、我々は、基礎となる離散的な性質を持つ情報源に興味を持っている。
提案手法は,最近提案されたスコア蒸留サンプリング方式のマルチソース拡張と見なすことができる。
論文 参考訳(メタデータ) (2023-06-26T04:12:40Z) - Augmenting Softmax Information for Selective Classification with
Out-of-Distribution Data [7.221206118679026]
既存のポストホック法はOOD検出でのみ評価した場合とは大きく異なる性能を示す。
本稿では,特徴に依存しない情報を用いて,ソフトマックスに基づく信頼度を向上するSCOD(Softmax Information Retaining Combination, SIRC)の新たな手法を提案する。
多様なImageNetスケールのデータセットと畳み込みニューラルネットワークアーキテクチャの実験は、SIRCがSCODのベースラインを一貫して一致または上回っていることを示している。
論文 参考訳(メタデータ) (2022-07-15T14:39:57Z) - Distributed Dynamic Safe Screening Algorithms for Sparse Regularization [73.85961005970222]
本稿では,分散動的安全スクリーニング(DDSS)手法を提案し,共有メモリアーキテクチャと分散メモリアーキテクチャにそれぞれ適用する。
提案手法は, 線形収束率を低次複雑度で達成し, 有限個の繰り返しにおいてほとんどすべての不活性な特徴をほぼ確実に除去できることを示す。
論文 参考訳(メタデータ) (2022-04-23T02:45:55Z) - Leveraging Unlabeled Data to Predict Out-of-Distribution Performance [63.740181251997306]
実世界の機械学習デプロイメントは、ソース(トレーニング)とターゲット(テスト)ディストリビューションのミスマッチによって特徴づけられる。
本研究では,ラベル付きソースデータとラベルなしターゲットデータのみを用いて,対象領域の精度を予測する手法を検討する。
本稿では,モデルの信頼度をしきい値として学習し,精度をラベルなし例のごく一部として予測する実践的手法である平均閾値保持信頼度(ATC)を提案する。
論文 参考訳(メタデータ) (2022-01-11T23:01:12Z) - ECOD: Unsupervised Outlier Detection Using Empirical Cumulative
Distribution Functions [12.798256312657136]
外乱検出(英: Outlier detection)とは、一般的なデータ分布から逸脱するデータ点の同定である。
本稿では,ECOD(Empirical-Cumulative-Distribution-based Outlier Detection)について述べる。
論文 参考訳(メタデータ) (2022-01-02T17:28:35Z) - Learning while Respecting Privacy and Robustness to Distributional
Uncertainties and Adversarial Data [66.78671826743884]
分散ロバストな最適化フレームワークはパラメトリックモデルのトレーニングのために検討されている。
目的は、逆操作された入力データに対して頑健なトレーニングモデルを提供することである。
提案されたアルゴリズムは、オーバーヘッドがほとんどない堅牢性を提供する。
論文 参考訳(メタデータ) (2020-07-07T18:25:25Z) - Decomposed Adversarial Learned Inference [118.27187231452852]
我々は,DALI(Decomposed Adversarial Learned Inference)という新しいアプローチを提案する。
DALIは、データ空間とコード空間の両方の事前および条件分布を明示的に一致させる。
MNIST, CIFAR-10, CelebAデータセットにおけるDALIの有効性を検証する。
論文 参考訳(メタデータ) (2020-04-21T20:00:35Z) - Generalized ODIN: Detecting Out-of-distribution Image without Learning
from Out-of-distribution Data [87.61504710345528]
我々は,OoD検出性能を改善しつつ,ニューラルネットワークをOoDデータのチューニングから解放する2つの方法を提案する。
具体的には、信頼性スコアリングと修正された入力前処理法を分離することを提案する。
大規模画像データセットのさらなる解析により、セマンティックシフトと非セマンティックシフトの2種類の分布シフトが有意な差を示すことが示された。
論文 参考訳(メタデータ) (2020-02-26T04:18:25Z) - Towards Out-of-Distribution Detection with Divergence Guarantee in Deep
Generative Models [22.697643259435115]
深層生成モデルは、分布外データ(OOD)に対して、分布内データ(ID)よりも高い確率を割り当てることができる。
フローベースモデルにおける散逸を解析するための定理を証明している。
本稿では,2つのグループ異常検出手法を提案する。
論文 参考訳(メタデータ) (2020-02-09T09:54:12Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。