論文の概要: Augmented prediction of a true class for Positive Unlabeled data under selection bias
- arxiv url: http://arxiv.org/abs/2407.10309v1
- Date: Sun, 14 Jul 2024 19:58:01 GMT
- ステータス: 処理完了
- システム内更新日: 2024-07-16 18:39:42.579213
- Title: Augmented prediction of a true class for Positive Unlabeled data under selection bias
- Title(参考訳): 選択バイアス下における正の未ラベルデータに対する真のクラスの拡張予測
- Authors: Jan Mielniczuk, Adam Wawrzeńczyk,
- Abstract要約: 本稿では, 観測時刻をラベル付けした正のアンラベル(PU)データに対して, 新たな観測環境を提案する。
我々は、追加情報は予測に重要であると主張し、このタスクを"Augmented PU prediction"と呼んでいる。
このようなシナリオで経験的ベイズ則のいくつかの変種を導入し、それらの性能について検討する。
- 参考スコア(独自算出の注目度): 0.8594140167290099
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: We introduce a new observational setting for Positive Unlabeled (PU) data where the observations at prediction time are also labeled. This occurs commonly in practice -- we argue that the additional information is important for prediction, and call this task "augmented PU prediction". We allow for labeling to be feature dependent. In such scenario, Bayes classifier and its risk is established and compared with a risk of a classifier which for unlabeled data is based only on predictors. We introduce several variants of the empirical Bayes rule in such scenario and investigate their performance. We emphasise dangers (and ease) of applying classical classification rule in the augmented PU scenario -- due to no preexisting studies, an unaware researcher is prone to skewing the obtained predictions. We conclude that the variant based on recently proposed variational autoencoder designed for PU scenario works on par or better than other considered variants and yields advantage over feature-only based methods in terms of accuracy for unlabeled samples.
- Abstract(参考訳): 本稿では, 観測時刻をラベル付けした正のアンラベル(PU)データに対して, 新たな観測環境を提案する。
これは、一般的には、追加情報は予測に重要であり、このタスクを「拡張PU予測」と呼んでいる。そのようなシナリオでは、ベイズ分類器とそのリスクが確立され、未ラベルのデータが予測子のみに基づいている分類器のリスクと比較される。我々は、これらのシナリオにおいて経験的ベイズ規則のいくつかの変種を導入し、それらの性能を調査する。我々は、拡張PUシナリオに古典的な分類規則を適用する危険性(および容易さ)を強調し、既存の研究がないため、無意識研究者は、得られた予測を解き放つ傾向がある。
PUシナリオ用に最近提案された変分オートエンコーダに基づく変分は、他の検討された変分よりも同等かそれ以上に機能し、ラベルなしサンプルの精度の観点から特徴のみに基づく手法よりも有利である、と結論付けている。
関連論文リスト
- Verifying the Selected Completely at Random Assumption in Positive-Unlabeled Learning [0.7646713951724013]
観測されたデータがSCARの仮定に合致するかどうかを判定するために,比較的単純で計算的に高速なテストを提案する。
本テストは,SCAR ケースに適合する人工ラベルを生成することに基づいて,SCAR の null 仮説の下での試験統計量の分布を模倣することができる。
論文 参考訳(メタデータ) (2024-03-29T20:36:58Z) - Partial-Label Learning with a Reject Option [3.1201323892302444]
本稿では,不確実な予測を拒否できるリジェクションオプションを持つ新しい部分ラベル学習アルゴリズムを提案する。
提案手法は, 競合相手と比較して, 非還元予測の数と精度の最良のトレードオフを提供する。
論文 参考訳(メタデータ) (2024-02-01T13:41:44Z) - Conformal Prediction for Deep Classifier via Label Ranking [29.784336674173616]
コンフォーマル予測(Conformal prediction)は、予測セットを所望のカバレッジ保証で生成する統計フレームワークである。
我々は、$textitSorted Adaptive Prediction Sets$ (SAPS)という新しいアルゴリズムを提案する。
SAPSは最大ソフトマックス確率を除いて全ての確率値を捨てる。
論文 参考訳(メタデータ) (2023-10-10T08:54:14Z) - Calibrated Selective Classification [34.08454890436067]
そこで我々は,「不確か」な不確実性のある例を拒否する手法を提案する。
本稿では,選択的校正モデル学習のためのフレームワークを提案する。そこでは,任意のベースモデルの選択的校正誤差を改善するために,個別のセレクタネットワークを訓練する。
われわれは,複数画像分類と肺癌リスク評価におけるアプローチの実証的効果を実証した。
論文 参考訳(メタデータ) (2022-08-25T13:31:09Z) - Conformal prediction for the design problem [72.14982816083297]
機械学習の現実的な展開では、次にテストすべきデータを選択するために予測アルゴリズムを使用します。
このような設定では、トレーニングデータとテストデータの間には、異なるタイプの分散シフトがある。
このような環境で予測の不確実性を定量化する手法を提案する。
論文 参考訳(メタデータ) (2022-02-08T02:59:12Z) - Taming Overconfident Prediction on Unlabeled Data from Hindsight [50.9088560433925]
ラベルのないデータに対する予測の不確実性を最小化することは、半教師付き学習において優れた性能を達成するための鍵となる要素である。
本稿では,アダプティブシャーニング(Adaptive Sharpening, ADS)と呼ばれる2つのメカニズムを提案する。
ADSは、プラグインにすることで最先端のSSLメソッドを大幅に改善する。
論文 参考訳(メタデータ) (2021-12-15T15:17:02Z) - Positive-Unlabeled Classification under Class-Prior Shift: A
Prior-invariant Approach Based on Density Ratio Estimation [85.75352990739154]
密度比推定に基づく新しいPU分類法を提案する。
提案手法の顕著な利点は、訓練段階においてクラスプライヤを必要としないことである。
論文 参考訳(メタデータ) (2021-07-11T13:36:53Z) - Distribution-free uncertainty quantification for classification under
label shift [105.27463615756733]
2つの経路による分類問題に対する不確実性定量化(UQ)に焦点を当てる。
まず、ラベルシフトはカバレッジとキャリブレーションの低下を示すことでuqを損なうと論じる。
これらの手法を, 理論上, 分散性のない枠組みで検討し, その優れた実用性を示す。
論文 参考訳(メタデータ) (2021-03-04T20:51:03Z) - Balance-Subsampled Stable Prediction [55.13512328954456]
本稿では, 分数分解設計理論に基づく新しいバランスサブサンプル安定予測法を提案する。
設計理論解析により,提案手法は分布シフトによって誘導される予測器間の共起効果を低減できることを示した。
合成および実世界の両方のデータセットに関する数値実験により、BSSPアルゴリズムは未知のテストデータ間で安定した予測を行うためのベースライン法を著しく上回っていることが示された。
論文 参考訳(メタデータ) (2020-06-08T07:01:38Z) - Ambiguity in Sequential Data: Predicting Uncertain Futures with
Recurrent Models [110.82452096672182]
逐次データによる曖昧な予測を扱うために,Multiple hypothesis Prediction(MHP)モデルの拡張を提案する。
また、不確実性を考慮するのに適した曖昧な問題に対する新しい尺度も導入する。
論文 参考訳(メタデータ) (2020-03-10T09:15:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。