論文の概要: Learning from Positive and Unlabeled Data with Arbitrary Positive Shift
- arxiv url: http://arxiv.org/abs/2002.10261v4
- Date: Mon, 9 Nov 2020 12:20:05 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-29 03:12:42.469143
- Title: Learning from Positive and Unlabeled Data with Arbitrary Positive Shift
- Title(参考訳): 任意正のシフトによる正・未ラベルデータからの学習
- Authors: Zayd Hammoudeh and Daniel Lowd
- Abstract要約: 本稿では,未ラベルデータに対して任意の非表現陽性データであってもPU学習が可能であることを示す。
これを統計的に一貫した2つの手法に統合し、任意の正のバイアスに対処する。
実験により,多数の実世界のデータセットにまたがる手法の有効性が示された。
- 参考スコア(独自算出の注目度): 11.663072799764542
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Positive-unlabeled (PU) learning trains a binary classifier using only
positive and unlabeled data. A common simplifying assumption is that the
positive data is representative of the target positive class. This assumption
rarely holds in practice due to temporal drift, domain shift, and/or
adversarial manipulation. This paper shows that PU learning is possible even
with arbitrarily non-representative positive data given unlabeled data from the
source and target distributions. Our key insight is that only the negative
class's distribution need be fixed. We integrate this into two statistically
consistent methods to address arbitrary positive bias - one approach combines
negative-unlabeled learning with unlabeled-unlabeled learning while the other
uses a novel, recursive risk estimator. Experimental results demonstrate our
methods' effectiveness across numerous real-world datasets and forms of
positive bias, including disjoint positive class-conditional supports.
Additionally, we propose a general, simplified approach to address PU risk
estimation overfitting.
- Abstract(参考訳): Positive-Unlabeled (PU) 学習は、正および未ラベルのデータのみを使用してバイナリ分類器を訓練する。
一般的な単純化の前提は、正のデータが対象の正のクラスを表すことである。
この仮定は、時間的ドリフト、ドメインシフト、および/または逆操作のために、現実にはめったに当てはまらない。
本稿では,未ラベルデータと対象分布の任意の非表現正データであってもPU学習が可能であることを示す。
私たちの重要な洞察は、負のクラスの分布のみを固定する必要があるということです。
1つのアプローチは負のラベルのない学習とラベルなしの学習を組み合わせたもので、もう1つは新しい再帰的リスク推定器を使っています。
実験の結果,実世界のデータセットと正のバイアスの形式にまたがって提案手法の有効性が実証された。
さらに,puリスク推定のオーバーフィットに対処するための,汎用的で簡易なアプローチを提案する。
関連論文リスト
- PUAL: A Classifier on Trifurcate Positive-Unlabeled Data [29.617810881312867]
非対称損失(PUAL)を有するPU分類器を提案する。
我々は、PUALが非線形決定境界を得ることを可能にするカーネルベースのアルゴリズムを開発した。
シミュレーションと実世界の両方のデータセットの実験を通して、PUALはトリフルケートデータの良好な分類を実現できることを示す。
論文 参考訳(メタデータ) (2024-05-31T16:18:06Z) - Contrastive Learning with Negative Sampling Correction [52.990001829393506]
PUCL(Positive-Unlabeled Contrastive Learning)という新しいコントラスト学習手法を提案する。
PUCLは生成した負のサンプルをラベルのないサンプルとして扱い、正のサンプルからの情報を用いて、対照的な損失のバイアスを補正する。
PUCLは一般的なコントラスト学習問題に適用でき、様々な画像やグラフの分類タスクにおいて最先端の手法より優れている。
論文 参考訳(メタデータ) (2024-01-13T11:18:18Z) - Joint empirical risk minimization for instance-dependent
positive-unlabeled data [4.112909937203119]
正とラベルなしのデータ(PU学習)からの学習は、機械学習のタスクとして積極的に研究されている。
目標は、ラベル付きインスタンスとラベルなしインスタンスの一部を含むデータセットに基づいて、バイナリ分類モデルをトレーニングすることだ。
ラベルなし集合は、残りの部分の正と全ての負の観察を含む。
論文 参考訳(メタデータ) (2023-12-27T12:45:12Z) - Learning with Complementary Labels Revisited: The Selected-Completely-at-Random Setting Is More Practical [66.57396042747706]
補完ラベル学習は、弱教師付き学習問題である。
均一分布仮定に依存しない一貫したアプローチを提案する。
相補的なラベル学習は、負のラベル付きバイナリ分類問題の集合として表現できる。
論文 参考訳(メタデータ) (2023-11-27T02:59:17Z) - Robust Positive-Unlabeled Learning via Noise Negative Sample
Self-correction [48.929877651182885]
正および未ラベルのデータから学ぶことは、文学における正の未ラベル(PU)学習として知られている。
本研究では,人間の学習の性質を動機とした学習戦略を取り入れた,新しい堅牢なPU学習手法を提案する。
論文 参考訳(メタデータ) (2023-08-01T04:34:52Z) - Automatic Debiased Learning from Positive, Unlabeled, and Exposure Data [11.217084610985674]
本稿では,正・未ラベルデータ(PU分類)からの二項分類の問題に,正のデータの選択バイアスを伴って対処する。
このシナリオは、レコメンダシステムのような多くの実用的なアプリケーションのための概念的なフレームワークを表している。
本稿では,強い無知性仮定を用いて関心の関数を同定し,ADPUE(Automatic Debiased PUE)学習法を開発する手法を提案する。
論文 参考訳(メタデータ) (2023-03-08T18:45:22Z) - Dist-PU: Positive-Unlabeled Learning from a Label Distribution
Perspective [89.5370481649529]
本稿では,PU学習のためのラベル分布視点を提案する。
そこで本研究では,予測型と基底型のラベル分布間のラベル分布の整合性を追求する。
提案手法の有効性を3つのベンチマークデータセットで検証した。
論文 参考訳(メタデータ) (2022-12-06T07:38:29Z) - Classification from Positive and Biased Negative Data with Skewed
Labeled Posterior Probability [0.0]
正負負の分類問題 (PbN) にアプローチする新しい手法を提案する。
本手法は, 観測データの正の後方確率を表すスキュード信頼による負の影響を補正する手法を組み込んだものである。
論文 参考訳(メタデータ) (2022-03-11T04:31:35Z) - A Novel Perspective for Positive-Unlabeled Learning via Noisy Labels [49.990938653249415]
本研究では,初期疑似ラベルを雑音ラベルデータとして用いる非ラベルデータに割り当て,雑音ラベルデータを用いて深層ニューラルネットワークを訓練する手法を提案する。
実験の結果,提案手法は,いくつかのベンチマークデータセットにおいて,最先端の手法よりも有意に優れていた。
論文 参考訳(メタデータ) (2021-03-08T11:46:02Z) - MixPUL: Consistency-based Augmentation for Positive and Unlabeled
Learning [8.7382177147041]
本稿では, 整合性正規化に基づく簡易かつ効果的なデータ拡張手法である coinedalgo を提案する。
アルゴインコーポレートは、拡張データを生成するために、教師付きおよび教師なしの一貫性トレーニングを行う。
我々は,CIFAR-10データセットの分類誤差を16.49から13.09まで,それぞれ異なる正のデータ量で平均的に改善したことを示す。
論文 参考訳(メタデータ) (2020-04-20T15:43:33Z) - On Positive-Unlabeled Classification in GAN [130.43248168149432]
本稿では,標準GANに対する肯定的かつ未ラベルの分類問題を定義する。
その後、GANにおける差別者の訓練を安定させる新しい手法が導かれる。
論文 参考訳(メタデータ) (2020-02-04T05:59:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。