論文の概要: Automatic Debiased Learning from Positive, Unlabeled, and Exposure Data
- arxiv url: http://arxiv.org/abs/2303.04797v1
- Date: Wed, 8 Mar 2023 18:45:22 GMT
- ステータス: 処理完了
- システム内更新日: 2023-03-09 12:42:33.826260
- Title: Automatic Debiased Learning from Positive, Unlabeled, and Exposure Data
- Title(参考訳): 正, ラベルなし, 露出データからの自動脱バイアス学習
- Authors: Masahiro Kato, Shuting Wu, Kodai Kureishi, and Shota Yasui
- Abstract要約: 本稿では,正・未ラベルデータ(PU分類)からの二項分類の問題に,正のデータの選択バイアスを伴って対処する。
このシナリオは、レコメンダシステムのような多くの実用的なアプリケーションのための概念的なフレームワークを表している。
本稿では,強い無知性仮定を用いて関心の関数を同定し,ADPUE(Automatic Debiased PUE)学習法を開発する手法を提案する。
- 参考スコア(独自算出の注目度): 11.217084610985674
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We address the issue of binary classification from positive and unlabeled
data (PU classification) with a selection bias in the positive data. During the
observation process, (i) a sample is exposed to a user, (ii) the user then
returns the label for the exposed sample, and (iii) we however can only observe
the positive samples. Therefore, the positive labels that we observe are a
combination of both the exposure and the labeling, which creates a selection
bias problem for the observed positive samples. This scenario represents a
conceptual framework for many practical applications, such as recommender
systems, which we refer to as ``learning from positive, unlabeled, and exposure
data'' (PUE classification). To tackle this problem, we initially assume access
to data with exposure labels. Then, we propose a method to identify the
function of interest using a strong ignorability assumption and develop an
``Automatic Debiased PUE'' (ADPUE) learning method. This algorithm directly
debiases the selection bias without requiring intermediate estimates, such as
the propensity score, which is necessary for other learning methods. Through
experiments, we demonstrate that our approach outperforms traditional PU
learning methods on various semi-synthetic datasets.
- Abstract(参考訳): ポジティブデータとラベルなしデータ(pu分類)から2値分類の問題に対処し,選択バイアスを正値データに有する。
観察の過程で
(i)試料がユーザに露出する。
(ii) ユーザが露出したサンプルのラベルを返却し、
(iii) 正のサンプルしか観察できない。
したがって, 観測した正のラベルは露出とラベルの組合せであり, 観測された正のサンプルの選択バイアス問題を生成する。
このシナリオは、レコメンデータシステムのような、多くの実用的なアプリケーションのための概念的枠組みを表しており、"``learning from positive, unlabeled, and exposure data'(pue分類)と呼ばれる。
この問題に対処するため、私たちはまず、露出ラベル付きデータへのアクセスを想定します。
そこで我々は,強い無知性仮定を用いて関心の関数を同定し,「自動脱バイアスPUE」学習法(ADPUE)を開発する手法を提案する。
このアルゴリズムは、他の学習方法に必要な確率スコアなどの中間推定を必要とせずに、選択バイアスを直接排除する。
実験により,本手法は,様々な半合成データセット上で従来のPU学習手法より優れていることを示した。
関連論文リスト
- Learning with Complementary Labels Revisited: The Selected-Completely-at-Random Setting Is More Practical [66.57396042747706]
補完ラベル学習は、弱教師付き学習問題である。
均一分布仮定に依存しない一貫したアプローチを提案する。
相補的なラベル学習は、負のラベル付きバイナリ分類問題の集合として表現できる。
論文 参考訳(メタデータ) (2023-11-27T02:59:17Z) - Robust Positive-Unlabeled Learning via Noise Negative Sample
Self-correction [48.929877651182885]
正および未ラベルのデータから学ぶことは、文学における正の未ラベル(PU)学習として知られている。
本研究では,人間の学習の性質を動機とした学習戦略を取り入れた,新しい堅牢なPU学習手法を提案する。
論文 参考訳(メタデータ) (2023-08-01T04:34:52Z) - Adaptive Negative Evidential Deep Learning for Open-set Semi-supervised Learning [69.81438976273866]
オープンセット半教師付き学習(Open-set SSL)は、ラベル付きデータ(inliers)で観測されない新しいカテゴリ(outliers)を含むラベル付きデータとテストデータを含む、より実践的なシナリオである。
本研究では,様々な不確かさを定量化するための外乱検出器として顕在的深層学習(EDL)を導入し,自己学習と推論のための異なる不確実性指標を設計する。
Inlierとoutlierの両方を含むラベルなしデータセットに適合するように、新しい適応的負の最適化戦略を提案する。
論文 参考訳(メタデータ) (2023-03-21T09:07:15Z) - Combining Self-labeling with Selective Sampling [2.0305676256390934]
この研究は、選択的サンプリングシナリオにおける自己ラベル技術とアクティブラーニングを組み合わせたものである。
選択したクラスに対してバイアスを課すことにより,自己ラベルの適用がパフォーマンスに悪影響を及ぼすことを示す。
提案手法は,現在の選択的サンプリング手法と一致し,より良い結果が得られる。
論文 参考訳(メタデータ) (2023-01-11T11:58:45Z) - Dist-PU: Positive-Unlabeled Learning from a Label Distribution
Perspective [89.5370481649529]
本稿では,PU学習のためのラベル分布視点を提案する。
そこで本研究では,予測型と基底型のラベル分布間のラベル分布の整合性を追求する。
提案手法の有効性を3つのベンチマークデータセットで検証した。
論文 参考訳(メタデータ) (2022-12-06T07:38:29Z) - Classification from Positive and Biased Negative Data with Skewed
Labeled Posterior Probability [0.0]
正負負の分類問題 (PbN) にアプローチする新しい手法を提案する。
本手法は, 観測データの正の後方確率を表すスキュード信頼による負の影響を補正する手法を組み込んだものである。
論文 参考訳(メタデータ) (2022-03-11T04:31:35Z) - Disentangling Sampling and Labeling Bias for Learning in Large-Output
Spaces [64.23172847182109]
異なる負のサンプリングスキームが支配的ラベルと稀なラベルで暗黙的にトレードオフパフォーマンスを示す。
すべてのラベルのサブセットで作業することで生じるサンプリングバイアスと、ラベルの不均衡に起因するデータ固有のラベルバイアスの両方に明示的に対処する統一された手段を提供する。
論文 参考訳(メタデータ) (2021-05-12T15:40:13Z) - A Novel Perspective for Positive-Unlabeled Learning via Noisy Labels [49.990938653249415]
本研究では,初期疑似ラベルを雑音ラベルデータとして用いる非ラベルデータに割り当て,雑音ラベルデータを用いて深層ニューラルネットワークを訓練する手法を提案する。
実験の結果,提案手法は,いくつかのベンチマークデータセットにおいて,最先端の手法よりも有意に優れていた。
論文 参考訳(メタデータ) (2021-03-08T11:46:02Z) - Learning from Positive and Unlabeled Data with Arbitrary Positive Shift [11.663072799764542]
本稿では,未ラベルデータに対して任意の非表現陽性データであってもPU学習が可能であることを示す。
これを統計的に一貫した2つの手法に統合し、任意の正のバイアスに対処する。
実験により,多数の実世界のデータセットにまたがる手法の有効性が示された。
論文 参考訳(メタデータ) (2020-02-24T13:53:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。