論文の概要: Combining Self-labeling with Selective Sampling
- arxiv url: http://arxiv.org/abs/2301.04420v1
- Date: Wed, 11 Jan 2023 11:58:45 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-12 17:21:01.734276
- Title: Combining Self-labeling with Selective Sampling
- Title(参考訳): 自己ラベルと選択的サンプリングを組み合わせる
- Authors: J\k{e}drzej Kozal, Micha{\l} Wo\'zniak
- Abstract要約: この研究は、選択的サンプリングシナリオにおける自己ラベル技術とアクティブラーニングを組み合わせたものである。
選択したクラスに対してバイアスを課すことにより,自己ラベルの適用がパフォーマンスに悪影響を及ぼすことを示す。
提案手法は,現在の選択的サンプリング手法と一致し,より良い結果が得られる。
- 参考スコア(独自算出の注目度): 2.0305676256390934
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Since data is the fuel that drives machine learning models, and access to
labeled data is generally expensive, semi-supervised methods are constantly
popular. They enable the acquisition of large datasets without the need for too
many expert labels. This work combines self-labeling techniques with active
learning in a selective sampling scenario. We propose a new method that builds
an ensemble classifier. Based on an evaluation of the inconsistency of the
decisions of the individual base classifiers for a given observation, a
decision is made on whether to request a new label or use the self-labeling. In
preliminary studies, we show that naive application of self-labeling can harm
performance by introducing bias towards selected classes and consequently lead
to skewed class distribution. Hence, we also propose mechanisms to reduce this
phenomenon. Experimental evaluation shows that the proposed method matches
current selective sampling methods or achieves better results.
- Abstract(参考訳): データは機械学習モデルを動かす燃料であり、ラベル付きデータへのアクセスは一般的に高価であるため、半教師付き手法が常に人気である。
専門家のラベルを多すぎる必要なしに、大規模なデータセットの取得を可能にする。
この研究は、選択的サンプリングシナリオにおける自己ラベル技術とアクティブラーニングを組み合わせる。
アンサンブル分類器を構築する新しい手法を提案する。
与えられた観察のために、個々のベース分類器の判断の不一致を評価することにより、新しいラベルをリクエストするか、あるいは自己ラベルを使用するかを判断する。
予備研究では,選択したクラスに偏りを導入することで,自己ラベルの適用が性能を損なうことを示し,その結果,スキュードクラス分布につながることを示した。
したがって,この現象を低減させる機構も提案する。
実験により, 提案手法が現在の選択的サンプリング法に適合するか, 良好な結果を得たことを示す。
関連論文リスト
- Multi-Label Adaptive Batch Selection by Highlighting Hard and Imbalanced Samples [9.360376286221943]
本稿では,多ラベル深層学習モデルに適した適応バッチ選択アルゴリズムを提案する。
提案手法は, ランダムなバッチ選択よりも高速に収束し, 性能が向上する。
論文 参考訳(メタデータ) (2024-03-27T02:00:18Z) - Virtual Category Learning: A Semi-Supervised Learning Method for Dense
Prediction with Extremely Limited Labels [63.16824565919966]
本稿では,ラベルの修正を伴わずに,混乱したサンプルを積極的に使用することを提案する。
仮想カテゴリー(VC)は、モデルの最適化に安全に貢献できるように、各混乱したサンプルに割り当てられる。
私たちの興味深い発見は、密集した視覚タスクにおけるVC学習の利用に注目しています。
論文 参考訳(メタデータ) (2023-12-02T16:23:52Z) - Learning with Complementary Labels Revisited: The Selected-Completely-at-Random Setting Is More Practical [66.57396042747706]
補完ラベル学習は、弱教師付き学習問題である。
均一分布仮定に依存しない一貫したアプローチを提案する。
相補的なラベル学習は、負のラベル付きバイナリ分類問題の集合として表現できる。
論文 参考訳(メタデータ) (2023-11-27T02:59:17Z) - Class-Distribution-Aware Pseudo Labeling for Semi-Supervised Multi-Label
Learning [97.88458953075205]
Pseudo-labelingは、ラベルなしデータを利用するための人気で効果的なアプローチとして登場した。
本稿では,クラスアウェアの擬似ラベル処理を行うCAP(Class-Aware Pseudo-Labeling)という新しい手法を提案する。
論文 参考訳(メタデータ) (2023-05-04T12:52:18Z) - Automatic Debiased Learning from Positive, Unlabeled, and Exposure Data [11.217084610985674]
本稿では,正・未ラベルデータ(PU分類)からの二項分類の問題に,正のデータの選択バイアスを伴って対処する。
このシナリオは、レコメンダシステムのような多くの実用的なアプリケーションのための概念的なフレームワークを表している。
本稿では,強い無知性仮定を用いて関心の関数を同定し,ADPUE(Automatic Debiased PUE)学習法を開発する手法を提案する。
論文 参考訳(メタデータ) (2023-03-08T18:45:22Z) - Dist-PU: Positive-Unlabeled Learning from a Label Distribution
Perspective [89.5370481649529]
本稿では,PU学習のためのラベル分布視点を提案する。
そこで本研究では,予測型と基底型のラベル分布間のラベル分布の整合性を追求する。
提案手法の有効性を3つのベンチマークデータセットで検証した。
論文 参考訳(メタデータ) (2022-12-06T07:38:29Z) - Exploiting Diversity of Unlabeled Data for Label-Efficient
Semi-Supervised Active Learning [57.436224561482966]
アクティブラーニング(英: Active Learning)は、ラベリングのための最も重要なサンプルを選択することで、高価なラベリングの問題に対処する研究分野である。
アクティブな学習環境における初期ラベル付けのための最も情報性の高いサンプル群を選択するために,多様性に基づく新しい初期データセット選択アルゴリズムを提案する。
また、一貫性に基づく埋め込みの多様性に基づくサンプリングを用いた、新しいアクティブな学習クエリ戦略を提案する。
論文 参考訳(メタデータ) (2022-07-25T16:11:55Z) - LOPS: Learning Order Inspired Pseudo-Label Selection for Weakly
Supervised Text Classification [28.37907856670151]
擬似ラベルは性質上ノイズが多いため、正しいラベルを選択すると性能が向上する可能性がある。
本稿では,サンプルの学習順序を考慮に入れた新しい擬似ラベル選択手法LOPSを提案する。
LOPSは、既存の弱い教師付きテキスト分類手法のほとんどに対して、強力なパフォーマンスブーストプラグインと見なすことができる。
論文 参考訳(メタデータ) (2022-05-25T06:46:48Z) - Self-Training: A Survey [5.772546394254112]
半教師付きアルゴリズムは、ラベル付き観測の小さなセットとラベルなし観測の大きなセットから予測関数を学習することを目的としている。
近年,自己学習手法が注目されていることは確かである。
本稿では,バイナリクラスとマルチクラス分類のための自己学習手法と,その変種と関連する2つのアプローチを提案する。
論文 参考訳(メタデータ) (2022-02-24T11:40:44Z) - Minimax Active Learning [61.729667575374606]
アクティブラーニングは、人間のアノテーションによってラベル付けされる最も代表的なサンプルをクエリすることによって、ラベル効率の高いアルゴリズムを開発することを目指している。
現在のアクティブラーニング技術は、最も不確実なサンプルを選択するためにモデルの不確実性に頼るか、クラスタリングを使うか、最も多様なラベルのないサンプルを選択するために再構築する。
我々は,不確実性と多様性を両立させる半教師付きミニマックスエントロピーに基づく能動学習アルゴリズムを開発した。
論文 参考訳(メタデータ) (2020-12-18T19:03:40Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。