論文の概要: Beyond Cats and Dogs: Semi-supervised Classification of fuzzy labels
with overclustering
- arxiv url: http://arxiv.org/abs/2012.01768v1
- Date: Thu, 3 Dec 2020 08:54:25 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-23 14:56:03.282967
- Title: Beyond Cats and Dogs: Semi-supervised Classification of fuzzy labels
with overclustering
- Title(参考訳): 猫と犬を超えて:過剰クラスタリングによるファジィラベルの半教師付き分類
- Authors: Lars Schmarje and Johannes Br\"unger and Monty Santarossa and
Simon-Martin Schr\"oder and Rainer Kiko and Reinhard Koch
- Abstract要約: ファジィラベルの半教師付き分類を扱うための新しいフレームワークを提案する。
本フレームワークは,これらのファジィラベルのサブ構造を検出するために,オーバークラスタリング(overclustering)という考え方に基づいている。
- 参考スコア(独自算出の注目度): 1.6392706389599345
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: A long-standing issue with deep learning is the need for large and
consistently labeled datasets. Although the current research in semi-supervised
learning can decrease the required amount of annotated data by a factor of 10
or even more, this line of research still uses distinct classes like cats and
dogs. However, in the real-world we often encounter problems where different
experts have different opinions, thus producing fuzzy labels. We propose a
novel framework for handling semi-supervised classifications of such fuzzy
labels. Our framework is based on the idea of overclustering to detect
substructures in these fuzzy labels. We propose a novel loss to improve the
overclustering capability of our framework and show on the common image
classification dataset STL-10 that it is faster and has better overclustering
performance than previous work. On a real-world plankton dataset, we illustrate
the benefit of overclustering for fuzzy labels and show that we beat previous
state-of-the-art semisupervised methods. Moreover, we acquire 5 to 10% more
consistent predictions of substructures.
- Abstract(参考訳): ディープラーニングの長年の課題は、大規模で一貫性のあるラベル付きデータセットの必要性だ。
半教師あり学習における現在の研究は、注釈付きデータの必要な量を10以上減らすことができるが、それでも猫や犬のような異なるクラスを使っている。
しかし、現実世界では、異なる専門家が異なる意見を持つ問題にしばしば遭遇し、ファジィなラベルを生み出します。
ファジィラベルの半教師付き分類を扱うための新しい枠組みを提案する。
本フレームワークは,これらのファジィラベルのサブ構造を検出するためのオーバークラスタリングの考え方に基づいている。
我々は,このフレームワークのオーバークラスタ機能を改善するための新たな損失を提案し,従来よりも高速かつ優れたオーバークラスタ性能を有する共通画像分類データセットstl-10を提示する。
実世界のプランクトンデータセットでは、ファジィラベルに対するオーバークラスタリングの利点を説明し、従来の最先端の半教師付き手法に勝っていることを示す。
さらに,下位構造のより一貫性のある予測を5~10%獲得する。
関連論文リスト
- Active Generalized Category Discovery [60.69060965936214]
GCD(Generalized Category Discovery)は、新しいクラスと古いクラスの未ラベルのサンプルをクラスタ化するための取り組みである。
我々は,能動的学習の精神を取り入れて,能動的一般化カテゴリー発見(AGCD)という新たな設定を提案する。
提案手法は, 汎用および微粒なデータセット上での最先端性能を実現する。
論文 参考訳(メタデータ) (2024-03-07T07:12:24Z) - Making Binary Classification from Multiple Unlabeled Datasets Almost
Free of Supervision [128.6645627461981]
本稿では,複数ラベル付きデータセットからの2値分類という新たな問題設定を提案する。
MU-OPPOでは、ラベル付けされていないすべてのデータセットのクラスプリエントは不要です。
このフレームワークは,クラス前の推定誤差が小さくなり,バイナリ分類の性能が向上することを示す。
論文 参考訳(メタデータ) (2023-06-12T11:33:46Z) - Parametric Classification for Generalized Category Discovery: A Baseline
Study [70.73212959385387]
Generalized Category Discovery (GCD)は、ラベル付きサンプルから学習した知識を用いて、ラベルなしデータセットで新しいカテゴリを発見することを目的としている。
パラメトリック分類器の故障を調査し,高品質な監視が可能であった場合の過去の設計選択の有効性を検証し,信頼性の低い疑似ラベルを重要課題として同定する。
エントロピー正規化の利点を生かし、複数のGCDベンチマークにおける最先端性能を実現し、未知のクラス数に対して強いロバスト性を示す、単純で効果的なパラメトリック分類法を提案する。
論文 参考訳(メタデータ) (2022-11-21T18:47:11Z) - Spatiotemporal Classification with limited labels using Constrained
Clustering for large datasets [22.117238467818623]
分離可能な表現は、より良い分類能力を持つ教師付きモデルにつながる可能性がある。
ラベルの少ない制約付き損失を使って、より優れた表現を学べる方法を示します。
我々は,ラベルの少ない手法を用いて,ラベルのないデータから新しいラベル付きサンプルを抽出し,より優れた分類につながる教師付き手法を拡張できることを示す。
論文 参考訳(メタデータ) (2022-10-14T05:05:22Z) - Use All The Labels: A Hierarchical Multi-Label Contrastive Learning
Framework [75.79736930414715]
本稿では,すべての利用可能なラベルを活用でき,クラス間の階層的関係を維持できる階層型多言語表現学習フレームワークを提案する。
比較損失に階層的ペナルティを併用し,その階層的制約を強制する。
論文 参考訳(メタデータ) (2022-04-27T21:41:44Z) - Learning from Label Proportions by Learning with Label Noise [30.7933303912474]
ラベル比例(LLP)からの学習は、データポイントをバッグに分類する弱い教師付き分類問題である。
ラベル雑音による学習の低減に基づくLLPに対する理論的基礎的なアプローチを提案する。
このアプローチは、複数のデータセットやアーキテクチャにわたるディープラーニングシナリオにおける経験的パフォーマンスの向上を実証する。
論文 参考訳(メタデータ) (2022-03-04T18:52:21Z) - Semi-Supervised Learning with Taxonomic Labels [42.02670649470055]
細粒度領域で画像分類器を訓練するために,粗い分類ラベルを組み込む手法を提案する。
3つの王国にまたがる810種からなるSemi-iNatデータセットでは、フィラムラベルを組み込むことで、種レベルの分類精度が6%向上する。
本稿では,階層構造に導かれる未ラベル画像の集合から,ロバスト性を改善するための関連データを選択する手法を提案する。
論文 参考訳(メタデータ) (2021-11-23T00:50:25Z) - Fuzzy Overclustering: Semi-Supervised Classification of Fuzzy Labels
with Overclustering and Inverse Cross-Entropy [1.6392706389599345]
ファジィラベルの半教師付き分類を扱うための新しいフレームワークを提案する。
これは、これらのファジィラベルのサブ構造を検出するために、オーバークラスタリング(overclustering)という考え方に基づいている。
本研究では,ファジィラベルを用いた実世界のプランクトンデータに適用した場合,従来の半教師付き手法よりも優れたフレームワークを示す。
論文 参考訳(メタデータ) (2021-10-13T10:50:50Z) - Highly Efficient Representation and Active Learning Framework for
Imbalanced Data and its Application to COVID-19 X-Ray Classification [0.7829352305480284]
胸部X線を分類するためのデータ効率の高い分類および能動的学習フレームワークを提案する。
これは(1)畳み込みニューラルネットワークの教師なし表現学習と(2)ガウス過程法に基づいている。
利用可能なラベルのトレーニングから正確性に到達するには、ラベル付きデータの10%の$simしか必要ありません。
論文 参考訳(メタデータ) (2021-02-25T02:48:59Z) - Are Fewer Labels Possible for Few-shot Learning? [81.89996465197392]
ごく限られたデータとラベルのため、わずかなショット学習は難しい。
近年のBiT (Big Transfer) 研究は、異なる領域における大規模ラベル付きデータセットの事前トレーニングによって、少数ショット学習が大きな恩恵を受けることを示した。
本稿では,ファインチューニングにおけるクラスタリングと固有サンプルの共進化を活かし,ショット学習の削減を図る。
論文 参考訳(メタデータ) (2020-12-10T18:59:29Z) - Structured Prediction with Partial Labelling through the Infimum Loss [85.4940853372503]
弱い監督の目標は、収集コストの安いラベル付け形式のみを使用してモデルを学習できるようにすることである。
これは、各データポイントに対して、実際のものを含むラベルのセットとして、監督がキャストされる不完全なアノテーションの一種です。
本稿では、構造化された予測と、部分的なラベリングを扱うための無限損失の概念に基づく統一的なフレームワークを提供する。
論文 参考訳(メタデータ) (2020-03-02T13:59:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。