論文の概要: Simple but Effective Unsupervised Classification for Specified Domain
Images: A Case Study on Fungi Images
- arxiv url: http://arxiv.org/abs/2311.08995v1
- Date: Wed, 15 Nov 2023 14:33:22 GMT
- ステータス: 処理完了
- システム内更新日: 2023-11-16 15:45:20.847421
- Title: Simple but Effective Unsupervised Classification for Specified Domain
Images: A Case Study on Fungi Images
- Title(参考訳): 特定領域画像の単純かつ効果的な教師なし分類:真菌画像の事例研究
- Authors: Zhaocong liu, Fa Zhang, Lin Cheng, Huanxi Deng, Xiaoyan Yang, Zhenyu
Zhang, and Chichun Zhou
- Abstract要約: 高品質なラベル付きデータセットはディープラーニングに不可欠である。
従来の手動のアノテーション手法は高価で非効率である。
3つの重要な概念を持つ教師なしの分類方法を紹介した。
- 参考スコア(独自算出の注目度): 7.725818999035946
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: High-quality labeled datasets are essential for deep learning. Traditional
manual annotation methods are not only costly and inefficient but also pose
challenges in specialized domains where expert knowledge is needed.
Self-supervised methods, despite leveraging unlabeled data for feature
extraction, still require hundreds or thousands of labeled instances to guide
the model for effective specialized image classification. Current unsupervised
learning methods offer automatic classification without prior annotation but
often compromise on accuracy. As a result, efficiently procuring high-quality
labeled datasets remains a pressing challenge for specialized domain images
devoid of annotated data. Addressing this, an unsupervised classification
method with three key ideas is introduced: 1) dual-step feature dimensionality
reduction using a pre-trained model and manifold learning, 2) a voting
mechanism from multiple clustering algorithms, and 3) post-hoc instead of prior
manual annotation. This approach outperforms supervised methods in
classification accuracy, as demonstrated with fungal image data, achieving
94.1% and 96.7% on public and private datasets respectively. The proposed
unsupervised classification method reduces dependency on pre-annotated
datasets, enabling a closed-loop for data classification. The simplicity and
ease of use of this method will also bring convenience to researchers in
various fields in building datasets, promoting AI applications for images in
specialized domains.
- Abstract(参考訳): 高品質なラベル付きデータセットはディープラーニングに不可欠である。
従来の手動アノテーションメソッドはコストと非効率だけでなく、専門家の知識が必要な専門分野にも課題をもたらす。
自己教師付き手法は、特徴抽出にラベル付きデータを活用するが、効果的な特殊画像分類のためのモデルを導くには、数百から数千のラベル付きインスタンスが必要である。
現在の教師なし学習法は、事前アノテーションなしで自動分類を提供するが、精度を損なうことが多い。
結果として、高品質なラベル付きデータセットを効率的に取得することは、注釈付きデータを持たない特殊なドメインイメージにとって、依然として困難な課題である。
これに対処するために,3つの重要なアイデアを用いた教師なし分類法を提案する。
1)事前学習モデルと多様体学習を用いた二段階特徴量次元削減
2)複数のクラスタリングアルゴリズムによる投票機構,及び
3) 以前のマニュアルアノテーションの代わりにポストホック。
このアプローチは、公開データセットとプライベートデータセットでそれぞれ94.1%と96.7%を達成した真菌画像データで示されているように、教師ありの分類精度の方法よりも優れている。
提案する教師なし分類法は,事前注釈付きデータセットへの依存性を低減し,データ分類のためのクローズドループを実現する。
この手法のシンプルさと使いやすさは、データセットの構築、専門領域の画像に対するAIアプリケーションの促進など、さまざまな分野の研究者に利便性をもたらす。
関連論文リスト
- Domain Adaptive Multiple Instance Learning for Instance-level Prediction
of Pathological Images [45.132775668689604]
アノテーションのコストを増大させることなく、ターゲットデータセットの分類性能を向上させるためのタスク設定を提案する。
両手法の監督情報を効果的に組み合わせるために,信頼性の高い擬似ラベルを作成する手法を提案する。
論文 参考訳(メタデータ) (2023-04-07T08:31:06Z) - Out-of-Distribution Detection without Class Labels [29.606812876314386]
異常検出方法は、データセットの正常な振る舞いから逸脱するサンプルを識別する。
現在の方法は、複数のクラスで構成されるがラベルを持たないトレーニングデータに直面すると苦労する。
まず,自己教師付き手法を用いて画像のクラスタ化を行い,各画像のクラスタラベルを取得する。
クラスタラベルによる画像の分類作業において,事前学習した特徴を微調整する。
論文 参考訳(メタデータ) (2021-12-14T18:58:32Z) - AutoNovel: Automatically Discovering and Learning Novel Visual
Categories [138.80332861066287]
本稿では,他のクラスをラベル付けしたイメージコレクションにおける新しいクラス発見問題に対処するため,AutoNovelと呼ばれる新しいアプローチを提案する。
我々はAutoNovelを標準分類ベンチマークで評価し、新しいカテゴリー発見の手法をかなり上回っている。
論文 参考訳(メタデータ) (2021-06-29T11:12:16Z) - SCARF: Self-Supervised Contrastive Learning using Random Feature
Corruption [72.35532598131176]
本稿では,特徴のランダムなサブセットを乱してビューを形成するコントラスト学習手法であるSCARFを提案する。
SCARFは既存の戦略を補完し、オートエンコーダのような代替手段より優れていることを示す。
論文 参考訳(メタデータ) (2021-06-29T08:08:33Z) - Towards Good Practices for Efficiently Annotating Large-Scale Image
Classification Datasets [90.61266099147053]
多数の画像の分類ラベルを収集するための効率的なアノテーション戦略を検討する。
人間のラベリング作業を最小化するための修正とベストプラクティスを提案します。
ImageNet100の125kイメージサブセットのシミュレーション実験では、平均で0.35のアノテーションで80%のトップ-1の精度でアノテートできることが示されている。
論文 参考訳(メタデータ) (2021-04-26T16:29:32Z) - Streaming Self-Training via Domain-Agnostic Unlabeled Images [62.57647373581592]
視覚認識モデル学習の過程を民主化することを目的としたストリーミング自己学習(SST)を提案する。
SSTの鍵となるのは、(1)ドメインに依存しない未ラベル画像により、追加の知識や監督なしにいくつかのラベル付き例でより良いモデルを学ぶことができ、(2)学習は継続的なプロセスであり、学習更新のスケジュールを構築することで行うことができる。
論文 参考訳(メタデータ) (2021-04-07T17:58:39Z) - Semi-supervised Sparse Representation with Graph Regularization for
Image Classification [1.370633147306388]
画像分類のための識別半教師付きスパース表現アルゴリズムを提案する。
提案アルゴリズムは,関連する一般的な手法と比較して優れた性能を示す。
論文 参考訳(メタデータ) (2020-11-11T09:16:48Z) - SCAN: Learning to Classify Images without Labels [73.69513783788622]
機能学習とクラスタリングを分離する2段階のアプローチを提唱する。
表現学習からの自己教師型タスクを用いて意味論的意味のある特徴を得る。
我々は、ImageNet上で有望な結果を得、低データ体制下では、いくつかの半教師付き学習方法より優れています。
論文 参考訳(メタデータ) (2020-05-25T18:12:33Z) - Collaborative Learning of Semi-Supervised Clustering and Classification
for Labeling Uncurated Data [6.871887763122593]
ドメイン固有のイメージコレクションは、科学とビジネスの様々な領域において潜在的な価値を示す。
このような画像データに同時代の教師付き画像解析手法を採用するには、まずクリーン化と整理を行い、次に特定のドメインで使用される命名書に手動でラベル付けする必要がある。
我々はPludシステムの設計と実装を行い、専門家が費やした労力を最小限に抑え、現実的な大量の画像の収集を処理した。
論文 参考訳(メタデータ) (2020-03-09T17:03:05Z) - Automatically Discovering and Learning New Visual Categories with
Ranking Statistics [145.89790963544314]
我々は,他のクラスをラベル付けした画像コレクションにおいて,新しいクラスを発見する問題に対処する。
汎用クラスタリングモデルを学び、後者を用いて、非競合データ中の新しいクラスを識別する。
我々は,標準分類ベンチマークに対するアプローチと,新しいカテゴリー発見法の性能を,有意なマージンで評価した。
論文 参考訳(メタデータ) (2020-02-13T18:53:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。