論文の概要: Collaborative Learning of Semi-Supervised Clustering and Classification
for Labeling Uncurated Data
- arxiv url: http://arxiv.org/abs/2003.04261v1
- Date: Mon, 9 Mar 2020 17:03:05 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-25 08:06:03.958696
- Title: Collaborative Learning of Semi-Supervised Clustering and Classification
for Labeling Uncurated Data
- Title(参考訳): 未集計データのラベル付けのための半教師ありクラスタリングと分類の協調学習
- Authors: Sara Mousavi, Dylan Lee, Tatianna Griffin, Dawnie Steadman, and Audris
Mockus
- Abstract要約: ドメイン固有のイメージコレクションは、科学とビジネスの様々な領域において潜在的な価値を示す。
このような画像データに同時代の教師付き画像解析手法を採用するには、まずクリーン化と整理を行い、次に特定のドメインで使用される命名書に手動でラベル付けする必要がある。
我々はPludシステムの設計と実装を行い、専門家が費やした労力を最小限に抑え、現実的な大量の画像の収集を処理した。
- 参考スコア(独自算出の注目度): 6.871887763122593
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Domain-specific image collections present potential value in various areas of
science and business but are often not curated nor have any way to readily
extract relevant content. To employ contemporary supervised image analysis
methods on such image data, they must first be cleaned and organized, and then
manually labeled for the nomenclature employed in the specific domain, which is
a time consuming and expensive endeavor. To address this issue, we designed and
implemented the Plud system. Plud provides an iterative semi-supervised
workflow to minimize the effort spent by an expert and handles realistic large
collections of images. We believe it can support labeling datasets regardless
of their size and type. Plud is an iterative sequence of unsupervised
clustering, human assistance, and supervised classification. With each
iteration 1) the labeled dataset grows, 2) the generality of the classification
method and its accuracy increases, and 3) manual effort is reduced. We
evaluated the effectiveness of our system, by applying it on over a million
images documenting human decomposition. In our experiment comparing manual
labeling with labeling conducted with the support of Plud, we found that it
reduces the time needed to label data and produces highly accurate models for
this new domain.
- Abstract(参考訳): ドメイン固有のイメージコレクションは、科学やビジネスの様々な分野において潜在的価値を示すが、しばしばキュレーションされることはない。
このような画像データに現代的な教師あり画像分析手法を適用するためには、まずは整理して整理し、次に特定の領域で採用する命名法に手作業でラベル付けする必要がある。
この問題に対処するため,我々はPludシステムの設計と実装を行った。
Pludは、専門家が費やした労力を最小限に抑え、リアルな大規模な画像コレクションを処理するために、反復的な半教師付きワークフローを提供する。
サイズやタイプに関わらず、ラベル付けデータセットをサポートできると考えています。
Pludは、教師なしクラスタリング、ヒューマンアシスト、教師付き分類の反復的なシーケンスである。
イテレーションごとに
1)ラベル付きデータセットが成長する。
2) 分類法の一般性とその正確性は増大し,
3) 手動作業の削減。
人間の分解を文書化した100万以上の画像に適用し,本システムの有効性を評価した。
手動ラベリングとpludのサポートによるラベリングを比較した実験では、データラベリングに要する時間を短縮し、この新しいドメインに対して高精度なモデルを生成することが分かりました。
関連論文リスト
- Simple but Effective Unsupervised Classification for Specified Domain
Images: A Case Study on Fungi Images [7.725818999035946]
高品質なラベル付きデータセットはディープラーニングに不可欠である。
従来の手動のアノテーション手法は高価で非効率である。
3つの重要な概念を持つ教師なしの分類方法を紹介した。
論文 参考訳(メタデータ) (2023-11-15T14:33:22Z) - BI-LAVA: Biocuration with Hierarchical Image Labeling through Active
Learning and Visual Analysis [2.859324824091085]
BI-LAVAは階層構造の科学画像を整理するシステムである。
イメージラベルの小さなセット、階層的なイメージ分類器のセット、そしてモデルビルダーが不完全なグランドトルースラベルを扱うのを助けるためにアクティブラーニングを使用する。
評価の結果,本手法は分類学におけるクラスの特徴を理解する上で,ドメインエキスパートを効果的に支援していることがわかった。
論文 参考訳(メタデータ) (2023-08-15T19:36:19Z) - Spatiotemporal Classification with limited labels using Constrained
Clustering for large datasets [22.117238467818623]
分離可能な表現は、より良い分類能力を持つ教師付きモデルにつながる可能性がある。
ラベルの少ない制約付き損失を使って、より優れた表現を学べる方法を示します。
我々は,ラベルの少ない手法を用いて,ラベルのないデータから新しいラベル付きサンプルを抽出し,より優れた分類につながる教師付き手法を拡張できることを示す。
論文 参考訳(メタデータ) (2022-10-14T05:05:22Z) - SLRNet: Semi-Supervised Semantic Segmentation Via Label Reuse for Human
Decomposition Images [5.560471251954644]
既存の類似性を利用してデータセットのラベルなし画像のラベルを再利用する半教師付き手法を提案する。
我々は,人間の分解画像の大規模なデータセット上で本手法を評価し,概念的には単純ながら,最先端の整合性に優れることを確認した。
論文 参考訳(メタデータ) (2022-02-24T04:58:02Z) - Mixed Supervision Learning for Whole Slide Image Classification [88.31842052998319]
超高解像度画像のための混合監視学習フレームワークを提案する。
パッチトレーニングの段階では、このフレームワークは、粗いイメージレベルのラベルを使用して、自己教師付き学習を洗練することができる。
画素レベルの偽陽性と偽陰性を抑制するための包括的な戦略が提案されている。
論文 参考訳(メタデータ) (2021-07-02T09:46:06Z) - Pseudo Pixel-level Labeling for Images with Evolving Content [5.573543601558405]
画像の手動アノテーションの労力を削減するために,擬似ピクセルレベルのラベル生成手法を提案する。
VGGとResNetのバックボーンを用いた2つのセマンティックセグメンテーションモデルを、擬似ラベリング法と最先端手法を用いてラベル付けした画像上で学習する。
以上の結果から, トレーニングプロセスにおいて, 最先端手法を用いて生成したデータの代わりに擬似ラベルを用いることで, VGGおよびResNetに基づくセマンティックセマンティックセグメンテーションモデルの平均IoUと周波数重み付きIoUを3.36%, 2.58%, 10倍改善することがわかった。
論文 参考訳(メタデータ) (2021-05-20T18:14:19Z) - Towards Good Practices for Efficiently Annotating Large-Scale Image
Classification Datasets [90.61266099147053]
多数の画像の分類ラベルを収集するための効率的なアノテーション戦略を検討する。
人間のラベリング作業を最小化するための修正とベストプラクティスを提案します。
ImageNet100の125kイメージサブセットのシミュレーション実験では、平均で0.35のアノテーションで80%のトップ-1の精度でアノテートできることが示されている。
論文 参考訳(メタデータ) (2021-04-26T16:29:32Z) - Semantic Segmentation with Generative Models: Semi-Supervised Learning
and Strong Out-of-Domain Generalization [112.68171734288237]
本論文では,画像とラベルの再生モデルを用いた識別画素レベルのタスクのための新しいフレームワークを提案する。
我々は,共同画像ラベルの分布を捕捉し,未ラベル画像の大規模な集合を用いて効率的に訓練する生成的対向ネットワークを学習する。
ドメイン内性能をいくつかのベースラインと比較し,ドメイン外一般化を極端に示す最初の例である。
論文 参考訳(メタデータ) (2021-04-12T21:41:25Z) - Streaming Self-Training via Domain-Agnostic Unlabeled Images [62.57647373581592]
視覚認識モデル学習の過程を民主化することを目的としたストリーミング自己学習(SST)を提案する。
SSTの鍵となるのは、(1)ドメインに依存しない未ラベル画像により、追加の知識や監督なしにいくつかのラベル付き例でより良いモデルを学ぶことができ、(2)学習は継続的なプロセスであり、学習更新のスケジュールを構築することで行うことができる。
論文 参考訳(メタデータ) (2021-04-07T17:58:39Z) - Grafit: Learning fine-grained image representations with coarse labels [114.17782143848315]
本稿では,学習ラベルの提供するものよりも細かな表現を学習する問題に対処する。
粗いラベルと下層の細粒度潜在空間を併用することにより、カテゴリレベルの検索手法の精度を大幅に向上させる。
論文 参考訳(メタデータ) (2020-11-25T19:06:26Z) - Automatically Discovering and Learning New Visual Categories with
Ranking Statistics [145.89790963544314]
我々は,他のクラスをラベル付けした画像コレクションにおいて,新しいクラスを発見する問題に対処する。
汎用クラスタリングモデルを学び、後者を用いて、非競合データ中の新しいクラスを識別する。
我々は,標準分類ベンチマークに対するアプローチと,新しいカテゴリー発見法の性能を,有意なマージンで評価した。
論文 参考訳(メタデータ) (2020-02-13T18:53:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。