論文の概要: Combining Datasets with Different Label Sets for Improved Nucleus
Segmentation and Classification
- arxiv url: http://arxiv.org/abs/2310.03346v1
- Date: Thu, 5 Oct 2023 06:56:54 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-06 17:14:10.985371
- Title: Combining Datasets with Different Label Sets for Improved Nucleus
Segmentation and Classification
- Title(参考訳): 改良された核分割と分類のためのラベルの異なるデータセットの組み合わせ
- Authors: Amruta Parulekar, Utkarsh Kanwat, Ravi Kant Gupta, Medha Chippa,
Thomas Jacob, Tripti Bameta, Swapnil Rane, Amit Sethi
- Abstract要約: 本稿では,クラスが関連しているが同一ではない複数のデータセット上でディープニューラルネットワーク(DNN)を訓練する手法を提案する。
具体的には,データセットにラベル付けおよび注釈付けされたクラスの集合が階層の任意のレベルにあるような,粗いクラス階層を利用するように設計されている。
その結果、データセットのテスト分割で使用されるクラスセットのセグメンテーションと分類のメトリクスが、他のデータセットで事前トレーニングすることで改善できることが示されている。
- 参考スコア(独自算出の注目度): 2.5016806673359393
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Segmentation and classification of cell nuclei in histopathology images using
deep neural networks (DNNs) can save pathologists' time for diagnosing various
diseases, including cancers, by automating cell counting and morphometric
assessments. It is now well-known that the accuracy of DNNs increases with the
sizes of annotated datasets available for training. Although multiple datasets
of histopathology images with nuclear annotations and class labels have been
made publicly available, the set of class labels differ across these datasets.
We propose a method to train DNNs for instance segmentation and classification
on multiple datasets where the set of classes across the datasets are related
but not the same. Specifically, our method is designed to utilize a
coarse-to-fine class hierarchy, where the set of classes labeled and annotated
in a dataset can be at any level of the hierarchy, as long as the classes are
mutually exclusive. Within a dataset, the set of classes need not even be at
the same level of the class hierarchy tree. Our results demonstrate that
segmentation and classification metrics for the class set used by the test
split of a dataset can improve by pre-training on another dataset that may even
have a different set of classes due to the expansion of the training set
enabled by our method. Furthermore, generalization to previously unseen
datasets also improves by combining multiple other datasets with different sets
of classes for training. The improvement is both qualitative and quantitative.
The proposed method can be adapted for various loss functions, DNN
architectures, and application domains.
- Abstract(参考訳): 深層ニューラルネットワーク(dnn)を用いた病理画像における細胞核のセグメンテーションと分類は、細胞計数と形態計測の自動化により、がんを含む様々な疾患の診断に要する時間を短縮する。
現在、DNNの精度は、トレーニング用に利用可能な注釈付きデータセットのサイズによって増加することが知られている。
核アノテーションとクラスラベルを含む複数の病理像のデータセットが公開されているが、クラスラベルのセットはこれらのデータセットによって異なる。
本稿では,データセット間のクラスセットが関連しているが同一ではない複数のデータセットに対して,サンプルセグメンテーションと分類のためのDNNを訓練する方法を提案する。
具体的には,クラスが相互に排他的である限り,データセットにラベル付けおよび注釈付けされたクラスの集合が階層の任意のレベルにあるような,粗いクラス階層を利用するように設計されている。
データセット内では、クラスの集合はクラス階層ツリーと同じレベルである必要さえない。
その結果,データセットの分割テストで使用されるクラスに対するセグメンテーションと分類のメトリクスは,本手法で実現されるトレーニングセットの拡張により,異なるクラスセットを持つ可能性のある別のデータセットを事前トレーニングすることで改善できることが示された。
さらに、未発見のデータセットへの一般化は、トレーニングのために複数の他のデータセットと異なるクラスのセットを組み合わせることで改善される。
改善は質的かつ定量的である。
提案手法は,様々な損失関数,DNNアーキテクチャ,アプリケーションドメインに適用可能である。
関連論文リスト
- A data-centric approach for assessing progress of Graph Neural Networks [7.2249434861826325]
グラフニューラルネットワーク(GNN)はノード分類タスクにおいて最先端の結果を得た。
主な改善点はマルチクラスの分類であり、各ノードが複数のラベルを持つ場合に焦点を当てない。
マルチラベルノード分類を研究する上での第一の課題は、公開データセットの不足である。
論文 参考訳(メタデータ) (2024-06-18T09:41:40Z) - UniCell: Universal Cell Nucleus Classification via Prompt Learning [76.11864242047074]
ユニバーサル細胞核分類フレームワーク(UniCell)を提案する。
異なるデータセットドメインから対応する病理画像のカテゴリを均一に予測するために、新しいプロンプト学習機構を採用している。
特に,本フレームワークでは,原子核検出と分類のためのエンドツーエンドアーキテクチャを採用し,フレキシブルな予測ヘッドを用いて様々なデータセットを適応する。
論文 参考訳(メタデータ) (2024-02-20T11:50:27Z) - Generalized Category Discovery with Clustering Assignment Consistency [56.92546133591019]
一般化圏発見(GCD)は、最近提案されたオープンワールドタスクである。
クラスタリングの一貫性を促進するための協調学習ベースのフレームワークを提案する。
提案手法は,3つの総合的なベンチマークと3つのきめ細かい視覚認識データセット上での最先端性能を実現する。
論文 参考訳(メタデータ) (2023-10-30T00:32:47Z) - Generating Hierarchical Structures for Improved Time Series
Classification Using Stochastic Splitting Functions [0.0]
本研究では,階層分類(HC)による多クラスデータセットの分類性能を高めるために,分割関数(SSF)を用いた新しい階層分割クラスタリング手法を提案する。
この方法は、明示的な情報を必要とせずに階層を生成するユニークな能力を持ち、階層の事前の知識を欠いたデータセットに適している。
論文 参考訳(メタデータ) (2023-09-21T10:34:50Z) - Domain Adaptive Nuclei Instance Segmentation and Classification via
Category-aware Feature Alignment and Pseudo-labelling [65.40672505658213]
本稿では, UDA 核インスタンス分割と分類のための新しいディープニューラルネットワークである Category-Aware 機能アライメントと Pseudo-Labelling Network (CAPL-Net) を提案する。
我々のアプローチは、最先端のUDA手法よりも顕著なマージンで優れています。
論文 参考訳(メタデータ) (2022-07-04T07:05:06Z) - Learning Semantic Segmentation from Multiple Datasets with Label Shifts [101.24334184653355]
本論文では,ラベル空間が異なる複数のデータセットを対象としたモデルの自動学習手法であるUniSegを提案する。
具体的には,ラベルの相反と共起を考慮に入れた2つの損失を提案する。
論文 参考訳(メタデータ) (2022-02-28T18:55:19Z) - Dominant Set-based Active Learning for Text Classification and its
Application to Online Social Media [0.0]
本稿では,最小限のアノテーションコストで大規模未ラベルコーパスのトレーニングを行うための,プールベースのアクティブラーニング手法を提案する。
提案手法には調整すべきパラメータが一切ないため,データセットに依存しない。
本手法は,最先端のアクティブラーニング戦略と比較して高い性能を実現する。
論文 参考訳(メタデータ) (2022-01-28T19:19:03Z) - A Topological Data Analysis Based Classifier [1.6668132748773563]
本稿では,多クラス分類問題に直接トポロジカルデータ解析を適用するアルゴリズムを提案する。
提案アルゴリズムは,データセット上にフィルタされた単純複合体を構築する。
提案手法は平均してKNNと重み付きKNNよりも優れていた。
論文 参考訳(メタデータ) (2021-11-09T15:54:16Z) - CvS: Classification via Segmentation For Small Datasets [52.821178654631254]
本稿では,分類ラベルをセグメントマップの予測から導出する小型データセットのコスト効率の高い分類器であるCvSを提案する。
我々は,CvSが従来の手法よりもはるかに高い分類結果が得られることを示す多種多様な問題に対して,本フレームワークの有効性を評価する。
論文 参考訳(メタデータ) (2021-10-29T18:41:15Z) - A Systematic Evaluation: Fine-Grained CNN vs. Traditional CNN
Classifiers [54.996358399108566]
本稿では,大規模分類データセット上でトップノーチ結果を示すランドマーク一般的なCNN分類器の性能について検討する。
最先端のきめ細かい分類器と比較する。
実験において, 粒度の細かい分類器がベースラインを高められるかどうかを判定するために, 6つのデータセットについて広範囲に評価する。
論文 参考訳(メタデータ) (2020-03-24T23:49:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。