論文の概要: Are pathologist-defined labels reproducible? Comparison of the TUPAC16
mitotic figure dataset with an alternative set of labels
- arxiv url: http://arxiv.org/abs/2007.05351v1
- Date: Fri, 10 Jul 2020 12:44:54 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-11 21:52:13.407371
- Title: Are pathologist-defined labels reproducible? Comparison of the TUPAC16
mitotic figure dataset with an alternative set of labels
- Title(参考訳): 病理学者定義ラベルは再現可能か?
TUPAC16 mitotic figure データセットと代替ラベルの比較
- Authors: Christof A. Bertram and Mitko Veta and Christian Marzahl and Nikolas
Stathonikos and Andreas Maier and Robert Klopfleisch and Marc Aubreville
- Abstract要約: 我々は,TUPAC16チャレンジの補助ミトーシスデータセットの画像に対して,別のラベルセットを提案する。
本研究の結果,病理学者が定義したラベルは,モデルの性能に顕著な違いをもたらす可能性が示唆された。
- 参考スコア(独自算出の注目度): 8.470572262262719
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Pathologist-defined labels are the gold standard for histopathological data
sets, regardless of well-known limitations in consistency for some tasks. To
date, some datasets on mitotic figures are available and were used for
development of promising deep learning-based algorithms. In order to assess
robustness of those algorithms and reproducibility of their methods it is
necessary to test on several independent datasets. The influence of different
labeling methods of these available datasets is currently unknown. To tackle
this, we present an alternative set of labels for the images of the auxiliary
mitosis dataset of the TUPAC16 challenge. Additional to manual mitotic figure
screening, we used a novel, algorithm-aided labeling process, that allowed to
minimize the risk of missing rare mitotic figures in the images. All potential
mitotic figures were independently assessed by two pathologists. The novel,
publicly available set of labels contains 1,999 mitotic figures (+28.80%) and
additionally includes 10,483 labels of cells with high similarities to mitotic
figures (hard examples). We found significant difference comparing F_1 scores
between the original label set (0.549) and the new alternative label set
(0.735) using a standard deep learning object detection architecture. The
models trained on the alternative set showed higher overall confidence values,
suggesting a higher overall label consistency. Findings of the present study
show that pathologists-defined labels may vary significantly resulting in
notable difference in the model performance. Comparison of deep learning-based
algorithms between independent datasets with different labeling methods should
be done with caution.
- Abstract(参考訳): 病理学者が定義するラベルは、いくつかのタスクの一貫性の既知の制限に関わらず、病理組織学的データセットの黄金の標準である。
これまでは、mitotic figuresのデータセットの一部が利用可能であり、将来性のあるディープラーニングベースのアルゴリズムの開発に使われていた。
これらのアルゴリズムのロバスト性とアルゴリズムの再現性を評価するには、いくつかの独立したデータセットでテストする必要がある。
これらのデータセットの異なるラベル付け方法の影響は現在不明である。
そこで本研究では,TUPAC16チャレンジの補助ミトーシスデータセットの画像に対して,別のラベルセットを提案する。
手動の有糸分裂図形スクリーニングに加えて,画像中に稀な有糸分裂図形が欠落するリスクを最小限に抑える新しいアルゴリズム支援ラベル法を用いた。
全ての有糸分裂病原体は2人の病理学者によって独立に評価された。
新規に公開されたラベルセットは、1,999個の有糸分裂細胞(+28.80%)を含み、さらに10,483個の有糸分裂細胞(硬い例)を含む。
標準深層学習オブジェクト検出アーキテクチャを用いて,F_1スコア(0.549)と新しい代替ラベル(0.735)とを比較した。
代替セットでトレーニングされたモデルでは、全体的な信頼性が向上し、ラベルの一貫性が向上した。
本研究の結果,病理学者が定義したラベルは,モデルの性能に顕著な違いをもたらす可能性が示唆された。
異なるラベル付け手法による独立データセット間のディープラーニングに基づくアルゴリズムの比較には注意が必要である。
関連論文リスト
- Deep Partial Multi-Label Learning with Graph Disambiguation [27.908565535292723]
grAph-disambIguatioN (PLAIN) を用いた新しいディープ部分多重ラベルモデルを提案する。
具体的には、ラベルの信頼性を回復するために、インスタンスレベルとラベルレベルの類似性を導入する。
各トレーニングエポックでは、ラベルがインスタンスとラベルグラフに伝播し、比較的正確な擬似ラベルを生成する。
論文 参考訳(メタデータ) (2023-05-10T04:02:08Z) - Revisiting Self-Training with Regularized Pseudo-Labeling for Tabular
Data [0.0]
我々は、勾配向上決定木を含むあらゆる種類のアルゴリズムに適用可能な自己学習を再考する。
疑似ラベルの可能性に基づいて信頼度を正則化する新しい擬似ラベル手法を提案する。
論文 参考訳(メタデータ) (2023-02-27T18:12:56Z) - How many labelers do you have? A closer look at gold-standard labels [11.43020642249583]
非集約的なラベル情報へのアクセスによって、トレーニングが適切に校正されたモデルを簡単にできるか、あるいは、場合によっては、実現可能であるかを示します。
ストーリー全体は微妙で、集約されたラベル情報とフルラベル情報のコントラストは、問題の特定の部分に依存します。
論文 参考訳(メタデータ) (2022-06-24T02:33:50Z) - Learning to Aggregate and Refine Noisy Labels for Visual Sentiment
Analysis [69.48582264712854]
本研究では,頑健な視覚的感情分析を行うための頑健な学習手法を提案する。
本手法は,トレーニング中にノイズラベルを集約・フィルタリングするために外部メモリに依存している。
公開データセットを用いたラベルノイズを用いた視覚的感情分析のベンチマークを構築した。
論文 参考訳(メタデータ) (2021-09-15T18:18:28Z) - Co-Correcting: Noise-tolerant Medical Image Classification via mutual
Label Correction [5.994566233473544]
本稿では,Co-Correctingという耐雑音性医用画像分類フレームワークを提案する。
分類精度を大幅に向上させ、デュアルネットワーク相互学習、ラベル確率推定、カリキュラムラベルの修正を通じてより正確なラベルを得る。
実験により, 様々なタスクにおいて, 雑音比の異なるコココレクショニングが最適な精度と一般化を実現することが示された。
論文 参考訳(メタデータ) (2021-09-11T02:09:52Z) - Minimax Active Learning [61.729667575374606]
アクティブラーニングは、人間のアノテーションによってラベル付けされる最も代表的なサンプルをクエリすることによって、ラベル効率の高いアルゴリズムを開発することを目指している。
現在のアクティブラーニング技術は、最も不確実なサンプルを選択するためにモデルの不確実性に頼るか、クラスタリングを使うか、最も多様なラベルのないサンプルを選択するために再構築する。
我々は,不確実性と多様性を両立させる半教師付きミニマックスエントロピーに基づく能動学習アルゴリズムを開発した。
論文 参考訳(メタデータ) (2020-12-18T19:03:40Z) - Few-shot Learning for Multi-label Intent Detection [59.66787898744991]
State-of-the-art work estimates label-instancelevance scores and using threshold to select multiple associated intent labels。
2つのデータセットの実験により、提案モデルが1ショットと5ショットの両方の設定において強いベースラインを著しく上回ることが示された。
論文 参考訳(メタデータ) (2020-10-11T14:42:18Z) - Instance-Aware Graph Convolutional Network for Multi-Label
Classification [55.131166957803345]
グラフ畳み込みニューラルネットワーク(GCN)は、マルチラベル画像認識タスクを効果的に強化した。
マルチラベル分類のための事例対応グラフ畳み込みニューラルネットワーク(IA-GCN)フレームワークを提案する。
論文 参考訳(メタデータ) (2020-08-19T12:49:28Z) - Debiased Contrastive Learning [64.98602526764599]
我々は,同ラベルデータポイントのサンプリングを補正する,偏りのあるコントラスト目的の開発を行う。
実証的に、提案する目的は、視覚、言語、強化学習ベンチマークにおける表現学習の最先端を一貫して上回る。
論文 参考訳(メタデータ) (2020-07-01T04:25:24Z) - Semi-supervised Medical Image Classification with Relation-driven
Self-ensembling Model [71.80319052891817]
医用画像分類のための関係駆動型半教師付きフレームワークを提案する。
これは、摂動下で与えられた入力の予測一貫性を促進することでラベルのないデータを利用する。
本手法は,シングルラベルおよびマルチラベル画像分類のシナリオにおいて,最先端の半教師付き学習手法よりも優れる。
論文 参考訳(メタデータ) (2020-05-15T06:57:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。