論文の概要: NCT-CRC-HE: Not All Histopathological Datasets Are Equally Useful
- arxiv url: http://arxiv.org/abs/2409.11546v1
- Date: Tue, 17 Sep 2024 20:36:03 GMT
- ステータス: 処理完了
- システム内更新日: 2024-09-19 19:49:52.801381
- Title: NCT-CRC-HE: Not All Histopathological Datasets Are Equally Useful
- Title(参考訳): NCT-CRC-HE:すべての病理的データセットが等しく有用ではない
- Authors: Andrey Ignatov, Grigory Malivenko,
- Abstract要約: 本稿では,NCT-CRC-HE-100Kの大腸癌データセットの解析を行った。
このデータセットと得られた結果の両方が、データ固有のバイアスの影響を受けている可能性がある。
画像あたりの3つの特徴しか使用していない最も単純なモデルでさえ、この9クラスデータセットで50%以上の精度を示すことができる。
- 参考スコア(独自算出の注目度): 15.10324445908774
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Numerous deep learning-based solutions have been proposed for histopathological image analysis over the past years. While they usually demonstrate exceptionally high accuracy, one key question is whether their precision might be affected by low-level image properties not related to histopathology but caused by microscopy image handling and pre-processing. In this paper, we analyze a popular NCT-CRC-HE-100K colorectal cancer dataset used in numerous prior works and show that both this dataset and the obtained results may be affected by data-specific biases. The most prominent revealed dataset issues are inappropriate color normalization, severe JPEG artifacts inconsistent between different classes, and completely corrupted tissue samples resulting from incorrect image dynamic range handling. We show that even the simplest model using only 3 features per image (red, green and blue color intensities) can demonstrate over 50% accuracy on this 9-class dataset, while using color histogram not explicitly capturing cell morphology features yields over 82% accuracy. Moreover, we show that a basic EfficientNet-B0 ImageNet pretrained model can achieve over 97.7% accuracy on this dataset, outperforming all previously proposed solutions developed for this task, including dedicated foundation histopathological models and large cell morphology-aware neural networks. The NCT-CRC-HE dataset is publicly available and can be freely used to replicate the presented results. The codes and pre-trained models used in this paper are available at https://github.com/gmalivenko/NCT-CRC-HE-experiments
- Abstract(参考訳): 近年,病理組織学的画像解析のための深層学習型ソリューションが数多く提案されている。
通常、非常に高い精度を示すが、重要な疑問は、その精度が病理組織学とは関係なく、顕微鏡画像処理と前処理によって引き起こされる低レベルの画像特性に影響されるかどうかである。
本稿では,多くの先行研究で使用されているNCT-CRC-HE-100K大腸癌データセットを分析し,このデータセットと得られた結果の両方が,データ固有のバイアスの影響を受けていることを示す。
最も顕著なデータセットの問題は、不適切な色正規化、異なるクラス間で不一致なJPEGアーティファクト、不適切な画像ダイナミックレンジハンドリングによる完全に破損した組織サンプルである。
画像あたりの3つの特徴(赤,緑,青)のみを用いた最も単純なモデルであっても,この9クラスデータセットでは50%以上の精度が示され,セル形態を明示的に捉えない色ヒストグラムでは82%以上の精度が得られた。
さらに、このデータセットにおいて、基礎的なEfficientNet-B0 ImageNet事前学習モデルが97.7%以上の精度を達成できることを示し、このタスクのために開発された全ての提案されたソリューション、例えば、専用の基礎組織モデルや大きな細胞形態認識ニューラルネットワークよりも優れていることを示す。
NCT-CRC-HEデータセットは公開されており、提示された結果を自由に再現することができる。
本論文で使用されるコードと事前訓練済みモデルはhttps://github.com/gmalivenko/NCT-CRC-HE-experimentsで公開されている。
関連論文リスト
- Histopathological Image Classification with Cell Morphology Aware Deep Neural Networks [11.749248917866915]
本稿では,細胞形態を学習し,多数のがんタイプを同定するために事前訓練した新しいDeepCMorphモデルを提案する。
7175例の8736例の診断スライドから抽出した270K以上の組織パッチからなるPan-Cancer TCGAデータセット上で,本モジュールを事前訓練した。
提案手法は, 82%以上の精度で32種類の癌を検出でき, 従来提案されていたすべてのソリューションを4%以上上回る性能を示した。
論文 参考訳(メタデータ) (2024-07-11T16:03:59Z) - Performance of GAN-based augmentation for deep learning COVID-19 image
classification [57.1795052451257]
ディープラーニングを医療分野に適用する上で最大の課題は、トレーニングデータの提供である。
データ拡張は、限られたデータセットに直面した時に機械学習で使用される典型的な方法論である。
本研究は, 新型コロナウイルスの胸部X線画像セットを限定して, StyleGAN2-ADAモデルを用いて訓練するものである。
論文 参考訳(メタデータ) (2023-04-18T15:39:58Z) - Enhanced Sharp-GAN For Histopathology Image Synthesis [63.845552349914186]
病理組織像合成は、正確ながん検出のためのディープラーニングアプローチの訓練において、データ不足の問題に対処することを目的としている。
核トポロジと輪郭正則化を用いて合成画像の品質を向上させる新しい手法を提案する。
提案手法は、Sharp-GANを2つのデータセット上の4つの画像品質指標すべてで上回る。
論文 参考訳(メタデータ) (2023-01-24T17:54:01Z) - DeepDC: Deep Distance Correlation as a Perceptual Image Quality
Evaluator [53.57431705309919]
ImageNet Pre-trained Deep Neural Network (DNN)は、効果的な画像品質評価(IQA)モデルを構築するための顕著な転送性を示す。
我々は,事前学習DNN機能のみに基づく新しいフル参照IQA(FR-IQA)モデルを開発した。
5つの標準IQAデータセット上で,提案した品質モデルの優位性を示すため,包括的実験を行った。
論文 参考訳(メタデータ) (2022-11-09T14:57:27Z) - Early Diagnosis of Retinal Blood Vessel Damage via Deep Learning-Powered
Collective Intelligence Models [0.3670422696827525]
Swarmアルゴリズムのパワーは、タスクに最適なモデルを提供するために、畳み込み層、プーリング層、正規化層の様々な組み合わせを探すために使用される。
最高のTDCNモデルは90.3%、AUC ROCは0.956、Cohenスコアは0.967である。
論文 参考訳(メタデータ) (2022-10-17T21:38:38Z) - H&E-adversarial network: a convolutional neural network to learn
stain-invariant features through Hematoxylin & Eosin regression [1.7371375427784381]
本稿では,様々な色の変化を含むデータに基づいて,畳み込みニューラルネットワーク(CNN)を学習する新しい手法を提案する。
H&E-adversarial CNNと呼ばれるこの手法は、トレーニング中にH&Eマトリックス情報を利用して、染色不変の特徴を学習する。
論文 参考訳(メタデータ) (2022-01-17T10:34:23Z) - Stain Normalized Breast Histopathology Image Recognition using
Convolutional Neural Networks for Cancer Detection [9.826027427965354]
近年の進歩により、畳み込みニューラルネットワーク(CNN)アーキテクチャは乳がん検出のためのコンピュータ支援診断(CAD)システムの設計に利用できることが示されている。
乳腺病理像の2値分類のためのCNNモデルについて検討した。
我々は,200倍,400倍に拡大した病理像に対して,トレーニング済みのCNNネットワークを利用可能なBreaKHisデータセットで検証した。
論文 参考訳(メタデータ) (2022-01-04T03:09:40Z) - Vision Transformers for femur fracture classification [59.99241204074268]
Vision Transformer (ViT) はテスト画像の83%を正確に予測することができた。
史上最大かつ最もリッチなデータセットを持つサブフラクチャーで良い結果が得られた。
論文 参考訳(メタデータ) (2021-08-07T10:12:42Z) - Examining and Mitigating Kernel Saturation in Convolutional Neural
Networks using Negative Images [0.8594140167290097]
CNNにおける畳み込みカーネル飽和の影響を解析する。
トレーニングデータセットに負の画像を追加することで、飽和を緩和し、分類精度を高めるための単純なデータ増強技術を提案する。
以上の結果から,CNNは畳み込みカーネル飽和の影響を受けやすく,トレーニングデータセットに負のイメージを補うことで,分類精度が統計的に顕著に向上する可能性が示唆された。
論文 参考訳(メタデータ) (2021-05-10T06:06:49Z) - Classification of COVID-19 in CT Scans using Multi-Source Transfer
Learning [91.3755431537592]
我々は,従来のトランスファー学習の改良にマルチソース・トランスファー・ラーニングを応用して,CTスキャンによる新型コロナウイルスの分類を提案する。
マルチソースファインチューニングアプローチでは、ImageNetで微調整されたベースラインモデルよりも優れています。
我々の最高のパフォーマンスモデルは、0.893の精度と0.897のリコールスコアを達成でき、ベースラインのリコールスコアを9.3%上回った。
論文 参考訳(メタデータ) (2020-09-22T11:53:06Z) - Data Consistent CT Reconstruction from Insufficient Data with Learned
Prior Images [70.13735569016752]
偽陰性病変と偽陽性病変を呈示し,CT画像再構成における深層学習の堅牢性について検討した。
本稿では,圧縮センシングと深層学習の利点を組み合わせた画像品質向上のためのデータ一貫性再構築手法を提案する。
提案手法の有効性は,円錐ビームCTにおいて,トランキャットデータ,リミテッドアングルデータ,スパースビューデータで示される。
論文 参考訳(メタデータ) (2020-05-20T13:30:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。