論文の概要: Does deep learning model calibration improve performance in
class-imbalanced medical image classification?
- arxiv url: http://arxiv.org/abs/2110.00918v2
- Date: Wed, 6 Oct 2021 13:39:47 GMT
- ステータス: 処理完了
- システム内更新日: 2021-10-10 09:19:54.626096
- Title: Does deep learning model calibration improve performance in
class-imbalanced medical image classification?
- Title(参考訳): ディープラーニングモデルキャリブレーションは,クラス不均衡医用画像分類の性能を改善するか?
- Authors: Sivaramakrishnan Rajaraman, Prasanth Ganesan, Sameer Antani
- Abstract要約: モデル校正が2つの医用画像モダリティに与える影響を系統的に解析する。
その結果,0.5の既定動作閾値では,キャリブレーションにより達成される性能は,非校正確率よりも有意に優れていることがわかった。
- 参考スコア(独自算出の注目度): 0.8594140167290096
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In medical image classification tasks, it is common to find that the number
of normal samples far exceeds the number of abnormal samples. In such
class-imbalanced situations, reliable training of deep neural networks
continues to be a major challenge. Under these circumstances, the predicted
class probabilities may be biased toward the majority class. Calibration has
been suggested to alleviate some of these effects. However, there is
insufficient analysis explaining when and whether calibrating a model would be
beneficial in improving performance. In this study, we perform a systematic
analysis of the effect of model calibration on its performance on two medical
image modalities, namely, chest X-rays and fundus images, using various deep
learning classifier backbones. For this, we study the following variations: (i)
the degree of imbalances in the dataset used for training; (ii) calibration
methods; and (iii) two classification thresholds, namely, default decision
threshold of 0.5, and optimal threshold from precision-recall curves. Our
results indicate that at the default operating threshold of 0.5, the
performance achieved through calibration is significantly superior (p < 0.05)
to using uncalibrated probabilities. However, at the PR-guided threshold, these
gains are not significantly different (p > 0.05). This finding holds for both
image modalities and at varying degrees of imbalance.
- Abstract(参考訳): 医用画像分類では、正常なサンプルの数は異常なサンプル数をはるかに超えることが一般的である。
このようなクラス不均衡な状況下では、ディープニューラルネットワークの信頼性の高いトレーニングが引き続き大きな課題である。
このような状況下では、予測されたクラス確率は多数派に偏っている可能性がある。
校正はこれらの効果を緩和するために提案されている。
しかし、モデルのキャリブレーションがパフォーマンスを改善するのに有用かどうかを説明する分析が不十分である。
本研究では,様々なディープラーニング分類器バックボーンを用いて,胸部x線像と眼底像の2つの医用画像モダリティに対するモデル校正の効果を体系的に解析する。
このために、私たちは以下のバリエーションを研究します。
(i) 訓練に使用するデータセットにおける不均衡の程度
(ii)校正方法、及び
3)2つの分類しきい値,すなわち0.5のデフォルト決定しきい値,精度・リコール曲線からの最適しきい値。
その結果, 0.5の既定動作閾値では, キャリブレーションにより達成される性能は, 未校正確率よりも有意に優れていた(p < 0.05)。
しかし、PR誘導閾値では、これらの利得は大きな違いはない(p > 0.05)。
この発見は、画像のモダリティと様々な不均衡の度合いの両方に当てはまる。
関連論文リスト
- Automatic hip osteoarthritis grading with uncertainty estimation from
computed tomography using digitally-reconstructed radiographs [5.910133714106733]
変形性股関節症(Hip OA)の重症度はCroweおよびKellgren-Lawrence分類を用いて分類されることが多い。
ディープ・ラーニング・モデルは2つのグレーティング・スキームを用いて病気の成績を予測するために訓練された。
モデルの精度は約0.65(ECA)と0.95(ONCA)である。
論文 参考訳(メタデータ) (2023-12-30T07:28:56Z) - On the calibration of neural networks for histological slide-level
classification [47.99822253865054]
我々は、パッチレベルの特徴表現と、それらの分類性能に関するスライドレベルの予測を組み合わせた3つのニューラルネットワークアーキテクチャを比較した。
我々は、トランスフォーマーが分類性能と校正の点で良い結果をもたらすことを観察する。
論文 参考訳(メタデータ) (2023-12-15T11:46:29Z) - Mitigating Calibration Bias Without Fixed Attribute Grouping for
Improved Fairness in Medical Imaging Analysis [2.8943928153775826]
クラスタ・フォーカス (Cluster-Focal) は、まず粗悪な校正されたサンプルを識別し、それらをグループに分類し、その後、校正バイアスを改善するためにグループ指向の焦点損失を導入する。
HAM10000データセットを用いた皮膚病変分類と,多発性硬化症(MS)患者の将来の病変活動の予測について検討した。
論文 参考訳(メタデータ) (2023-07-04T14:14:12Z) - Performance of GAN-based augmentation for deep learning COVID-19 image
classification [57.1795052451257]
ディープラーニングを医療分野に適用する上で最大の課題は、トレーニングデータの提供である。
データ拡張は、限られたデータセットに直面した時に機械学習で使用される典型的な方法論である。
本研究は, 新型コロナウイルスの胸部X線画像セットを限定して, StyleGAN2-ADAモデルを用いて訓練するものである。
論文 参考訳(メタデータ) (2023-04-18T15:39:58Z) - Multi-Head Multi-Loss Model Calibration [13.841172927454204]
我々は,深層アンサンブルの訓練と推論に要する費用を省く,単純化されたアンサンブルの形式を導入する。
具体的には、各頭部は、重み付きクロスエントロピー損失を最小限に抑えるために訓練されるが、重みは異なる枝によって異なる。
その結果,2つの挑戦データセットにおいて精度を犠牲にすることなく,精度の高いキャリブレーションを達成できることが示唆された。
論文 参考訳(メタデータ) (2023-03-02T09:32:32Z) - On Calibrating Semantic Segmentation Models: Analyses and An Algorithm [51.85289816613351]
セマンティックセグメンテーションキャリブレーションの問題について検討する。
モデルキャパシティ、作物サイズ、マルチスケールテスト、予測精度はキャリブレーションに影響を及ぼす。
我々は、単純で統一的で効果的なアプローチ、すなわち選択的スケーリングを提案する。
論文 参考訳(メタデータ) (2022-12-22T22:05:16Z) - DOMINO: Domain-aware Model Calibration in Medical Image Segmentation [51.346121016559024]
現代のディープニューラルネットワークはキャリブレーションが不十分で、信頼性と信頼性を損なう。
本稿では,クラスラベル間のセマンティック・コンフューザビリティと階層的類似性を利用したドメイン認識モデルキャリブレーション手法であるDOMINOを提案する。
その結果,DOMINOを校正したディープニューラルネットワークは,頭部画像分割における非校正モデルや最先端形態計測法よりも優れていた。
論文 参考訳(メタデータ) (2022-09-13T15:31:52Z) - T-Cal: An optimal test for the calibration of predictive models [49.11538724574202]
有限検証データセットを用いた予測モデルの誤校正を仮説検証問題として検討する。
誤校正の検出は、クラスの条件付き確率が予測の十分滑らかな関数である場合にのみ可能である。
我々は、$ell$-Expected Error(ECE)のデバイアスドプラグイン推定器に基づくキャリブレーションのためのミニマックステストであるT-Calを提案する。
論文 参考訳(メタデータ) (2022-03-03T16:58:54Z) - Multi-loss ensemble deep learning for chest X-ray classification [0.8594140167290096]
クラス不均衡は、異常サンプルの数が正常サンプルの数より少ない医療画像分類タスクでよく見られる。
本稿では,DLモデルを訓練し,その性能を多クラス分類設定で解析する新しい損失関数を提案する。
論文 参考訳(メタデータ) (2021-09-29T14:14:04Z) - Improved Trainable Calibration Method for Neural Networks on Medical
Imaging Classification [17.941506832422192]
経験的に、ニューラルネットワークは、しばしば彼らの予測を誤解し、過度に信ずる。
本稿では,モデルキャリブレーションを大幅に改善しつつ,全体の分類精度を維持する新しいキャリブレーション手法を提案する。
論文 参考訳(メタデータ) (2020-09-09T01:25:53Z) - Calibration of Neural Networks using Splines [51.42640515410253]
キャリブレーション誤差の測定は、2つの経験的分布を比較します。
古典的コルモゴロフ・スミルノフ統計テスト(KS)にインスパイアされたビンニングフリーキャリブレーション尺度を導入する。
提案手法は,KS誤差に対する既存の手法と,他の一般的なキャリブレーション手法とを一貫して比較する。
論文 参考訳(メタデータ) (2020-06-23T07:18:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。