論文の概要: Understanding Calibration of Deep Neural Networks for Medical Image
Classification
- arxiv url: http://arxiv.org/abs/2309.13132v2
- Date: Sat, 2 Dec 2023 09:07:08 GMT
- ステータス: 処理完了
- システム内更新日: 2023-12-05 22:07:24.387422
- Title: Understanding Calibration of Deep Neural Networks for Medical Image
Classification
- Title(参考訳): 医用画像分類のための深層ニューラルネットワークのキャリブレーションの理解
- Authors: Abhishek Singh Sambyal, Usma Niyaz, Narayanan C. Krishnan, Deepti R.
Bathula
- Abstract要約: 本研究では,異なるトレーニング体制下でのモデル性能とキャリブレーションについて検討する。
本研究は,完全教師付きトレーニングと,移動学習を伴わない回転型自己教師方式について考察する。
本研究では,重み分布や学習表現の類似性などの要因が,モデルで観測されるキャリブレーション傾向と相関していることを明らかにする。
- 参考スコア(独自算出の注目度): 3.461503547789351
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In the field of medical image analysis, achieving high accuracy is not
enough; ensuring well-calibrated predictions is also crucial. Confidence scores
of a deep neural network play a pivotal role in explainability by providing
insights into the model's certainty, identifying cases that require attention,
and establishing trust in its predictions. Consequently, the significance of a
well-calibrated model becomes paramount in the medical imaging domain, where
accurate and reliable predictions are of utmost importance. While there has
been a significant effort towards training modern deep neural networks to
achieve high accuracy on medical imaging tasks, model calibration and factors
that affect it remain under-explored. To address this, we conducted a
comprehensive empirical study that explores model performance and calibration
under different training regimes. We considered fully supervised training,
which is the prevailing approach in the community, as well as rotation-based
self-supervised method with and without transfer learning, across various
datasets and architecture sizes. Multiple calibration metrics were employed to
gain a holistic understanding of model calibration. Our study reveals that
factors such as weight distributions and the similarity of learned
representations correlate with the calibration trends observed in the models.
Notably, models trained using rotation-based self-supervised pretrained regime
exhibit significantly better calibration while achieving comparable or even
superior performance compared to fully supervised models across different
medical imaging datasets. These findings shed light on the importance of model
calibration in medical image analysis and highlight the benefits of
incorporating self-supervised learning approach to improve both performance and
calibration.
- Abstract(参考訳): 医用画像解析の分野では、高精度化は不十分であり、適切に調整された予測の確保も重要である。
深層ニューラルネットワークの信頼性スコアは、モデルの確実性に関する洞察を与え、注意を要するケースを特定し、その予測に対する信頼を確立することによって、説明可能性において重要な役割を果たす。
その結果、正確かつ信頼性の高い予測が最重要となる医療画像領域において、よく校正されたモデルの重要性が最重要となる。
最新の深層ニューラルネットワークを訓練して医用イメージングタスクの精度を高めることには大きな努力があったが、モデルキャリブレーションやそれに影響する要因は未検討のままである。
そこで本研究では,異なるトレーニング環境下でのモデル性能とキャリブレーションについて総合的な実験を行った。
我々は,コミュニティで広く普及しているアプローチである完全教師付きトレーニングと,様々なデータセットとアーキテクチャサイズにわたる転送学習を伴うローテーションベースの自己教師付き手法を検討した。
複数のキャリブレーション指標を用いて、モデルキャリブレーションの全体的理解を得た。
本研究では,重み分布や学習表現の類似性などの要因がモデルで観測されたキャリブレーション傾向と相関していることを明らかにする。
特に、ローテーションベースの自己教師付き事前訓練システムを用いてトレーニングされたモデルは、異なる医用画像データセットの完全な教師付きモデルと比較して、同等またはそれ以上のパフォーマンスを達成しながら、キャリブレーションが大幅に向上する。
これらの結果は, 医用画像解析におけるモデル校正の重要性を浮き彫りにし, 自己教師あり学習アプローチを取り入れて, 性能と校正の両立を図った。
関連論文リスト
- On the Calibration of Large Language Models and Alignment [63.605099174744865]
信頼性キャリブレーションは、ディープモデルの信頼性を高める重要なツールである。
構築プロセス全体を通して、アライメント言語モデルの校正を体系的に検討する。
我々の研究は、人気のあるLCMが十分に校正されているか、トレーニングプロセスがモデルの校正にどのように影響するかに光を当てています。
論文 参考訳(メタデータ) (2023-11-22T08:57:55Z) - Improving Robustness and Reliability in Medical Image Classification with Latent-Guided Diffusion and Nested-Ensembles [4.249986624493547]
深層学習は高い予測精度と不確実性推定を実現することが示されている。
テスト時の入力画像のゆがみは、パフォーマンスを著しく低下させる可能性がある。
LaDiNEは,入力画像から情報および不変潜伏変数を推定できる,新規で堅牢な確率的手法である。
論文 参考訳(メタデータ) (2023-10-24T15:53:07Z) - Calibration of Neural Networks [77.34726150561087]
本稿では,ニューラルネットワークの文脈における信頼性校正問題について調査する。
我々は,問題文,キャリブレーション定義,評価に対する異なるアプローチについて分析する。
実験実験では、様々なデータセットとモデルをカバーし、異なる基準に従って校正方法を比較する。
論文 参考訳(メタデータ) (2023-03-19T20:27:51Z) - NCTV: Neural Clamping Toolkit and Visualization for Neural Network
Calibration [66.22668336495175]
ニューラルネットワークのキャリブレーションに対する考慮の欠如は、人間から信頼を得ることはないだろう。
我々はNeural Clamping Toolkitを紹介した。これは開発者が最先端のモデルに依存しないキャリブレーションモデルを採用するのを支援するために設計された最初のオープンソースフレームワークである。
論文 参考訳(メタデータ) (2022-11-29T15:03:05Z) - A Comparative Study of Confidence Calibration in Deep Learning: From
Computer Vision to Medical Imaging [3.7292013802839152]
ディープラーニング予測モデルは、医療を含む課題領域におけるキャリブレーションの低下に悩まされることが多い。
コンピュータビジョンから医用画像への信頼性キャリブレーションを4つのハイインパクトキャリブレーションモデルとの比較研究により橋渡しする。
論文 参考訳(メタデータ) (2022-06-17T15:27:24Z) - Performance or Trust? Why Not Both. Deep AUC Maximization with
Self-Supervised Learning for COVID-19 Chest X-ray Classifications [72.52228843498193]
ディープラーニングモデルのトレーニングでは、パフォーマンスと信頼の間に妥協をしなければなりません。
本研究は、新型コロナウイルス患者のコンピュータ支援スクリーニングのための自己教師型学習と新しい代理損失を統合したものである。
論文 参考訳(メタデータ) (2021-12-14T21:16:52Z) - On the Robustness of Pretraining and Self-Supervision for a Deep
Learning-based Analysis of Diabetic Retinopathy [70.71457102672545]
糖尿病網膜症における訓練方法の違いによる影響を比較検討した。
本稿では,定量的性能,学習した特徴表現の統計,解釈可能性,画像歪みに対する頑健性など,さまざまな側面について検討する。
以上の結果から,ImageNet事前学習モデルでは,画像歪みに対する性能,一般化,堅牢性が著しく向上していることが示唆された。
論文 参考訳(メタデータ) (2021-06-25T08:32:45Z) - Advancing diagnostic performance and clinical usability of neural
networks via adversarial training and dual batch normalization [2.1699022621790736]
6人の放射線学者がX線、CT、磁気共鳴画像スキャンのデータセットにおける塩分濃度マップの解釈可能性を評価する。
その結果, 十分大きなデータセットと二重バッチノルムを用いた場合, 逆学習モデルの精度は標準モデルに等しいことがわかった。
論文 参考訳(メタデータ) (2020-11-25T20:41:01Z) - Self-Training with Improved Regularization for Sample-Efficient Chest
X-Ray Classification [80.00316465793702]
挑戦的なシナリオで堅牢なモデリングを可能にするディープラーニングフレームワークを提案する。
その結果,85%のラベル付きデータを用いて,大規模データ設定で学習した分類器の性能に適合する予測モデルを構築することができた。
論文 参考訳(メタデータ) (2020-05-03T02:36:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。