論文の概要: Average Calibration Losses for Reliable Uncertainty in Medical Image Segmentation
- arxiv url: http://arxiv.org/abs/2506.03942v1
- Date: Wed, 04 Jun 2025 13:32:07 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-05 21:20:14.356298
- Title: Average Calibration Losses for Reliable Uncertainty in Medical Image Segmentation
- Title(参考訳): 医用画像分割における信頼性不確かさに対する平均校正損失
- Authors: Theodore Barfoot, Luis C. Garcia-Peraza-Herrera, Samet Akcay, Ben Glocker, Tom Vercauteren,
- Abstract要約: 医用画像セグメンテーションのためのディープニューラルネットワークは、しばしば過信され、信頼性と臨床的有用性の両方を損なう。
画像毎に計算可能な補助的損失として,L1平均誤差(mL1-ACE)の微分可能な定式化を提案する。
ソフトボンドの変種は、Diceとクロスエントロピー損失ベースラインよりもキャリブレーションの最大の改善をもたらすが、しばしばセグメンテーション性能を損なう。
- 参考スコア(独自算出の注目度): 14.869379716339212
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Deep neural networks for medical image segmentation are often overconfident, compromising both reliability and clinical utility. In this work, we propose differentiable formulations of marginal L1 Average Calibration Error (mL1-ACE) as an auxiliary loss that can be computed on a per-image basis. We compare both hard- and soft-binning approaches to directly improve pixel-wise calibration. Our experiments on four datasets (ACDC, AMOS, KiTS, BraTS) demonstrate that incorporating mL1-ACE significantly reduces calibration errors, particularly Average Calibration Error (ACE) and Maximum Calibration Error (MCE), while largely maintaining high Dice Similarity Coefficients (DSCs). We find that the soft-binned variant yields the greatest improvements in calibration, over the Dice plus cross-entropy loss baseline, but often compromises segmentation performance, with hard-binned mL1-ACE maintaining segmentation performance, albeit with weaker calibration improvement. To gain further insight into calibration performance and its variability across an imaging dataset, we introduce dataset reliability histograms, an aggregation of per-image reliability diagrams. The resulting analysis highlights improved alignment between predicted confidences and true accuracies. Overall, our approach not only enhances the trustworthiness of segmentation predictions but also shows potential for safer integration of deep learning methods into clinical workflows. We share our code here: https://github.com/cai4cai/Average-Calibration-Losses
- Abstract(参考訳): 医用画像セグメンテーションのためのディープニューラルネットワークは、しばしば過信され、信頼性と臨床的有用性の両方を損なう。
本研究では,画像毎の平均校正誤差 (mL1-ACE) の差分式を補助的損失として提案する。
ピクセルワイドキャリブレーションを直接改善するため,ハード・バイニングとソフト・バイニングの両手法を比較した。
4つのデータセット(ACDC, AMOS, KiTS, BraTS)に対する実験により,mL1-ACEを組み込むことでキャリブレーションエラー,特に平均キャリブレーション誤差(ACE)と最大キャリブレーション誤差(MCE)を著しく低減し,高いDice類似度係数(DSCs)を維持した。
ソフトボンドの変種は、Diceとクロスエントロピー損失ベースラインよりもキャリブレーションの最大の改善をもたらすが、しばしばセグメンテーション性能を損なうことがあり、ハードボンドのmL1-ACEはセグメンテーション性能を維持するが、キャリブレーションの改善は弱くなる。
画像データセットのキャリブレーション性能とその変動性に関するさらなる知見を得るため、画像毎の信頼性図の集計である、データセットの信頼性ヒストグラムを導入する。
結果として得られた分析は、予測された信頼と真の精度の整合性の向上を強調している。
全体として,本手法はセグメンテーション予測の信頼性を高めるだけでなく,より安全な深層学習手法を臨床ワークフローに統合する可能性も示している。
https://github.com/cai4cai/Average-Calibration-Losses
関連論文リスト
- We Care Each Pixel: Calibrating on Medical Segmentation Model [15.826029150910566]
pixel-wise expected Error (pECE) は、画素レベルでの誤校正を測定する新しい指標である。
また, キャリブレーション損失の計算に先立って, 地中トラスマスクに形態的操作を適用する形態的適応戦略を導入する。
本手法はセグメンテーション性能を向上するだけでなく,キャリブレーション品質も向上し,信頼性の高い推定値が得られる。
論文 参考訳(メタデータ) (2025-03-07T03:06:03Z) - Average Calibration Error: A Differentiable Loss for Improved
Reliability in Image Segmentation [17.263160921956445]
本稿では,L1平均キャリブレーション誤差(mL1-ACE)を新たな補助損失関数として用いて,セグメンテーション品質を損なうことなく画素ワイドキャリブレーションを改善することを提案する。
この損失は、ハード・ビンニングを用いても直接微分可能であり、近似的ではあるが微分可能なサロゲートやソフト・ビンニングのアプローチを回避できることが示される。
論文 参考訳(メタデータ) (2024-03-11T14:31:03Z) - Towards Reliable Medical Image Segmentation by utilizing Evidential Calibrated Uncertainty [52.03490691733464]
本稿では,医療画像セグメンテーションネットワークにシームレスに統合可能な,実装が容易な基礎モデルであるDEviSを紹介する。
主観的論理理論を利用して、医用画像分割の問題に対する確率と不確実性を明示的にモデル化する。
DeviSには不確実性を考慮したフィルタリングモジュールが組み込まれている。
論文 参考訳(メタデータ) (2023-01-01T05:02:46Z) - On Calibrating Semantic Segmentation Models: Analyses and An Algorithm [51.85289816613351]
セマンティックセグメンテーションキャリブレーションの問題について検討する。
モデルキャパシティ、作物サイズ、マルチスケールテスト、予測精度はキャリブレーションに影響を及ぼす。
我々は、単純で統一的で効果的なアプローチ、すなわち選択的スケーリングを提案する。
論文 参考訳(メタデータ) (2022-12-22T22:05:16Z) - A Closer Look at the Calibration of Differentially Private Learners [33.715727551832785]
差分プライベート降下勾配(DP-SGD)を訓練した分類器の校正について検討する。
本分析では,DP-SGDの勾配クリッピングを誤校正の原因として同定した。
温度スケーリングやプラットスケーリングといった後処理キャリブレーション手法の個人差が驚くほど有効であることを示す。
論文 参考訳(メタデータ) (2022-10-15T10:16:18Z) - DOMINO: Domain-aware Model Calibration in Medical Image Segmentation [51.346121016559024]
現代のディープニューラルネットワークはキャリブレーションが不十分で、信頼性と信頼性を損なう。
本稿では,クラスラベル間のセマンティック・コンフューザビリティと階層的類似性を利用したドメイン認識モデルキャリブレーション手法であるDOMINOを提案する。
その結果,DOMINOを校正したディープニューラルネットワークは,頭部画像分割における非校正モデルや最先端形態計測法よりも優れていた。
論文 参考訳(メタデータ) (2022-09-13T15:31:52Z) - Calibrating the Dice loss to handle neural network overconfidence for
biomedical image segmentation [2.6465053740712157]
Dice similarity coefficient (DSC) は、バイオメディカルイメージセグメンテーションにおいて広く用いられている計量と損失関数である。
本研究では, バイオメディカルイメージセグメンテーションの新たな課題として, キャリブレーションの低さを同定する。
DSC++損失は、過信、不正確な予測に関連するペナルティを選択的に調節する。
論文 参考訳(メタデータ) (2021-10-31T16:02:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。