論文の概要: Calibration and Uncertainty for multiRater Volume Assessment in multiorgan Segmentation (CURVAS) challenge results
- arxiv url: http://arxiv.org/abs/2505.08685v1
- Date: Tue, 13 May 2025 15:45:44 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-14 20:57:54.650507
- Title: Calibration and Uncertainty for multiRater Volume Assessment in multiorgan Segmentation (CURVAS) challenge results
- Title(参考訳): CURVAS (Multiorgan Segmentation) における多層体積評価の校正と不確実性
- Authors: Meritxell Riera-Marin, Sikha O K, Julia Rodriguez-Comas, Matthias Stefan May, Zhaohong Pan, Xiang Zhou, Xiaokun Liang, Franciskus Xaverius Erick, Andrea Prenner, Cedric Hemon, Valentin Boussot, Jean-Louis Dillenseger, Jean-Claude Nunes, Abdul Qayyum, Moona Mazher, Steven A Niederer, Kaisar Kushibar, Carlos Martin-Isla, Petia Radeva, Karim Lekadir, Theodore Barfoot, Luis C. Garcia Peraza Herrera, Ben Glocker, Tom Vercauteren, Lucas Gago, Justin Englemann, Joy-Marie Kleiss, Anton Aubanell, Andreu Antolin, Javier Garcia-Lopez, Miguel A. Gonzalez Ballester, Adrian Galdran,
- Abstract要約: 深層学習(DL)が医用画像セグメンテーションの主流となっている。
この課題は、より包括的な基盤真理を確立する上で、複数のアノテータが果たす重要な役割を強調している。
我々は,DLモデルが不確実性をどのように扱うか,信頼度推定が真のセグメンテーション性能と一致しているかを評価する。
- 参考スコア(独自算出の注目度): 13.916536022733084
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Deep learning (DL) has become the dominant approach for medical image segmentation, yet ensuring the reliability and clinical applicability of these models requires addressing key challenges such as annotation variability, calibration, and uncertainty estimation. This is why we created the Calibration and Uncertainty for multiRater Volume Assessment in multiorgan Segmentation (CURVAS), which highlights the critical role of multiple annotators in establishing a more comprehensive ground truth, emphasizing that segmentation is inherently subjective and that leveraging inter-annotator variability is essential for robust model evaluation. Seven teams participated in the challenge, submitting a variety of DL models evaluated using metrics such as Dice Similarity Coefficient (DSC), Expected Calibration Error (ECE), and Continuous Ranked Probability Score (CRPS). By incorporating consensus and dissensus ground truth, we assess how DL models handle uncertainty and whether their confidence estimates align with true segmentation performance. Our findings reinforce the importance of well-calibrated models, as better calibration is strongly correlated with the quality of the results. Furthermore, we demonstrate that segmentation models trained on diverse datasets and enriched with pre-trained knowledge exhibit greater robustness, particularly in cases deviating from standard anatomical structures. Notably, the best-performing models achieved high DSC and well-calibrated uncertainty estimates. This work underscores the need for multi-annotator ground truth, thorough calibration assessments, and uncertainty-aware evaluations to develop trustworthy and clinically reliable DL-based medical image segmentation models.
- Abstract(参考訳): 深層学習(DL)が医用画像セグメンテーションの主要なアプローチとなっているが、これらのモデルの信頼性と臨床応用性を保証するためには、アノテーションの可変性、校正性、不確実性推定といった重要な課題に対処する必要がある。
そこで我々は,複数のアノテータがより包括的基盤真理を確立する上で重要な役割を担い,セグメンテーションが本質的に主観的であり,アノテータ間の可変性を活用することがロバストモデル評価に不可欠であることを強調して,マルチラターボリュームアセスメント(CURVAS)の校正と不確実性(Calibration and Uncertainty)を作成した。
このチャレンジには7つのチームが参加し、Dice similarity Coefficient(DSC)、期待校正誤差(ECE)、継続的ランク付け確率スコア(CRPS)といったメトリクスを用いて評価されたさまざまなDLモデルを提出した。
コンセンサスと不一致な基礎的真理を取り入れることで、DLモデルがどのように不確実性に対処し、信頼度推定が真のセグメンテーション性能と一致しているかを評価する。
その結果, キャリブレーションの精度が結果の質と強く相関していることから, 校正モデルの重要性が高まった。
さらに、様々なデータセットに基づいて訓練し、事前学習した知識で豊かに訓練されたセグメンテーションモデルは、特に標準的な解剖学的構造から逸脱した場合において、より堅牢性を示すことを示した。
特に、最高の性能のモデルは高いDSCとよく校正された不確実性推定を達成した。
本研究は, 信頼性・信頼性の高いDLベースの医用画像セグメンテーションモデルを開発するために, マルチアノテータの真理, 徹底的な校正評価, 不確実性評価の必要性を明らかにするものである。
関連論文リスト
- Metrics that matter: Evaluating image quality metrics for medical image generation [48.85783422900129]
本研究は、脳MRIデータを用いて、一般的に使用される非参照画像品質指標を包括的に評価する。
本研究は, ノイズ, 分布変化, および臨床的に関係のある不正確さを模倣した形態的変化を含む, 様々な課題に対する計量感度を評価する。
論文 参考訳(メタデータ) (2025-05-12T01:57:25Z) - Efficient Epistemic Uncertainty Estimation in Cerebrovascular Segmentation [1.3980986259786223]
ベイズ近似とディープアンサンブルの利点を組み合わせた効率的なアンサンブルモデルを提案する。
高モデル不確実性と誤予測の領域は一致しており、このアプローチの有効性と信頼性を示している。
論文 参考訳(メタデータ) (2025-03-28T09:39:37Z) - Dynamic Correlation Learning and Regularization for Multi-Label Confidence Calibration [60.95748658638956]
本稿では,多ラベルシナリオにおける信頼度を適切に評価することを目的としたマルチラベル信頼性タスクを提案する。
既存のシングルラベルキャリブレーション手法では、セマンティックな混乱に対処するために欠かせないカテゴリ相関を考慮できない。
本稿では,多粒度セマンティック相関を利用した動的相関学習と正規化アルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-07-09T13:26:21Z) - EDUE: Expert Disagreement-Guided One-Pass Uncertainty Estimation for Medical Image Segmentation [1.757276115858037]
本稿では,医用画像分割のためのエキスパート診断誘導不確実性推定(EDUE)を提案する。
複数のラッカーからの接地構文アノテーションの可変性を活用することにより、トレーニング中のモデルをガイドし、ランダムサンプリングに基づく戦略を取り入れ、校正信頼性を高める。
論文 参考訳(メタデータ) (2024-03-25T10:13:52Z) - Calibrating Large Language Models with Sample Consistency [76.23956851098598]
本稿では,複数サンプルモデル生成系の分布から信頼度を導出する可能性について,一貫性の3つの尺度を用いて検討する。
その結果、一貫性に基づくキャリブレーション手法は、既存のポストホック手法よりも優れていることがわかった。
種々のLMの特性に合わせて,キャリブレーションに適した整合性指標を選択するための実用的なガイダンスを提供する。
論文 参考訳(メタデータ) (2024-02-21T16:15:20Z) - Towards Better Certified Segmentation via Diffusion Models [62.21617614504225]
セグメンテーションモデルは敵の摂動に弱いため、医療や自動運転といった重要な意思決定システムでの使用を妨げます。
近年,理論的保証を得るためにガウス雑音を入力に加えることにより,セグメント化予測のランダム化が提案されている。
本稿では,ランダムな平滑化と拡散モデルを組み合わせたセグメンテーション予測の問題に対処する。
論文 参考訳(メタデータ) (2023-06-16T16:30:39Z) - Towards Reliable Medical Image Segmentation by utilizing Evidential Calibrated Uncertainty [52.03490691733464]
本稿では,医療画像セグメンテーションネットワークにシームレスに統合可能な,実装が容易な基礎モデルであるDEviSを紹介する。
主観的論理理論を利用して、医用画像分割の問題に対する確率と不確実性を明示的にモデル化する。
DeviSには不確実性を考慮したフィルタリングモジュールが組み込まれている。
論文 参考訳(メタデータ) (2023-01-01T05:02:46Z) - BSM loss: A superior way in modeling aleatory uncertainty of
fine_grained classification [0.0]
混合データ拡張戦略を用いた改良型ブートストラップ損失(BS損失)関数を提案する。
実験の結果,Mixup(BSM)モデルによるBS損失は,標準データ拡張と比較して予測誤差(ECE)を半減できることがわかった。
BSMモデルはドメイン外のデータのセマンティックな距離を知覚することができ、実際の臨床実践において高い可能性を示す。
論文 参考訳(メタデータ) (2022-06-09T13:06:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。