Fugu-MT 論文翻訳(概要): Calibration and Uncertainty for multiRater Volume Assessment in multiorgan Segmentation (CURVAS) challenge results

論文の概要: Calibration and Uncertainty for multiRater Volume Assessment in multiorgan Segmentation (CURVAS) challenge results

arxiv url: http://arxiv.org/abs/2505.08685v1
Date: Tue, 13 May 2025 15:45:44 GMT
ステータス: 翻訳完了
システム内更新日: 2025-05-14 20:57:54.650507
Title: Calibration and Uncertainty for multiRater Volume Assessment in multiorgan Segmentation (CURVAS) challenge results
Title（参考訳）: CURVAS (Multiorgan Segmentation) における多層体積評価の校正と不確実性
Authors: Meritxell Riera-Marin, Sikha O K, Julia Rodriguez-Comas, Matthias Stefan May, Zhaohong Pan, Xiang Zhou, Xiaokun Liang, Franciskus Xaverius Erick, Andrea Prenner, Cedric Hemon, Valentin Boussot, Jean-Louis Dillenseger, Jean-Claude Nunes, Abdul Qayyum, Moona Mazher, Steven A Niederer, Kaisar Kushibar, Carlos Martin-Isla, Petia Radeva, Karim Lekadir, Theodore Barfoot, Luis C. Garcia Peraza Herrera, Ben Glocker, Tom Vercauteren, Lucas Gago, Justin Englemann, Joy-Marie Kleiss, Anton Aubanell, Andreu Antolin, Javier Garcia-Lopez, Miguel A. Gonzalez Ballester, Adrian Galdran,
Abstract要約: 深層学習(DL)が医用画像セグメンテーションの主流となっている。この課題は、より包括的な基盤真理を確立する上で、複数のアノテータが果たす重要な役割を強調している。我々は,DLモデルが不確実性をどのように扱うか,信頼度推定が真のセグメンテーション性能と一致しているかを評価する。
参考スコア（独自算出の注目度）: 13.916536022733084
License: http://creativecommons.org/licenses/by-nc-sa/4.0/
Abstract: Deep learning (DL) has become the dominant approach for medical image segmentation, yet ensuring the reliability and clinical applicability of these models requires addressing key challenges such as annotation variability, calibration, and uncertainty estimation. This is why we created the Calibration and Uncertainty for multiRater Volume Assessment in multiorgan Segmentation (CURVAS), which highlights the critical role of multiple annotators in establishing a more comprehensive ground truth, emphasizing that segmentation is inherently subjective and that leveraging inter-annotator variability is essential for robust model evaluation. Seven teams participated in the challenge, submitting a variety of DL models evaluated using metrics such as Dice Similarity Coefficient (DSC), Expected Calibration Error (ECE), and Continuous Ranked Probability Score (CRPS). By incorporating consensus and dissensus ground truth, we assess how DL models handle uncertainty and whether their confidence estimates align with true segmentation performance. Our findings reinforce the importance of well-calibrated models, as better calibration is strongly correlated with the quality of the results. Furthermore, we demonstrate that segmentation models trained on diverse datasets and enriched with pre-trained knowledge exhibit greater robustness, particularly in cases deviating from standard anatomical structures. Notably, the best-performing models achieved high DSC and well-calibrated uncertainty estimates. This work underscores the need for multi-annotator ground truth, thorough calibration assessments, and uncertainty-aware evaluations to develop trustworthy and clinically reliable DL-based medical image segmentation models.
Abstract（参考訳）: 深層学習(DL)が医用画像セグメンテーションの主要なアプローチとなっているが、これらのモデルの信頼性と臨床応用性を保証するためには、アノテーションの可変性、校正性、不確実性推定といった重要な課題に対処する必要がある。そこで我々は,複数のアノテータがより包括的基盤真理を確立する上で重要な役割を担い,セグメンテーションが本質的に主観的であり,アノテータ間の可変性を活用することがロバストモデル評価に不可欠であることを強調して,マルチラターボリュームアセスメント(CURVAS)の校正と不確実性(Calibration and Uncertainty)を作成した。このチャレンジには7つのチームが参加し、Dice similarity Coefficient(DSC)、期待校正誤差(ECE)、継続的ランク付け確率スコア(CRPS)といったメトリクスを用いて評価されたさまざまなDLモデルを提出した。コンセンサスと不一致な基礎的真理を取り入れることで、DLモデルがどのように不確実性に対処し、信頼度推定が真のセグメンテーション性能と一致しているかを評価する。その結果, キャリブレーションの精度が結果の質と強く相関していることから, 校正モデルの重要性が高まった。さらに、様々なデータセットに基づいて訓練し、事前学習した知識で豊かに訓練されたセグメンテーションモデルは、特に標準的な解剖学的構造から逸脱した場合において、より堅牢性を示すことを示した。特に、最高の性能のモデルは高いDSCとよく校正された不確実性推定を達成した。本研究は, 信頼性・信頼性の高いDLベースの医用画像セグメンテーションモデルを開発するために, マルチアノテータの真理, 徹底的な校正評価, 不確実性評価の必要性を明らかにするものである。

関連論文リスト

Intervention Efficiency and Perturbation Validation Framework: Capacity-Aware and Robust Clinical Model Selection under the Rashomon Effect [8.16102315566872]
同等のパフォーマンスを持つ複数のモデルの共存は、信頼できるデプロイメントと評価に根本的な課題をもたらします。我々は,頑健なモデルアセスメントと選択のための2つの補完的ツールを提案する: 介入効率(IE)と摂動検証フレームワーク(PVF)。 IEはキャパシティを意識したメトリクスであり、限られた介入しか実現できない場合、モデルが実行可能な真の正をいかに効率的に識別するかを定量化する。 PVFは、データ摂動下でのモデルの安定性を評価するための構造化されたアプローチを導入し、ノイズやシフトした検証セット間で性能が最も不変なモデルを特定する。
論文参考訳（メタデータ） (2025-11-18T10:21:07Z)
Metrics that matter: Evaluating image quality metrics for medical image generation [48.85783422900129]
本研究は、脳MRIデータを用いて、一般的に使用される非参照画像品質指標を包括的に評価する。本研究は, ノイズ, 分布変化, および臨床的に関係のある不正確さを模倣した形態的変化を含む, 様々な課題に対する計量感度を評価する。
論文参考訳（メタデータ） (2025-05-12T01:57:25Z)
Efficient Epistemic Uncertainty Estimation in Cerebrovascular Segmentation [1.3980986259786223]
ベイズ近似とディープアンサンブルの利点を組み合わせた効率的なアンサンブルモデルを提案する。高モデル不確実性と誤予測の領域は一致しており、このアプローチの有効性と信頼性を示している。
論文参考訳（メタデータ） (2025-03-28T09:39:37Z)
Enhancing Healthcare LLM Trust with Atypical Presentations Recalibration [20.049443396032423]
ブラックボックスの大規模言語モデル(LLM)は、様々な環境に徐々に展開されている。 LLMは、しばしば過剰な自信を示し、潜在的なリスクや誤った判断につながる。本稿では,非定型的なプレゼンテーションを利用してモデルの信頼度を推定する新しい手法であるtextitAtypical presentations Recalibrationを提案する。
論文参考訳（メタデータ） (2024-09-05T03:45:35Z)
Dynamic Correlation Learning and Regularization for Multi-Label Confidence Calibration [60.95748658638956]
本稿では,多ラベルシナリオにおける信頼度を適切に評価することを目的としたマルチラベル信頼性タスクを提案する。既存のシングルラベルキャリブレーション手法では、セマンティックな混乱に対処するために欠かせないカテゴリ相関を考慮できない。本稿では,多粒度セマンティック相関を利用した動的相関学習と正規化アルゴリズムを提案する。
論文参考訳（メタデータ） (2024-07-09T13:26:21Z)
EDUE: Expert Disagreement-Guided One-Pass Uncertainty Estimation for Medical Image Segmentation [1.757276115858037]
本稿では,医用画像分割のためのエキスパート診断誘導不確実性推定(EDUE)を提案する。複数のラッカーからの接地構文アノテーションの可変性を活用することにより、トレーニング中のモデルをガイドし、ランダムサンプリングに基づく戦略を取り入れ、校正信頼性を高める。
論文参考訳（メタデータ） (2024-03-25T10:13:52Z)
Calibrating Large Language Models with Sample Consistency [76.23956851098598]
本稿では,複数サンプルモデル生成系の分布から信頼度を導出する可能性について,一貫性の3つの尺度を用いて検討する。その結果、一貫性に基づくキャリブレーション手法は、既存のポストホック手法よりも優れていることがわかった。種々のLMの特性に合わせて,キャリブレーションに適した整合性指標を選択するための実用的なガイダンスを提供する。
論文参考訳（メタデータ） (2024-02-21T16:15:20Z)
On the Calibration of Large Language Models and Alignment [63.605099174744865]
信頼性キャリブレーションは、ディープモデルの信頼性を高める重要なツールである。構築プロセス全体を通して、アライメント言語モデルの校正を体系的に検討する。我々の研究は、人気のあるLCMが十分に校正されているか、トレーニングプロセスがモデルの校正にどのように影響するかに光を当てています。
論文参考訳（メタデータ） (2023-11-22T08:57:55Z)
Towards Better Certified Segmentation via Diffusion Models [62.21617614504225]
セグメンテーションモデルは敵の摂動に弱いため、医療や自動運転といった重要な意思決定システムでの使用を妨げます。近年,理論的保証を得るためにガウス雑音を入力に加えることにより,セグメント化予測のランダム化が提案されている。本稿では,ランダムな平滑化と拡散モデルを組み合わせたセグメンテーション予測の問題に対処する。
論文参考訳（メタデータ） (2023-06-16T16:30:39Z)
Towards Reliable Medical Image Segmentation by utilizing Evidential Calibrated Uncertainty [52.03490691733464]
本稿では,医療画像セグメンテーションネットワークにシームレスに統合可能な,実装が容易な基礎モデルであるDEviSを紹介する。主観的論理理論を利用して、医用画像分割の問題に対する確率と不確実性を明示的にモデル化する。 DeviSには不確実性を考慮したフィルタリングモジュールが組み込まれている。
論文参考訳（メタデータ） (2023-01-01T05:02:46Z)
BSM loss: A superior way in modeling aleatory uncertainty of fine_grained classification [0.0]
混合データ拡張戦略を用いた改良型ブートストラップ損失(BS損失)関数を提案する。実験の結果,Mixup(BSM)モデルによるBS損失は,標準データ拡張と比較して予測誤差(ECE)を半減できることがわかった。 BSMモデルはドメイン外のデータのセマンティックな距離を知覚することができ、実際の臨床実践において高い可能性を示す。
論文参考訳（メタデータ） (2022-06-09T13:06:51Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。