論文の概要: Confidence intervals for performance estimates in 3D medical image
segmentation
- arxiv url: http://arxiv.org/abs/2307.10926v2
- Date: Fri, 21 Jul 2023 09:47:01 GMT
- ステータス: 処理完了
- システム内更新日: 2023-07-24 15:02:50.508036
- Title: Confidence intervals for performance estimates in 3D medical image
segmentation
- Title(参考訳): 3次元医用画像分割における信頼区間の評価
- Authors: R. El Jurdi, G. Varoquaux, O. Colliot
- Abstract要約: 医用画像セグメンテーションにおける典型的な信頼区間について検討した。
与えられた精度を達成するのに必要なテストサイズは、しばしば分類タスクよりもはるかに低いことを示します。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Medical segmentation models are evaluated empirically. As such an evaluation
is based on a limited set of example images, it is unavoidably noisy. Beyond a
mean performance measure, reporting confidence intervals is thus crucial.
However, this is rarely done in medical image segmentation. The width of the
confidence interval depends on the test set size and on the spread of the
performance measure (its standard-deviation across of the test set). For
classification, many test images are needed to avoid wide confidence intervals.
Segmentation, however, has not been studied, and it differs by the amount of
information brought by a given test image. In this paper, we study the typical
confidence intervals in medical image segmentation. We carry experiments on 3D
image segmentation using the standard nnU-net framework, two datasets from the
Medical Decathlon challenge and two performance measures: the Dice accuracy and
the Hausdorff distance. We show that the parametric confidence intervals are
reasonable approximations of the bootstrap estimates for varying test set sizes
and spread of the performance metric. Importantly, we show that the test size
needed to achieve a given precision is often much lower than for classification
tasks. Typically, a 1% wide confidence interval requires about 100-200 test
samples when the spread is low (standard-deviation around 3%). More difficult
segmentation tasks may lead to higher spreads and require over 1000 samples.
- Abstract(参考訳): 医療セグメンテーションモデルは経験的に評価される。
このような評価は、サンプル画像の限られたセットに基づいているため、避けられない騒音である。
平均的なパフォーマンス指標を超えて、信頼区間の報告が重要である。
しかし、医用画像分割ではめったに行われない。
信頼区間の幅は、テストセットのサイズとパフォーマンス測定値の広がりに依存する(テストセット全体の標準緩和)。
分類には、幅広い信頼区間を避けるために多くのテスト画像が必要である。
しかし、セグメンテーションは研究されておらず、与えられたテスト画像によってもたらされる情報量によって異なる。
本稿では,医用画像分割における典型的な信頼区間について検討する。
標準のnnu-netフレームワークを用いた3次元画像分割実験を行い,医療用デカロンチャレンジから得られた2つのデータセットと,dice精度とハウスドルフ距離の2つの性能測定を行った。
パラメトリック信頼区間は,種々のテストセットサイズと性能指標の拡散に対するブートストラップ推定値の妥当な近似であることを示す。
重要となるのは,特定の精度を達成するのに必要なテストサイズが,分類タスクよりもはるかに低いことだ。
通常、1%の広信頼区間は、拡散が低い場合(標準偏差は約3%)、100-200のテストサンプルを必要とする。
より難しいセグメンテーションタスクは、より高いスプレッドをもたらし、1000以上のサンプルを必要とする。
関連論文リスト
- Robust Conformal Volume Estimation in 3D Medical Images [0.5799785223420274]
ボリュームトリは3次元医用画像セグメンテーションの主要な下流応用の1つである。
セグメンテーションモデルにより生成された圧縮潜在表現に基づく密度比推定の効率的な手法を提案する。
論文 参考訳(メタデータ) (2024-07-29T12:18:07Z) - Words Worth a Thousand Pictures: Measuring and Understanding Perceptual Variability in Text-to-Image Generation [58.77994391566484]
W1KPは、画像の集合における可変性の人間の校正尺度である。
最高の知覚距離は、9つの基準線を最大18ポイント精度で上回る。
実際のプロンプトの56の言語的特徴を分析し、プロンプトの長さ、CLIP埋め込みノルム、具体性、単語感覚が最も変動に影響を及ぼすことを示した。
論文 参考訳(メタデータ) (2024-06-12T17:59:27Z) - Medical Image Segmentation with InTEnt: Integrated Entropy Weighting for
Single Image Test-Time Adaptation [6.964589353845092]
テスト時間適応(TTA)とは、テスト中にトレーニングされたモデルを新しいドメインに適応させることである。
そこで本研究では,単一の未ラベルテスト画像のみを用いて,医用画像分割モデルを適用することを提案する。
提案手法は, 平均2.9%のDice係数で, 3つの医用画像データセットにまたがる24のソース/ターゲット領域に分割して検証した。
論文 参考訳(メタデータ) (2024-02-14T22:26:07Z) - Towards Reliable Medical Image Segmentation by utilizing Evidential Calibrated Uncertainty [52.03490691733464]
本稿では,医療画像セグメンテーションネットワークにシームレスに統合可能な,実装が容易な基礎モデルであるDEviSを紹介する。
主観的論理理論を利用して、医用画像分割の問題に対する確率と不確実性を明示的にモデル化する。
DeviSには不確実性を考慮したフィルタリングモジュールが組み込まれている。
論文 参考訳(メタデータ) (2023-01-01T05:02:46Z) - How precise are performance estimates for typical medical image
segmentation tasks? [3.606795745041439]
本稿では,医用画像セグメンテーション研究において期待できる,典型的な信頼度を推定することを目的とする。
ガウス仮定とブートストラッピングの両方を用いた精度推定を広範囲に研究した。
全体として、我々の研究は、小さなテストセットが広範囲の信頼区間につながることを示している。
論文 参考訳(メタデータ) (2022-10-26T12:53:15Z) - DOMINO: Domain-aware Model Calibration in Medical Image Segmentation [51.346121016559024]
現代のディープニューラルネットワークはキャリブレーションが不十分で、信頼性と信頼性を損なう。
本稿では,クラスラベル間のセマンティック・コンフューザビリティと階層的類似性を利用したドメイン認識モデルキャリブレーション手法であるDOMINOを提案する。
その結果,DOMINOを校正したディープニューラルネットワークは,頭部画像分割における非校正モデルや最先端形態計測法よりも優れていた。
論文 参考訳(メタデータ) (2022-09-13T15:31:52Z) - Towards Semi-Supervised Deep Facial Expression Recognition with An
Adaptive Confidence Margin [92.76372026435858]
Ada-CM(Adaptive Confidence Margin)を学習し、ラベルのないすべてのデータを半教師付き深層表情認識に活用する。
すべてのラベルなしサンプルは、信頼スコアと適応的に学習された信頼マージンを比較して、2つのサブセットに分割される。
提案手法は最先端の性能,特に半教師付きベースラインを超越した性能を実現する。
論文 参考訳(メタデータ) (2022-03-23T11:43:29Z) - Layer Ensembles: A Single-Pass Uncertainty Estimation in Deep Learning
for Segmentation [7.856209828002792]
本研究では,ネットワークの予測不確実性を推定するために,単一のパスのみを必要とする新しい不確実性推定手法であるLayer Ensemblesを提案する。
本稿では,2次元・3次元・2次元・複数クラスの医用画像分割タスクについて検討する。
論文 参考訳(メタデータ) (2022-03-16T18:46:53Z) - Inconsistency-aware Uncertainty Estimation for Semi-supervised Medical
Image Segmentation [92.9634065964963]
我々は、不確実性推定と個別の自己学習戦略に基づいて、新しい半教師付きセグメンテーションモデル、すなわち保守的ラディカルネットワーク(CoraNet)を提案する。
現在の技術と比較すると、ColaNetは優れたパフォーマンスを示しています。
論文 参考訳(メタデータ) (2021-10-17T08:49:33Z) - SSEGEP: Small SEGment Emphasized Performance evaluation metric for
medical image segmentation [0.0]
SSEGEP (Small SEGment Emphasized Performance Evaluation metric) (range : 0(Bad) to 1(Good))
SSEGEP (Small SEGment Emphasized Performance Evaluation metric) (range : 0(Bad) to 1(Good))
最大の露光物が1.41%、最小が0.0002%の33基の画像に対して、提案されたメートル法はDice similarity Coefficient (DSC)と比較すると、MOSに30%近い。
論文 参考訳(メタデータ) (2021-09-08T05:05:49Z) - Medical Instrument Segmentation in 3D US by Hybrid Constrained
Semi-Supervised Learning [62.13520959168732]
3DUSにおける楽器セグメンテーションのための半教師付き学習フレームワークを提案する。
SSL学習を実現するため、Dual-UNetが提案されている。
提案手法は,Diceの約68.6%-69.1%,推定時間約1秒を実現している。
論文 参考訳(メタデータ) (2021-07-30T07:59:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。