論文の概要: Comparing Bayesian Models for Organ Contouring in Headand Neck
Radiotherapy
- arxiv url: http://arxiv.org/abs/2111.01134v1
- Date: Mon, 1 Nov 2021 14:46:25 GMT
- ステータス: 処理完了
- システム内更新日: 2021-11-04 02:03:06.795990
- Title: Comparing Bayesian Models for Organ Contouring in Headand Neck
Radiotherapy
- Title(参考訳): 頭頸部放射線治療における臓器コンチューリングのためのベイズモデルの比較
- Authors: Prerak Mody, Nicolas Chaves-de-Plaza, Klaus Hildebrandt, Rene van
Egmond, Huib de Ridder, Marius Staring
- Abstract要約: 本研究では,予測校正誤差 (ECE) と定性的尺度 (R-AvU) を用いて,自動コントゥーリングのためのベイズモデルDropOutとFlipOutについて検討する。
DropOut-DICE が最も ECE が高いのに対し, Dropout-CE と FlipOut-CE は ECE が低いことを示す。
MICCAI2015 Head and Neck ChallengeとDeepMindTCIA CTデータセットで,DropOut-DICE,Dropout-CE,FlipOut-CEの3つのモデルを用いて実験を行った。
- 参考スコア(独自算出の注目度): 6.499117567077562
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Deep learning models for organ contouring in radiotherapy are poised for
clinical usage, but currently, there exist few tools for automated quality
assessment (QA) of the predicted contours. Using Bayesian models and their
associated uncertainty, one can potentially automate the process of detecting
inaccurate predictions. We investigate two Bayesian models for auto-contouring,
DropOut and FlipOut, using a quantitative measure - expected calibration error
(ECE) and a qualitative measure - region-based accuracy-vs-uncertainty (R-AvU)
graphs. It is well understood that a model should have low ECE to be considered
trustworthy. However, in a QA context, a model should also have high
uncertainty in inaccurate regions and low uncertainty in accurate regions. Such
behaviour could direct visual attention of expert users to potentially
inaccurate regions, leading to a speed up in the QA process. Using R-AvU
graphs, we qualitatively compare the behaviour of different models in accurate
and inaccurate regions. Experiments are conducted on the MICCAI2015 Head and
Neck Segmentation Challenge and on the DeepMindTCIA CT dataset using three
models: DropOut-DICE, Dropout-CE (Cross Entropy) and FlipOut-CE. Quantitative
results show that DropOut-DICE has the highest ECE, while Dropout-CE and
FlipOut-CE have the lowest ECE. To better understand the difference between
DropOut-CE and FlipOut-CE, we use the R-AvU graph which shows that FlipOut-CE
has better uncertainty coverage in inaccurate regions than DropOut-CE. Such a
combination of quantitative and qualitative metrics explores a new approach
that helps to select which model can be deployed as a QA tool in clinical
settings.
- Abstract(参考訳): 放射線治療における臓器コントゥーリングの深層学習モデルは臨床応用が期待されているが、現在では予測された輪郭の自動品質評価(QA)のためのツールがほとんどない。
ベイズモデルとその関連する不確実性を用いて、不正確な予測を検出するプロセスを自動化することができる。
本研究では,予測校正誤差 (ECE) と定性的尺度 (R-AvU) を用いて,自動コントゥーリングのためのベイズモデルDropOutとFlipOutについて検討する。
モデルが低ECEを信頼に値するものとみなすべきであることはよく理解されている。
しかし、QAの文脈では、モデルは不正確な領域では高い不確実性を持ち、正確な領域では低い不確実性を持つ必要がある。
このような振る舞いは、エキスパートユーザの視覚的な注意を、潜在的に不正確なリージョンに向け、QAプロセスのスピードアップにつながる可能性がある。
R-AvUグラフを用いて、精度と不正確な領域における異なるモデルの挙動を質的に比較する。
MICCAI2015 Head and Neck Segmentation ChallengeとDeepMindTCIA CTデータセットで、DropOut-DICE、Dropout-CE (Cross Entropy)、FlipOut-CEの3つのモデルを用いて実験が行われた。
その結果,DropOut-DICEはECEが最も高く,Dropout-CEとFlipOut-CEはECEが低かった。
DropOut-CEとFlipOut-CEの違いをよりよく理解するために、R-AvUグラフを使用して、FlipOut-CEはDropOut-CEよりも不正確な領域における不確実性カバレッジが優れていることを示す。
このような量的および質的なメトリクスの組み合わせは、臨床環境でQAツールとしてデプロイできるモデルを選択するのに役立つ新しいアプローチを探求する。
関連論文リスト
- Improving Uncertainty-Error Correspondence in Deep Bayesian Medical Image Segmentation [3.3572047447192626]
不正確な領域のみに存在する不確実性を促進するために、FlipOutモデルに精度-vs-不確実性(AvU)損失を学習する。
本手法を頭頸部CTと前立腺MRIの2つの放射線治療部位のデータセットに適用する。
論文 参考訳(メタデータ) (2024-09-05T12:31:51Z) - RICA2: Rubric-Informed, Calibrated Assessment of Actions [8.641411594566714]
動作品質評価(AQA)の予測不確かさを考慮に入れた深層確率モデルRICA2を提案する。
本手法はFineDiving, MTL-AQA, JIGSAWSなどの公開ベンチマークにおいて, スコア予測と不確実性校正性能に優れた手法であることを示す。
論文 参考訳(メタデータ) (2024-08-04T20:35:33Z) - Schroedinger's Threshold: When the AUC doesn't predict Accuracy [6.091702876917282]
エリアアンダーカーブ測度(AUC)は、様々なモデルを評価し比較する傾向にある。
我々は,AUCが,アプリケーションで観測される実際の精度と誤認できる,学術的で楽観的な精度の概念を導出することを示す。
論文 参考訳(メタデータ) (2024-04-04T10:18:03Z) - Cal-SFDA: Source-Free Domain-adaptive Semantic Segmentation with
Differentiable Expected Calibration Error [50.86671887712424]
ドメイン適応型セマンティックセグメンテーションの流行は、ソースドメインデータの漏洩に関する懸念を引き起こしている。
ソースデータの要求を回避するため、ソースフリーなドメイン適応が実現可能なソリューションとして登場した。
校正誘導型ソースフリーなドメイン適応型セマンティックセマンティックセマンティクスフレームワークを提案する。
論文 参考訳(メタデータ) (2023-08-06T03:28:34Z) - Proximity-Informed Calibration for Deep Neural Networks [49.330703634912915]
ProCalは、近接性に基づいてサンプル信頼度を調整する理論的保証を持つプラグアンドプレイアルゴリズムである。
ProCalは、近接バイアスに対処し、バランスの取れた、長い、分布シフトの設定の校正を改善するのに有効であることを示す。
論文 参考訳(メタデータ) (2023-06-07T16:40:51Z) - VisFIS: Visual Feature Importance Supervision with
Right-for-the-Right-Reason Objectives [84.48039784446166]
モデルFI監督は、VQAモデルの精度と、Right-to-the-Right-Reasonメトリクスの性能を有意義に向上させることができることを示す。
我々の最高のパフォーマンス手法であるVisual Feature Importance Supervision (VisFIS)は、ベンチマークVQAデータセットで強いベースラインを上回ります。
説明が妥当で忠実な場合には予測がより正確になる。
論文 参考訳(メタデータ) (2022-06-22T17:02:01Z) - Leveraging Unlabeled Data to Predict Out-of-Distribution Performance [63.740181251997306]
実世界の機械学習デプロイメントは、ソース(トレーニング)とターゲット(テスト)ディストリビューションのミスマッチによって特徴づけられる。
本研究では,ラベル付きソースデータとラベルなしターゲットデータのみを用いて,対象領域の精度を予測する手法を検討する。
本稿では,モデルの信頼度をしきい値として学習し,精度をラベルなし例のごく一部として予測する実践的手法である平均閾値保持信頼度(ATC)を提案する。
論文 参考訳(メタデータ) (2022-01-11T23:01:12Z) - Unlabelled Data Improves Bayesian Uncertainty Calibration under
Covariate Shift [100.52588638477862]
後続正則化に基づく近似ベイズ推定法を開発した。
前立腺癌の予後モデルを世界規模で導入する上で,本手法の有用性を実証する。
論文 参考訳(メタデータ) (2020-06-26T13:50:19Z) - Calibrating Deep Neural Networks using Focal Loss [77.92765139898906]
ミススキャリブレーション(Miscalibration)は、モデルの信頼性と正しさのミスマッチである。
焦点損失は、既に十分に校正されたモデルを学ぶことができることを示す。
ほぼすべてのケースにおいて精度を損なうことなく,最先端のキャリブレーションを達成できることを示す。
論文 参考訳(メタデータ) (2020-02-21T17:35:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。