論文の概要: Failure Detection in Medical Image Classification: A Reality Check and
Benchmarking Testbed
- arxiv url: http://arxiv.org/abs/2205.14094v1
- Date: Fri, 27 May 2022 16:50:48 GMT
- ステータス: 処理完了
- システム内更新日: 2022-05-30 13:56:29.465934
- Title: Failure Detection in Medical Image Classification: A Reality Check and
Benchmarking Testbed
- Title(参考訳): 医用画像分類における故障検出:現実検査とベンチマークテストベッド
- Authors: Melanie Bernhardt, Fabio De Sousa Ribeiro, Ben Glocker
- Abstract要約: 自動画像分類における故障検出は、臨床展開にとって重要な安全策である。
その最重要さにもかかわらず、テストタイムの失敗を検出する最先端の信頼度評価手法の能力に関する証拠は不十分である。
本稿では,ドメイン内誤分類検出手法の性能を実証する現実チェックを提案する。
- 参考スコア(独自算出の注目度): 23.25084022554028
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Failure detection in automated image classification is a critical safeguard
for clinical deployment. Detected failure cases can be referred to human
assessment, ensuring patient safety in computer-aided clinical decision making.
Despite its paramount importance, there is insufficient evidence about the
ability of state-of-the-art confidence scoring methods to detect test-time
failures of classification models in the context of medical imaging. This paper
provides a reality check, establishing the performance of in-domain
misclassification detection methods, benchmarking 9 confidence scores on 6
medical imaging datasets with different imaging modalities, in multiclass and
binary classification settings. Our experiments show that the problem of
failure detection is far from being solved. We found that none of the
benchmarked advanced methods proposed in the computer vision and machine
learning literature can consistently outperform a simple softmax baseline. Our
developed testbed facilitates future work in this important area.
- Abstract(参考訳): 自動画像分類における障害検出は臨床展開にとって重要な安全策である。
検出された障害症例は、人的評価と呼ばれ、コンピュータ支援による臨床的意思決定における患者の安全性を保証する。
その重要さにもかかわらず、医療画像の文脈で分類モデルのテスト時間障害を検出するための最先端の信頼度スコアリング手法の能力に関する証拠は不十分である。
本稿では,領域内ミス分類検出手法の性能を検証し,画像の異なる6つの画像データセットに対する信頼度スコアをマルチクラスおよびバイナリ分類設定でベンチマークする。
実験の結果, 故障検出の問題は, 解決には程遠いことがわかった。
コンピュータビジョンと機械学習の文献で提案されるベンチマークされた高度な手法のいずれも、単純なソフトマックスベースラインを一貫して上回るものではないことがわかった。
私たちの開発したテストベッドは、この重要な領域における将来の作業を促進する。
関連論文リスト
- Comparative Benchmarking of Failure Detection Methods in Medical Image Segmentation: Unveiling the Role of Confidence Aggregation [0.723226140060364]
本稿では,医療画像セグメンテーションにおける故障検出手法の評価を目的とした総合的なベンチマークフレームワークを提案する。
我々は、現在の障害検出指標の強度と限界を特定し、リスクカバレッジ分析を全体的評価アプローチとして推奨する。
論文 参考訳(メタデータ) (2024-06-05T14:36:33Z) - Adapting Visual-Language Models for Generalizable Anomaly Detection in Medical Images [68.42215385041114]
本稿では,CLIPモデルを用いた医用異常検出のための軽量な多レベル適応と比較フレームワークを提案する。
提案手法では,複数の残像アダプタを事前学習した視覚エンコーダに統合し,視覚的特徴の段階的向上を実現する。
医学的異常検出ベンチマーク実験により,本手法が現在の最先端モデルを大幅に上回っていることが示された。
論文 参考訳(メタデータ) (2024-03-19T09:28:19Z) - Robustness Stress Testing in Medical Image Classification [26.094688963784254]
我々はストレステストを用いて、疾患検出モデルにおけるモデルロバスト性およびサブグループパフォーマンスの相違を評価する。
胸部X線画像と皮膚病変画像に対する疾患検出モデルのロバスト性の測定にストレステストを適用した。
我々の実験は、いくつかのモデルが他のモデルよりもより堅牢で公平な性能が得られることを示唆している。
論文 参考訳(メタデータ) (2023-08-14T02:02:56Z) - Uncertainty-inspired Open Set Learning for Retinal Anomaly
Identification [71.06194656633447]
9つの網膜条件の基底像をトレーニングし,不確実性に着想を得たオープンセット(UIOS)モデルを構築した。
しきい値戦略を持つUIOSモデルはF1スコア99.55%、97.01%、91.91%を達成した。
UIOSは、高い不確実性スコアを正しく予測し、非ターゲットの網膜疾患、低品質の眼底画像、および非基本画像のデータセットを手動でチェックする必要があることを示唆した。
論文 参考訳(メタデータ) (2023-04-08T10:47:41Z) - Explainable Image Quality Assessment for Medical Imaging [0.0]
質の悪い医療画像は誤診につながる可能性がある。
本稿では,説明可能な画像品質評価システムを提案し,その考え方を2つの異なる目的に対して検証する。
本研究では,サリエンシ検出器の忠実度を測定するために,様々な手法を適用した。
我々は,NormGradがObject-CXRで0.853点,LVOTデータセットで0.611点,繰り返しポイントゲームで0.853点に達することで,他のサリエンシ検出器よりも顕著に向上したことを示す。
論文 参考訳(メタデータ) (2023-03-25T14:18:39Z) - Automated SSIM Regression for Detection and Quantification of Motion
Artefacts in Brain MR Images [54.739076152240024]
磁気共鳴脳画像における運動アーチファクトは重要な問題である。
MR画像の画質評価は,臨床診断に先立って基本的である。
構造類似度指数(SSIM)回帰に基づく自動画像品質評価法が提案されている。
論文 参考訳(メタデータ) (2022-06-14T10:16:54Z) - Improving Clinical Diagnosis Performance with Automated X-ray Scan
Quality Enhancement Algorithms [0.9137554315375919]
臨床診断において、医療画像には、ノイズ、ぼかし、故障装置によって導入された欠陥アーチファクトが含まれている可能性がある。
本稿では,医用画像の超解像処理に適応し,ベンチマークを行うための画像品質改善手法を提案する。
論文 参考訳(メタデータ) (2022-01-17T07:27:03Z) - Confidence-based Out-of-Distribution Detection: A Comparative Study and
Analysis [17.398553230843717]
我々は、信頼度に基づくOOD検出のための様々な最先端手法の能力を評価する。
まず,コンピュータビジョンベンチマークを用いて複数のOOD検出手法を再現・比較する。
次に,胸部X線を用いた疾患分類の課題に対して,その能力を評価する。
論文 参考訳(メタデータ) (2021-07-06T12:10:09Z) - Malignancy Prediction and Lesion Identification from Clinical
Dermatological Images [65.1629311281062]
臨床皮膚画像から機械学習に基づく悪性度予測と病変の同定を検討する。
まず, サブタイプや悪性度に関わらず画像に存在するすべての病変を同定し, その悪性度を推定し, 凝集により, 画像レベルの悪性度も生成する。
論文 参考訳(メタデータ) (2021-04-02T20:52:05Z) - Multi-label Thoracic Disease Image Classification with Cross-Attention
Networks [65.37531731899837]
胸部X線画像から胸部疾患を自動分類するためのCAN(Cross-Attention Networks)を提案する。
また,クロスエントロピー損失を超える新たな損失関数を設計し,クラス間の不均衡を克服する。
論文 参考訳(メタデータ) (2020-07-21T14:37:00Z) - Semi-supervised Medical Image Classification with Relation-driven
Self-ensembling Model [71.80319052891817]
医用画像分類のための関係駆動型半教師付きフレームワークを提案する。
これは、摂動下で与えられた入力の予測一貫性を促進することでラベルのないデータを利用する。
本手法は,シングルラベルおよびマルチラベル画像分類のシナリオにおいて,最先端の半教師付き学習手法よりも優れる。
論文 参考訳(メタデータ) (2020-05-15T06:57:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。