論文の概要: Usable Region Estimate for Assessing Practical Usability of Medical
Image Segmentation Models
- arxiv url: http://arxiv.org/abs/2207.00156v1
- Date: Fri, 1 Jul 2022 02:33:44 GMT
- ステータス: 処理完了
- システム内更新日: 2022-07-05 02:58:32.996809
- Title: Usable Region Estimate for Assessing Practical Usability of Medical
Image Segmentation Models
- Title(参考訳): 医用画像分割モデルの実用性評価のための利用領域推定
- Authors: Yizhe Zhang, Suraj Mishra, Peixian Liang, Hao Zheng and Danny Z. Chen
- Abstract要約: 医療画像セグメンテーションモデルの実用的ユーザビリティを定量的に測定することを目的としている。
まず、予測者の信頼度がランクの正確度スコアとどのように相関しているかを推定する尺度であるCCRC(Correctness-Confidence Rank correlation)を提案する。
次に、予測の正しさと信頼度を同時に定量化するURE(Usable Region Estimate)を提案する。
- 参考スコア(独自算出の注目度): 32.56957759180135
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We aim to quantitatively measure the practical usability of medical image
segmentation models: to what extent, how often, and on which samples a model's
predictions can be used/trusted. We first propose a measure,
Correctness-Confidence Rank Correlation (CCRC), to capture how predictions'
confidence estimates correlate with their correctness scores in rank. A model
with a high value of CCRC means its prediction confidences reliably suggest
which samples' predictions are more likely to be correct. Since CCRC does not
capture the actual prediction correctness, it alone is insufficient to indicate
whether a prediction model is both accurate and reliable to use in practice.
Therefore, we further propose another method, Usable Region Estimate (URE),
which simultaneously quantifies predictions' correctness and reliability of
confidence assessments in one estimate. URE provides concrete information on to
what extent a model's predictions are usable. In addition, the sizes of usable
regions (UR) can be utilized to compare models: A model with a larger UR can be
taken as a more usable and hence better model. Experiments on six datasets
validate that the proposed evaluation methods perform well, providing a
concrete and concise measure for the practical usability of medical image
segmentation models. Code is made available at
https://github.com/yizhezhang2000/ure.
- Abstract(参考訳): 本研究では,医療画像セグメンテーションモデルの実用的ユーザビリティを定量的に測定することを目的としている。
まず、予測者の信頼度がランクの正確度スコアとどのように相関しているかを推定する尺度であるCCRC(Correctness-Confidence Rank correlation)を提案する。
CCRCの値が高いモデルは、その予測信頼度がどのサンプルの予測が正しいかを確実に示唆することを意味する。
CCRCは実際の予測精度を捉えていないため、予測モデルが正確かつ実際に使用可能な信頼性を持つかどうかを示すには不十分である。
そこで本研究では,予測の正確性と信頼度評価の信頼性を同時に定量化する手法として,ユビキタス領域推定(ure)を提案する。
ureはモデルの予測がどの程度使えるかという具体的な情報を提供する。
さらに、使用可能な領域(UR)のサイズをモデルの比較に利用することができる: 大きなURを持つモデルはより使いやすく、より良いモデルとみなすことができる。
6つのデータセットの実験により,提案手法の有効性が検証され,医用画像セグメンテーションモデルの実用性を示す具体的かつ簡潔な尺度が得られた。
コードはhttps://github.com/yizhezhang2000/ureで入手できる。
関連論文リスト
- Confidence-based Estimators for Predictive Performance in Model Monitoring [0.5399800035598186]
マシンラーニングモデルが本番環境にデプロイされた後、その予測パフォーマンスを監視する必要がある。
近年,地中真実が得られない場合の予測性能を推定する新たな手法が開発されている。
一般的な仮定では、平均信頼度(AC)法はモデル精度の偏りのない一貫した推定器であることが示される。
論文 参考訳(メタデータ) (2024-07-11T16:28:31Z) - Confidence and Dispersity Speak: Characterising Prediction Matrix for
Unsupervised Accuracy Estimation [51.809741427975105]
この研究は、ラベルを使わずに、分散シフト下でのモデルの性能を評価することを目的としている。
我々は、両方の特性を特徴付けるのに有効であることが示されている核規範を用いる。
核の基準は既存の手法よりも正確で堅牢であることを示す。
論文 参考訳(メタデータ) (2023-02-02T13:30:48Z) - Calibrated Selective Classification [34.08454890436067]
そこで我々は,「不確か」な不確実性のある例を拒否する手法を提案する。
本稿では,選択的校正モデル学習のためのフレームワークを提案する。そこでは,任意のベースモデルの選択的校正誤差を改善するために,個別のセレクタネットワークを訓練する。
われわれは,複数画像分類と肺癌リスク評価におけるアプローチの実証的効果を実証した。
論文 参考訳(メタデータ) (2022-08-25T13:31:09Z) - VisFIS: Visual Feature Importance Supervision with
Right-for-the-Right-Reason Objectives [84.48039784446166]
モデルFI監督は、VQAモデルの精度と、Right-to-the-Right-Reasonメトリクスの性能を有意義に向上させることができることを示す。
我々の最高のパフォーマンス手法であるVisual Feature Importance Supervision (VisFIS)は、ベンチマークVQAデータセットで強いベースラインを上回ります。
説明が妥当で忠実な場合には予測がより正確になる。
論文 参考訳(メタデータ) (2022-06-22T17:02:01Z) - Leveraging Unlabeled Data to Predict Out-of-Distribution Performance [63.740181251997306]
実世界の機械学習デプロイメントは、ソース(トレーニング)とターゲット(テスト)ディストリビューションのミスマッチによって特徴づけられる。
本研究では,ラベル付きソースデータとラベルなしターゲットデータのみを用いて,対象領域の精度を予測する手法を検討する。
本稿では,モデルの信頼度をしきい値として学習し,精度をラベルなし例のごく一部として予測する実践的手法である平均閾値保持信頼度(ATC)を提案する。
論文 参考訳(メタデータ) (2022-01-11T23:01:12Z) - PDC-Net+: Enhanced Probabilistic Dense Correspondence Network [161.76275845530964]
高度確率密度対応ネットワーク(PDC-Net+)は、精度の高い高密度対応を推定できる。
我々は、堅牢で一般化可能な不確実性予測に適したアーキテクチャと強化されたトレーニング戦略を開発する。
提案手法は,複数の挑戦的幾何マッチングと光学的フローデータセットに対して,最先端の結果を得る。
論文 参考訳(メタデータ) (2021-09-28T17:56:41Z) - Learning to Predict with Supporting Evidence: Applications to Clinical
Risk Prediction [9.199022926064009]
機械学習モデルがヘルスケアに与える影響は、医療専門家がこれらのモデルによって予測される信頼度に依存する。
予測が信頼されるべき理由に関するドメイン関連証拠を,臨床専門性のある人に提供するための方法を提示する。
論文 参考訳(メタデータ) (2021-03-04T00:26:32Z) - Learning Accurate Dense Correspondences and When to Trust Them [161.76275845530964]
2つの画像に関連する密度の高い流れ場と、堅牢な画素方向の信頼度マップの推定を目指しています。
フロー予測とその不確実性を共同で学習するフレキシブルな確率的アプローチを開発する。
本手法は,幾何学的マッチングと光フローデータセットに挑戦する最新の結果を得る。
論文 参考訳(メタデータ) (2021-01-05T18:54:11Z) - Trust but Verify: Assigning Prediction Credibility by Counterfactual
Constrained Learning [123.3472310767721]
予測信頼性尺度は統計学と機械学習において基本的なものである。
これらの措置は、実際に使用される多種多様なモデルを考慮に入れるべきである。
この研究で開発されたフレームワークは、リスクフィットのトレードオフとして信頼性を表現している。
論文 参考訳(メタデータ) (2020-11-24T19:52:38Z) - Robust Validation: Confident Predictions Even When Distributions Shift [19.327409270934474]
本稿では,モデルが点予測ではなく,その予測に対して不確実な推定を行うような,頑健な予測推論の手順について述べる。
本稿では, トレーニング集団の周囲に$f$-divergence のボールを用いて, 任意のテスト分布に対して適切なカバレッジレベルを与える予測セットを生成する手法を提案する。
私たちの方法論の重要な構成要素は、将来のデータシフトの量を見積り、それに対する堅牢性を構築することです。
論文 参考訳(メタデータ) (2020-08-10T17:09:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。