論文の概要: Metrics Revolutions: Groundbreaking Insights into the Implementation of Metrics for Biomedical Image Segmentation
- arxiv url: http://arxiv.org/abs/2410.02630v1
- Date: Thu, 3 Oct 2024 16:14:22 GMT
- ステータス: 処理完了
- システム内更新日: 2024-11-04 02:02:21.101470
- Title: Metrics Revolutions: Groundbreaking Insights into the Implementation of Metrics for Biomedical Image Segmentation
- Title(参考訳): メトリックス革命 : バイオメディカルイメージセグメンテーションのためのメトリックス実装の画期的展望
- Authors: Gašper Podobnik, Tomaž Vrtovec,
- Abstract要約: 距離ベースのメトリクスのための11のオープンソースツールと、高精度なメッシュベースのリファレンス実装を比較します。
その結果、すべてのオープンソースツールで統計的に有意な違いがあることが判明した。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The evaluation of segmentation performance is a common task in biomedical image analysis, with its importance emphasized in the recently released metrics selection guidelines and computing frameworks. To quantitatively evaluate the alignment of two segmentations, researchers commonly resort to counting metrics, such as the Dice similarity coefficient, or distance-based metrics, such as the Hausdorff distance, which are usually computed by publicly available open-source tools with an inherent assumption that these tools provide consistent results. In this study we questioned this assumption, and performed a systematic implementation analysis along with quantitative experiments on real-world clinical data to compare 11 open-source tools for distance-based metrics computation against our highly accurate mesh-based reference implementation. The results revealed that statistically significant differences among all open-source tools are both surprising and concerning, since they question the validity of existing studies. Besides identifying the main sources of variation, we also provide recommendations for distance-based metrics computation.
- Abstract(参考訳): セグメンテーション性能の評価は、バイオメディカル画像解析において一般的な課題であり、最近リリースされたメトリクス選択ガイドラインや計算フレームワークにおいてその重要性が強調されている。
2つのセグメンテーションのアライメントを定量的に評価するために、研究者は通常、Dice類似度係数やHausdorff 距離のような距離に基づくメトリクスを数えることに頼っている。
本研究では,この仮定を疑問視し,実際の臨床データに関する定量的実験とともに体系的な実装分析を行い,高精度なメッシュベースの参照実装に対して,距離ベースのメトリクス計算を行う11のオープンソースツールを比較した。
その結果、既存の研究の妥当性を疑問視するため、すべてのオープンソースツール間の統計的に有意な違いは驚きと関係があることがわかった。
変動の主源の特定に加えて,距離に基づくメトリクス計算の推奨も提供する。
関連論文リスト
- Evaluating Representational Similarity Measures from the Lens of Functional Correspondence [1.7811840395202345]
神経科学と人工知能(AI)はどちらも、高次元のニューラルネットワークの解釈という課題に直面している。
表象比較が広く使われているにもかかわらず、重要な疑問が残る: どの指標がこれらの比較に最も適しているのか?
論文 参考訳(メタデータ) (2024-11-21T23:53:58Z) - Every Component Counts: Rethinking the Measure of Success for Medical Semantic Segmentation in Multi-Instance Segmentation Tasks [60.80828925396154]
本稿では,新しいセマンティックセグメンテーション評価プロトコルであるConnected-Component (CC)-Metricsを提案する。
本研究は,全体PET/CTにおけるセマンティックセグメンテーションの一般的な医療シナリオにおいて,この設定を動機付けている。
既存のセマンティックセグメンテーションのメトリクスが、より大きな接続コンポーネントに対するバイアスにどのように悩まされているかを示す。
論文 参考訳(メタデータ) (2024-10-24T12:26:05Z) - Segmentation Quality and Volumetric Accuracy in Medical Imaging [0.9426448361599084]
現在の医療画像のセグメンテーションは、デファクト標準として領域ベース(Dice, F1スコア)と境界ベース(ハウスドルフ距離、表面距離)のメトリクスに依存している。
これらの指標は広く使用されているが、特にボリューム合意に関する統一的な解釈は欠如している。
本稿では,相対体積予測誤差(vpe)を用いて,セグメンテーションタスクから導出される体積予測の精度を直接評価する。
論文 参考訳(メタデータ) (2024-04-27T00:49:39Z) - Rethinking Evaluation Metrics of Open-Vocabulary Segmentaion [78.76867266561537]
評価プロセスは、予測された真理のカテゴリと基底的真理のカテゴリの類似性を考慮せずに、クローズドセットのメトリクスに大きく依存している。
この問題に対処するため、まず2つのカテゴリー語間の11の類似度の測定を行った。
我々は,3つのオープン語彙セグメンテーションタスクに適した,オープンmIoU,オープンAP,オープンPQという新しい評価指標を設計した。
論文 参考訳(メタデータ) (2023-11-06T18:59:01Z) - Metrics reloaded: Recommendations for image analysis validation [59.60445111432934]
メトリクスのリロード(Metrics Reloaded)は、メトリクスの問題を意識した選択において研究者を導く包括的なフレームワークである。
このフレームワークは多段階のDelphiプロセスで開発され、問題指紋という新しい概念に基づいている。
問題指紋に基づいて、ユーザは適切なバリデーションメトリクスを選択して適用するプロセスを通じてガイドされる。
論文 参考訳(メタデータ) (2022-06-03T15:56:51Z) - The Exploitation of Distance Distributions for Clustering [3.42658286826597]
クラスタ分析では、距離分布の異なる特性が適切な距離選択に関係していると判断される。
ミラー化密度プロットを用いて分布解析を用いて,この仕様を体系的に検討することにより,クラスタ解析においてマルチモーダル距離分布が好ましいことを示す。
実験は、クラスタリングのタスクのために、いくつかの人工データセットと自然なデータセットで行われます。
論文 参考訳(メタデータ) (2021-08-22T06:22:08Z) - Common Limitations of Image Processing Metrics: A Picture Story [58.83274952067888]
本論文は, 画像レベルの分類, セマンティックセグメンテーション, インスタンスセグメンテーション, オブジェクト検出タスクと表現できるバイオメディカル画像解析問題に焦点を当てる。
現在のバージョンは、世界中の60以上の機関からの画像分析の専門家からなる国際コンソーシアムが実施するメトリクスに関するDelphiプロセスに基づいている。
論文 参考訳(メタデータ) (2021-04-12T17:03:42Z) - A Statistical Analysis of Summarization Evaluation Metrics using
Resampling Methods [60.04142561088524]
信頼区間は比較的広く,信頼性の高い自動測定値の信頼性に高い不確実性を示す。
多くのメトリクスはROUGEよりも統計的改善を示していないが、QAEvalとBERTScoreという2つの最近の研究は、いくつかの評価設定で行われている。
論文 参考訳(メタデータ) (2021-03-31T18:28:14Z) - Estimating informativeness of samples with Smooth Unique Information [108.25192785062367]
サンプルが最終的な重みを知らせる量と、重みによって計算される関数を知らせる量を測定します。
線形化ネットワークを用いてこれらの量の効率的な近似を行う。
本稿では,データセットの要約など,いくつかの問題に適用する。
論文 参考訳(メタデータ) (2021-01-17T10:29:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。