論文の概要: EyeBench: A Call for More Rigorous Evaluation of Retinal Image Enhancement
- arxiv url: http://arxiv.org/abs/2502.14260v1
- Date: Thu, 20 Feb 2025 04:56:03 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-02-21 14:28:43.498465
- Title: EyeBench: A Call for More Rigorous Evaluation of Retinal Image Enhancement
- Title(参考訳): EyeBench:網膜画像強調の厳格な評価
- Authors: Wenhui Zhu, Xuanzhao Dong, Xin Li, Yujian Xiong, Xiwen Chen, Peijie Qiu, Vamsi Krishna Vasa, Zhangsihao Yang, Yi Su, Oana Dumitrascu, Yalin Wang,
- Abstract要約: 生成モデルは ファンドス画像の 増強に大きく成功しました
これらのモデルの評価は依然としてかなりの課題である。
臨床ニーズに合わせて拡張モデルを調整するための洞察を提供するため,新しい総合ベンチマークであるEyeBenchを提案する。
- 参考スコア(独自算出の注目度): 14.724629346280402
- License:
- Abstract: Over the past decade, generative models have achieved significant success in enhancement fundus images.However, the evaluation of these models still presents a considerable challenge. A comprehensive evaluation benchmark for fundus image enhancement is indispensable for three main reasons: 1) The existing denoising metrics (e.g., PSNR, SSIM) are hardly to extend to downstream real-world clinical research (e.g., Vessel morphology consistency). 2) There is a lack of comprehensive evaluation for both paired and unpaired enhancement methods, along with the need for expert protocols to accurately assess clinical value. 3) An ideal evaluation system should provide insights to inform future developments of fundus image enhancement. To this end, we propose a novel comprehensive benchmark, EyeBench, to provide insights that align enhancement models with clinical needs, offering a foundation for future work to improve the clinical relevance and applicability of generative models for fundus image enhancement. EyeBench has three appealing properties: 1) multi-dimensional clinical alignment downstream evaluation: In addition to evaluating the enhancement task, we provide several clinically significant downstream tasks for fundus images, including vessel segmentation, DR grading, denoising generalization, and lesion segmentation. 2) Medical expert-guided evaluation design: We introduce a novel dataset that promote comprehensive and fair comparisons between paired and unpaired methods and includes a manual evaluation protocol by medical experts. 3) Valuable insights: Our benchmark study provides a comprehensive and rigorous evaluation of existing methods across different downstream tasks, assisting medical experts in making informed choices. Additionally, we offer further analysis of the challenges faced by existing methods. The code is available at \url{https://github.com/Retinal-Research/EyeBench}
- Abstract(参考訳): 過去10年にわたって、生成モデルは、ファンドス画像の強化において大きな成功を収めてきたが、これらのモデルの評価は依然としてかなりの課題を呈している。
眼底画像強調のための総合評価ベンチマークは3つの主な理由から必要不可欠である。
1)既存の診断指標(例:PSNR,SSIM)は,下流臨床研究(例:血管形態の整合性)にはほとんど及ばない。
2) 臨床的価値を正確に評価する専門的プロトコルの必要性とともに, ペア化とアンペア化の両方法に対する包括的評価が欠如している。
3) 理想的な評価システムは, 基礎画像強調の今後の展開を知るための洞察を提供する必要がある。
そこで本研究では,新たな総合的ベンチマークであるEyeBenchを提案する。このベンチマークは,拡張モデルと臨床ニーズを整合させる洞察を提供することで,基礎画像強調のための生成モデルの臨床的妥当性と適用性を向上させるための基礎となるものである。
EyeBenchには3つの魅力がある。
1) 多次元臨床アライメント下流の評価に加えて, 血管のセグメンテーション, DRグレーディング, 認知的一般化, 病変のセグメンテーションなど, 眼底画像に対するいくつかの臨床的重要な下流課題について検討した。
2) 医療専門家による評価設計: 両方法の総合的・公平な比較を促進する新しいデータセットを導入し, 医療専門家による手作業による評価プロトコルを含む。
3)有意義な洞察:我々のベンチマーク研究は、下流の様々なタスクにまたがる既存の手法を包括的かつ厳密に評価し、医療専門家の情報提供を支援する。
さらに,既存の手法が直面する課題をさらに分析する。
コードは \url{https://github.com/Retinal-Research/EyeBench} で公開されている。
関連論文リスト
- Clinical Evaluation of Medical Image Synthesis: A Case Study in Wireless Capsule Endoscopy [63.39037092484374]
本研究は,人工知能(AI)モデルを用いた医用合成データ生成の臨床評価に焦点を当てた。
本論文は,a) 医用専門家による合成画像の体系的評価のためのプロトコルを提示し,b) 高分解能WCE画像合成のための新しい変分オートエンコーダモデルであるTIDE-IIを評価する。
その結果、TIDE-IIは臨床的に関連性のあるWCE画像を生成し、データの不足に対処し、診断ツールの強化に役立つことがわかった。
論文 参考訳(メタデータ) (2024-10-31T19:48:50Z) - Generative AI for Synthetic Data Across Multiple Medical Modalities: A Systematic Review of Recent Developments and Challenges [2.1835659964186087]
本稿では,様々な医療データ型を合成するための生成モデルについて,体系的に検討する。
本研究は、幅広い医療データモダリティを包含し、様々な生成モデルについて検討する。
論文 参考訳(メタデータ) (2024-06-27T14:00:11Z) - RIDGE: Reproducibility, Integrity, Dependability, Generalizability, and Efficiency Assessment of Medical Image Segmentation Models [1.4675465116143782]
本稿では, 深層学習に基づく医用画像分割モデルの再現性, 統合性, 依存性, 一般化性, 効率性を評価するための RIDGE チェックリストを提案する。
RIDGEチェックリストは単なる評価ツールではなく、研究の質と透明性の向上を目指す研究者のためのガイドラインでもある。
論文 参考訳(メタデータ) (2024-01-16T21:45:08Z) - Aligning Synthetic Medical Images with Clinical Knowledge using Human
Feedback [22.390670838355295]
本稿では,臨床応用可能な合成医用画像を作成するための病理医用ループフレームワークを提案する。
人間のフィードバックは, 画像の忠実度, 多様性, 下流での実用性, 信頼性を, 専門家によって評価され, 画像の質を著しく向上させることを示した。
論文 参考訳(メタデータ) (2023-06-16T21:54:20Z) - Rethinking Semi-Supervised Medical Image Segmentation: A
Variance-Reduction Perspective [51.70661197256033]
医用画像セグメンテーションのための階層化グループ理論を用いた半教師付きコントラスト学習フレームワークARCOを提案する。
まず、分散還元推定の概念を用いてARCOを構築することを提案し、特定の分散還元技術が画素/ボクセルレベルのセグメンテーションタスクにおいて特に有用であることを示す。
5つの2D/3D医療データセットと3つのセマンティックセグメンテーションデータセットのラベル設定が異なる8つのベンチマークで、我々のアプローチを実験的に検証する。
論文 参考訳(メタデータ) (2023-02-03T13:50:25Z) - A Knowledge-based Learning Framework for Self-supervised Pre-training
Towards Enhanced Recognition of Medical Images [14.304996977665212]
本研究では,医用画像の認識向上に向けた知識ベース学習フレームワークを提案する。
コントラスト学習と生成学習モデルを相乗化することで、3つのフェーズで機能する。
提案したフレームワークは、AUC/DiceのSimCLRよりも2.08, 1.23, 1.12, 0.76, 1.38ポイント改善された自己教師型ベンチマークで統計的に優れている。
論文 参考訳(メタデータ) (2022-11-27T03:58:58Z) - Harmonizing Pathological and Normal Pixels for Pseudo-healthy Synthesis [68.5287824124996]
そこで本研究では,新しいタイプの識別器であるセグメンタを提案し,病変の正確な特定と擬似健康画像の視覚的品質の向上を図っている。
医用画像強調に生成画像を適用し,低コントラスト問題に対処するために拡張結果を利用する。
BraTSのT2モダリティに関する総合的な実験により、提案手法は最先端の手法よりも大幅に優れていることが示された。
論文 参考訳(メタデータ) (2022-03-29T08:41:17Z) - Towards a Guideline for Evaluation Metrics in Medical Image Segmentation [0.0]
本研究は、医療画像分割評価のための以下の指標の概要と解釈ガイドを提供する。
要約として,標準化された医用画像分割評価のためのガイドラインを提案する。
論文 参考訳(メタデータ) (2022-02-10T13:38:05Z) - Deep AUC Maximization for Medical Image Classification: Challenges and
Opportunities [60.079782224958414]
我々は、AUCによる新たな深層学習手法による機会と課題を提示し、議論する(別名、アンダーラインbfディープアンダーラインbfAUC分類)。
論文 参考訳(メタデータ) (2021-11-01T15:31:32Z) - Malignancy Prediction and Lesion Identification from Clinical
Dermatological Images [65.1629311281062]
臨床皮膚画像から機械学習に基づく悪性度予測と病変の同定を検討する。
まず, サブタイプや悪性度に関わらず画像に存在するすべての病変を同定し, その悪性度を推定し, 凝集により, 画像レベルの悪性度も生成する。
論文 参考訳(メタデータ) (2021-04-02T20:52:05Z) - Explaining Clinical Decision Support Systems in Medical Imaging using
Cycle-Consistent Activation Maximization [112.2628296775395]
ディープニューラルネットワークを用いた臨床意思決定支援は、着実に関心が高まりつつあるトピックとなっている。
臨床医は、その根底にある意思決定プロセスが不透明で理解しにくいため、この技術の採用をためらうことが多い。
そこで我々は,より小さなデータセットであっても,分類器決定の高品質な可視化を生成するCycleGANアクティベーションに基づく,新たな意思決定手法を提案する。
論文 参考訳(メタデータ) (2020-10-09T14:39:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。