論文の概要: Fréchet Radiomic Distance (FRD): A Versatile Metric for Comparing Medical Imaging Datasets
- arxiv url: http://arxiv.org/abs/2412.01496v2
- Date: Fri, 06 Jun 2025 16:36:34 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-09 21:34:56.701242
- Title: Fréchet Radiomic Distance (FRD): A Versatile Metric for Comparing Medical Imaging Datasets
- Title(参考訳): Fréchet Radiomic Distance (FRD) : 医用画像データセットの比較のためのVersatile Metric
- Authors: Nicholas Konz, Richard Osuala, Preeti Verma, Yuwen Chen, Hanxue Gu, Haoyu Dong, Yaqian Chen, Andrew Marshall, Lidia Garrucho, Kaisar Kushibar, Daniel M. Lang, Gene S. Kim, Lars J. Grimm, John M. Lewin, James S. Duncan, Julia A. Schnabel, Oliver Diaz, Karim Lekadir, Maciej A. Mazurowski,
- Abstract要約: Fr'echet Radiomic Distance (Fr'echet Radiomic Distance) という医療画像に適した新しい知覚基準を導入する。
FRDは、様々な医療画像の分野で、他の画像分布指標よりも優れていることを示す。
FRDは、低いサンプルサイズでの安定性や計算効率などの付加的な利点を提供する。
- 参考スコア(独自算出の注目度): 13.737058479403311
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Determining whether two sets of images belong to the same or different distributions or domains is a crucial task in modern medical image analysis and deep learning; for example, to evaluate the output quality of image generative models. Currently, metrics used for this task either rely on the (potentially biased) choice of some downstream task, such as segmentation, or adopt task-independent perceptual metrics (e.g., Fr\'echet Inception Distance/FID) from natural imaging, which we show insufficiently capture anatomical features. To this end, we introduce a new perceptual metric tailored for medical images, FRD (Fr\'echet Radiomic Distance), which utilizes standardized, clinically meaningful, and interpretable image features. We show that FRD is superior to other image distribution metrics for a range of medical imaging applications, including out-of-domain (OOD) detection, the evaluation of image-to-image translation (by correlating more with downstream task performance as well as anatomical consistency and realism), and the evaluation of unconditional image generation. Moreover, FRD offers additional benefits such as stability and computational efficiency at low sample sizes, sensitivity to image corruptions and adversarial attacks, feature interpretability, and correlation with radiologist-perceived image quality. Additionally, we address key gaps in the literature by presenting an extensive framework for the multifaceted evaluation of image similarity metrics in medical imaging -- including the first large-scale comparative study of generative models for medical image translation -- and release an accessible codebase to facilitate future research. Our results are supported by thorough experiments spanning a variety of datasets, modalities, and downstream tasks, highlighting the broad potential of FRD for medical image analysis.
- Abstract(参考訳): 画像生成モデルの出力品質を評価することなど、現代の医用画像分析と深層学習において、2つの画像セットが同一または異なる分布またはドメインに属しているかどうかを決定することが重要な課題である。
現在、このタスクで使用されるメトリクスは、セグメンテーションのような下流タスクの(潜在的に偏りのある)選択に依存するか、あるいは自然画像からタスク非依存の知覚メトリクス(例えば、Fr\echet Inception Distance/FID)を採用するかのどちらかであり、解剖学的特徴を不十分に捉えている。
この目的のために,医用画像に適した新しい知覚基準であるFRD(Fr\echet Radiomic Distance)を導入する。
FRDは、オフ・オブ・ドメイン(OOD)検出、画像から画像への変換の評価(下流のタスク性能と解剖学的整合性およびリアリズムとの関連性)、非条件画像生成の評価など、様々な医療画像アプリケーションにおいて、他の画像分布指標よりも優れていることを示す。
さらに、FRDは、低いサンプルサイズでの安定性と計算効率、画像の破損に対する感受性、敵攻撃、特徴解釈可能性、および放射線学者が知覚した画像品質との相関などの付加的な利点を提供する。
さらに、医用画像における画像類似度指標の多面的評価のためのフレームワークを提示し、医用画像翻訳のための生成モデルに関する最初の大規模比較研究を含む、文献における重要なギャップを解消し、将来の研究を促進するためにアクセス可能なコードベースをリリースする。
この結果は、さまざまなデータセット、モダリティ、下流タスクにまたがる徹底的な実験によって支援されており、医療画像解析におけるFRDの幅広い可能性を強調している。
関連論文リスト
- M3DA: Benchmark for Unsupervised Domain Adaptation in 3D Medical Image Segmentation [4.327603420628437]
ドメインシフトは、MRIやCTなどのソースからの3D医療画像のセグメンテーションにディープラーニングを適用する上で、大きな課題となる。
提案するベンチマークでは,10以上の既存ドメイン適応手法を評価した。
結果から、ドメイン間のパフォーマンスギャップを一貫して埋めることはできません。
論文 参考訳(メタデータ) (2025-02-24T10:29:32Z) - A Unified Model for Compressed Sensing MRI Across Undersampling Patterns [69.19631302047569]
ディープニューラルネットワークは、アンダーサンプル計測から高忠実度画像を再構成する大きな可能性を示している。
我々のモデルは、離散化に依存しないアーキテクチャであるニューラル演算子に基づいている。
我々の推論速度は拡散法よりも1,400倍速い。
論文 参考訳(メタデータ) (2024-10-05T20:03:57Z) - Understanding differences in applying DETR to natural and medical images [16.200340490559338]
トランスフォーマーベースの検出器は、自然画像を用いたコンピュータビジョンタスクで成功している。
医用画像データには、非常に大きな画像サイズ、興味の少ない領域の小さい領域、微妙な違いによってのみ区別できるオブジェクトクラスなど、固有の課題がある。
本研究は, 検診用マンモグラフィーデータセットに適用した場合に, これらのトランスフォーマーに基づく設計選択の適用性を評価するものである。
論文 参考訳(メタデータ) (2024-05-27T22:06:42Z) - Adapting Visual-Language Models for Generalizable Anomaly Detection in Medical Images [68.42215385041114]
本稿では,CLIPモデルを用いた医用異常検出のための軽量な多レベル適応と比較フレームワークを提案する。
提案手法では,複数の残像アダプタを事前学習した視覚エンコーダに統合し,視覚的特徴の段階的向上を実現する。
医学的異常検出ベンチマーク実験により,本手法が現在の最先端モデルを大幅に上回っていることが示された。
論文 参考訳(メタデータ) (2024-03-19T09:28:19Z) - VALD-MD: Visual Attribution via Latent Diffusion for Medical Diagnostics [0.0]
医用画像における視覚的属性は、医用画像の診断関連成分を明確にすることを目指している。
本稿では、潜在拡散モデルとドメイン固有大言語モデルを組み合わせた新しい生成的視覚属性手法を提案する。
結果として生じるシステムは、ゼロショット局所化疾患誘導を含む様々な潜在能力を示す。
論文 参考訳(メタデータ) (2024-01-02T19:51:49Z) - C^2M-DoT: Cross-modal consistent multi-view medical report generation
with domain transfer network [67.97926983664676]
ドメイン転送ネットワーク(C2M-DoT)を用いたクロスモーダルなマルチビュー医療レポート生成を提案する。
C2M-DoTは、すべてのメトリクスで最先端のベースラインを大幅に上回る。
論文 参考訳(メタデータ) (2023-10-09T02:31:36Z) - On Sensitivity and Robustness of Normalization Schemes to Input
Distribution Shifts in Automatic MR Image Diagnosis [58.634791552376235]
深層学習(DL)モデルは、再構成画像を入力として、複数の疾患の診断において最先端のパフォーマンスを達成した。
DLモデルは、トレーニングとテストフェーズ間の入力データ分布の変化につながるため、さまざまなアーティファクトに敏感である。
本稿では,グループ正規化やレイヤ正規化といった他の正規化手法を用いて,画像のさまざまなアーチファクトに対して,モデル性能にロバスト性を注入することを提案する。
論文 参考訳(メタデータ) (2023-06-23T03:09:03Z) - Vision-Language Modelling For Radiological Imaging and Reports In The
Low Data Regime [70.04389979779195]
本稿では,視覚および言語入力を共通空間に埋め込んだ医用視覚言語モデル(VLM)について検討する。
本稿では,新しい画像領域やテキスト領域への汎用事前学習モデルの適用など,低データ性能向上のためのいくつかの候補手法について検討する。
テキスト・ツー・イメージ検索をベンチマークとして,2つの胸部X線および放射線学的報告を用いた可変サイズのトレーニングデータセットを用いて,これらの手法の性能評価を行った。
論文 参考訳(メタデータ) (2023-03-30T18:20:00Z) - Multi-domain stain normalization for digital pathology: A
cycle-consistent adversarial network for whole slide images [0.0]
本稿では,CycleGANに基づく染色正規化のためのマルチドメインアプローチであるMultiStain-CycleGANを提案する。
CycleGANの変更により、異なるモデルを再トレーニングしたり使用したりすることなく、異なる起源の画像の正規化が可能になります。
論文 参考訳(メタデータ) (2023-01-23T13:34:49Z) - Learning to Exploit Temporal Structure for Biomedical Vision-Language
Processing [53.89917396428747]
視覚言語処理における自己教師あり学習は、画像とテキストのモダリティのセマンティックアライメントを利用する。
トレーニングと微調整の両方で利用できる場合、事前のイメージとレポートを明示的に説明します。
我々のアプローチはBioViL-Tと呼ばれ、テキストモデルと共同で訓練されたCNN-Transformerハイブリッドマルチイメージエンコーダを使用する。
論文 参考訳(メタデータ) (2023-01-11T16:35:33Z) - A Domain-specific Perceptual Metric via Contrastive Self-supervised
Representation: Applications on Natural and Medical Images [8.769705957207576]
2つの画像の知覚的類似性を定量化することは、低レベルのコンピュータビジョンにおける長年の問題である。
最近のコントラスト的自己監督表現(CSR)が救助にやってくる可能性がある。
論文 参考訳(メタデータ) (2022-12-03T08:55:47Z) - Adapting Pretrained Vision-Language Foundational Models to Medical
Imaging Domains [3.8137985834223502]
臨床の文脈を忠実に描写する医療画像の生成モデルを構築することは、医療データセットの不明瞭さを軽減するのに役立つ。
安定拡散パイプラインのサブコンポーネントを探索し、モデルを微調整して医用画像を生成する。
我々の最良の性能モデルは、安定な拡散ベースラインを改善し、合成ラジオグラフィ画像に現実的な異常を挿入するように条件付けすることができる。
論文 参考訳(メタデータ) (2022-10-09T01:43:08Z) - Improved Slice-wise Tumour Detection in Brain MRIs by Computing
Dissimilarities between Latent Representations [68.8204255655161]
磁気共鳴画像(MRI)の異常検出は教師なし手法で行うことができる。
本研究では,変分オートエンコーダの潜伏空間における相似関数の計算に基づいて,腫瘍検出のためのスライスワイズ半教師法を提案する。
本研究では,高解像度画像上でのモデルをトレーニングし,再現の質を向上させることにより,異なるベースラインに匹敵する結果が得られることを示す。
論文 参考訳(メタデータ) (2020-07-24T14:02:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。