論文の概要: RaD: A Metric for Medical Image Distribution Comparison in Out-of-Domain Detection and Other Applications
- arxiv url: http://arxiv.org/abs/2412.01496v1
- Date: Mon, 02 Dec 2024 13:49:14 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-12-04 15:51:23.914702
- Title: RaD: A Metric for Medical Image Distribution Comparison in Out-of-Domain Detection and Other Applications
- Title(参考訳): RaD: 領域外検出における医用画像の分布比較とその他の応用
- Authors: Nicholas Konz, Yuwen Chen, Hanxue Gu, Haoyu Dong, Yaqian Chen, Maciej A. Mazurowski,
- Abstract要約: Radiomic Feature Distance (RaD)は、医療画像に適した新しい知覚距離である。
種々の実験において、RaDはドメイン外検出(OOD)において他の指標よりも優れていることを示す。
RaDはまた、解釈可能性や、低いサンプルサイズでの安定性と計算効率といった追加の利点も提供する。
- 参考スコア(独自算出の注目度): 11.259711708037639
- License:
- Abstract: Determining whether two sets of images belong to the same or different domain is a crucial task in modern medical image analysis and deep learning, where domain shift is a common problem that commonly results in decreased model performance. This determination is also important to evaluate the output quality of generative models, e.g., image-to-image translation models used to mitigate domain shift. Current metrics for this either rely on the (potentially biased) choice of some downstream task such as segmentation, or adopt task-independent perceptual metrics (e.g., FID) from natural imaging which insufficiently capture anatomical consistency and realism in medical images. We introduce a new perceptual metric tailored for medical images: Radiomic Feature Distance (RaD), which utilizes standardized, clinically meaningful and interpretable image features. We show that RaD is superior to other metrics for out-of-domain (OOD) detection in a variety of experiments. Furthermore, RaD outperforms previous perceptual metrics (FID, KID, etc.) for image-to-image translation by correlating more strongly with downstream task performance as well as anatomical consistency and realism, and shows similar utility for evaluating unconditional image generation. RaD also offers additional benefits such as interpretability, as well as stability and computational efficiency at low sample sizes. Our results are supported by broad experiments spanning four multi-domain medical image datasets, nine downstream tasks, six image translation models, and other factors, highlighting the broad potential of RaD for medical image analysis.
- Abstract(参考訳): 2つの画像が同じ領域に属しているか異なる領域に属しているかを決定することは、現代の医用画像分析とディープラーニングにおいて重要な課題であり、ドメインシフトは一般的にモデル性能の低下をもたらす一般的な問題である。
この決定は、ドメインシフトを軽減するために使用される画像から画像への変換モデルなど、生成モデルの出力品質を評価する上でも重要である。
これに対する現在のメトリクスは、セグメンテーションのような下流タスクの(潜在的に偏った)選択に依存するか、あるいは、医学画像における解剖学的一貫性とリアリズムを不十分に捉える自然画像からタスク非依存の知覚的メトリクス(例えば、FID)を採用するかのどちらかである。
医用画像に適した新しい知覚基準:RaD(Radmic Feature Distance)は、標準化され、臨床的に意味があり、解釈可能な画像特徴を利用する。
種々の実験において、RaDはドメイン外検出(OOD)において他の指標よりも優れていることを示す。
さらに、RaDは、下流タスク性能と解剖学的一貫性とリアリズムとを強く関連付けることにより、イメージ・ツー・イメージ翻訳のための以前の知覚指標(FID、KIDなど)を上回り、非条件画像生成の評価に類似した有用性を示す。
RaDはまた、解釈可能性や、低いサンプルサイズでの安定性と計算効率といった追加の利点も提供する。
その結果,4つのマルチドメイン医療画像データセット,9つの下流タスク,6つの画像翻訳モデル,その他の要因にまたがる広範囲な実験が,医療画像解析におけるRaDの可能性を強調した。
関連論文リスト
- A Unified Model for Compressed Sensing MRI Across Undersampling Patterns [69.19631302047569]
ディープニューラルネットワークは、アンダーサンプル計測から高忠実度画像を再構成する大きな可能性を示している。
我々のモデルは、離散化に依存しないアーキテクチャであるニューラル演算子に基づいている。
我々の推論速度は拡散法よりも1,400倍速い。
論文 参考訳(メタデータ) (2024-10-05T20:03:57Z) - Understanding differences in applying DETR to natural and medical images [16.200340490559338]
トランスフォーマーベースの検出器は、自然画像を用いたコンピュータビジョンタスクで成功している。
医用画像データには、非常に大きな画像サイズ、興味の少ない領域の小さい領域、微妙な違いによってのみ区別できるオブジェクトクラスなど、固有の課題がある。
本研究は, 検診用マンモグラフィーデータセットに適用した場合に, これらのトランスフォーマーに基づく設計選択の適用性を評価するものである。
論文 参考訳(メタデータ) (2024-05-27T22:06:42Z) - Adapting Visual-Language Models for Generalizable Anomaly Detection in Medical Images [68.42215385041114]
本稿では,CLIPモデルを用いた医用異常検出のための軽量な多レベル適応と比較フレームワークを提案する。
提案手法では,複数の残像アダプタを事前学習した視覚エンコーダに統合し,視覚的特徴の段階的向上を実現する。
医学的異常検出ベンチマーク実験により,本手法が現在の最先端モデルを大幅に上回っていることが示された。
論文 参考訳(メタデータ) (2024-03-19T09:28:19Z) - VALD-MD: Visual Attribution via Latent Diffusion for Medical Diagnostics [0.0]
医用画像における視覚的属性は、医用画像の診断関連成分を明確にすることを目指している。
本稿では、潜在拡散モデルとドメイン固有大言語モデルを組み合わせた新しい生成的視覚属性手法を提案する。
結果として生じるシステムは、ゼロショット局所化疾患誘導を含む様々な潜在能力を示す。
論文 参考訳(メタデータ) (2024-01-02T19:51:49Z) - C^2M-DoT: Cross-modal consistent multi-view medical report generation
with domain transfer network [67.97926983664676]
ドメイン転送ネットワーク(C2M-DoT)を用いたクロスモーダルなマルチビュー医療レポート生成を提案する。
C2M-DoTは、すべてのメトリクスで最先端のベースラインを大幅に上回る。
論文 参考訳(メタデータ) (2023-10-09T02:31:36Z) - On Sensitivity and Robustness of Normalization Schemes to Input
Distribution Shifts in Automatic MR Image Diagnosis [58.634791552376235]
深層学習(DL)モデルは、再構成画像を入力として、複数の疾患の診断において最先端のパフォーマンスを達成した。
DLモデルは、トレーニングとテストフェーズ間の入力データ分布の変化につながるため、さまざまなアーティファクトに敏感である。
本稿では,グループ正規化やレイヤ正規化といった他の正規化手法を用いて,画像のさまざまなアーチファクトに対して,モデル性能にロバスト性を注入することを提案する。
論文 参考訳(メタデータ) (2023-06-23T03:09:03Z) - Multi-domain stain normalization for digital pathology: A
cycle-consistent adversarial network for whole slide images [0.0]
本稿では,CycleGANに基づく染色正規化のためのマルチドメインアプローチであるMultiStain-CycleGANを提案する。
CycleGANの変更により、異なるモデルを再トレーニングしたり使用したりすることなく、異なる起源の画像の正規化が可能になります。
論文 参考訳(メタデータ) (2023-01-23T13:34:49Z) - Learning to Exploit Temporal Structure for Biomedical Vision-Language
Processing [53.89917396428747]
視覚言語処理における自己教師あり学習は、画像とテキストのモダリティのセマンティックアライメントを利用する。
トレーニングと微調整の両方で利用できる場合、事前のイメージとレポートを明示的に説明します。
我々のアプローチはBioViL-Tと呼ばれ、テキストモデルと共同で訓練されたCNN-Transformerハイブリッドマルチイメージエンコーダを使用する。
論文 参考訳(メタデータ) (2023-01-11T16:35:33Z) - A Domain-specific Perceptual Metric via Contrastive Self-supervised
Representation: Applications on Natural and Medical Images [8.769705957207576]
2つの画像の知覚的類似性を定量化することは、低レベルのコンピュータビジョンにおける長年の問題である。
最近のコントラスト的自己監督表現(CSR)が救助にやってくる可能性がある。
論文 参考訳(メタデータ) (2022-12-03T08:55:47Z) - Adapting Pretrained Vision-Language Foundational Models to Medical
Imaging Domains [3.8137985834223502]
臨床の文脈を忠実に描写する医療画像の生成モデルを構築することは、医療データセットの不明瞭さを軽減するのに役立つ。
安定拡散パイプラインのサブコンポーネントを探索し、モデルを微調整して医用画像を生成する。
我々の最良の性能モデルは、安定な拡散ベースラインを改善し、合成ラジオグラフィ画像に現実的な異常を挿入するように条件付けすることができる。
論文 参考訳(メタデータ) (2022-10-09T01:43:08Z) - Improved Slice-wise Tumour Detection in Brain MRIs by Computing
Dissimilarities between Latent Representations [68.8204255655161]
磁気共鳴画像(MRI)の異常検出は教師なし手法で行うことができる。
本研究では,変分オートエンコーダの潜伏空間における相似関数の計算に基づいて,腫瘍検出のためのスライスワイズ半教師法を提案する。
本研究では,高解像度画像上でのモデルをトレーニングし,再現の質を向上させることにより,異なるベースラインに匹敵する結果が得られることを示す。
論文 参考訳(メタデータ) (2020-07-24T14:02:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。