論文の概要: Perceptual Evaluation of GANs and Diffusion Models for Generating X-rays
- arxiv url: http://arxiv.org/abs/2508.07128v1
- Date: Sun, 10 Aug 2025 00:32:18 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-12 21:23:28.715778
- Title: Perceptual Evaluation of GANs and Diffusion Models for Generating X-rays
- Title(参考訳): X線生成のためのGANと拡散モデルの知覚的評価
- Authors: Gregory Schuit, Denis Parra, Cecilia Besa,
- Abstract要約: 生成画像モデルは、自然画像と医療画像の両方において顕著な進歩を遂げている。
4つの異常を条件に胸部X線を合成するための最先端生成モデル-GAN(Generative Adversarial Networks)と拡散モデル(Diffusion Models)の有効性を評価する。
- 参考スコア(独自算出の注目度): 0.7578439720012189
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Generative image models have achieved remarkable progress in both natural and medical imaging. In the medical context, these techniques offer a potential solution to data scarcity-especially for low-prevalence anomalies that impair the performance of AI-driven diagnostic and segmentation tools. However, questions remain regarding the fidelity and clinical utility of synthetic images, since poor generation quality can undermine model generalizability and trust. In this study, we evaluate the effectiveness of state-of-the-art generative models-Generative Adversarial Networks (GANs) and Diffusion Models (DMs)-for synthesizing chest X-rays conditioned on four abnormalities: Atelectasis (AT), Lung Opacity (LO), Pleural Effusion (PE), and Enlarged Cardiac Silhouette (ECS). Using a benchmark composed of real images from the MIMIC-CXR dataset and synthetic images from both GANs and DMs, we conducted a reader study with three radiologists of varied experience. Participants were asked to distinguish real from synthetic images and assess the consistency between visual features and the target abnormality. Our results show that while DMs generate more visually realistic images overall, GANs can report better accuracy for specific conditions, such as absence of ECS. We further identify visual cues radiologists use to detect synthetic images, offering insights into the perceptual gaps in current models. These findings underscore the complementary strengths of GANs and DMs and point to the need for further refinement to ensure generative models can reliably augment training datasets for AI diagnostic systems.
- Abstract(参考訳): 生成画像モデルは、自然画像と医療画像の両方において顕著な進歩を遂げている。
医学的な文脈では、これらの技術は、AI駆動診断とセグメンテーションツールのパフォーマンスを損なう、特に低頻度の異常に対して、データ不足に対する潜在的な解決策を提供する。
しかし, モデル一般化性や信頼性を損なう要因として, 合成画像の忠実度や臨床的有用性に疑問が残る。
本研究では,4つの異常を条件とした胸部X線合成(Alectasis (AT), Lung Opacity (LO), Pleural Effusion (PE), Enlarged Cardiac Silhouette (ECS))の有効性を評価する。
MIMIC-CXRデータセットの実際の画像と、GANとDMの合成画像からなるベンチマークを用いて、様々な経験を持つ3人の放射線技師を対象に、読者による研究を行った。
参加者は、実際の画像と合成画像とを区別し、視覚的特徴と対象の異常との整合性を評価するよう求められた。
以上の結果から, DMは視覚的によりリアルな画像を生成するが, GANはECSの欠如など, 特定の条件に対してより正確な画像を生成することができることがわかった。
さらに,合成画像の検出に使用する視覚的手がかりを同定し,現在のモデルにおける知覚的ギャップについて考察する。
これらの知見は、GANとDMの相補的な強みを強調し、生成モデルがAI診断システムのためのトレーニングデータセットを確実に増強できるように、さらなる改善の必要性を指摘する。
関連論文リスト
- Diffusing the Blind Spot: Uterine MRI Synthesis with Diffusion Models [5.405060834788189]
子宮MRI合成のための新しい拡散型フレームワークを提案する。
本手法は, 解剖学的に整合した高忠実な合成画像を生成し, 実際のスキャンを忠実に再現する。
ブラインドド・エキスパートによる評価は,我々の合成画像の臨床的現実性を評価する。
論文 参考訳(メタデータ) (2025-08-11T12:18:23Z) - Diffusion Models for conditional MRI generation [0.0]
脳磁気共鳴画像(MRI)生成のための潜時拡散モデル(LDM)を提案する。
生成画像の品質を評価するために、Fr'echet Inception Distance(FID)とMulti-Scale Structure similarity Index(MS-SSIM)のメトリクスを使用した。
論文 参考訳(メタデータ) (2025-02-25T20:08:29Z) - Ambient Denoising Diffusion Generative Adversarial Networks for Establishing Stochastic Object Models from Noisy Image Data [4.069144210024564]
本稿では,ノイズの多い画像データから現実的なSOMを学習するための拡張DDGANアーキテクチャであるADDGANを提案する。
雑音の多い画像データから現実的なSOMを学習する能力を示す。
論文 参考訳(メタデータ) (2025-01-31T12:40:43Z) - Latent Drifting in Diffusion Models for Counterfactual Medical Image Synthesis [55.959002385347645]
遅延ドリフトにより、医療画像に対して拡散モデルを条件付けし、反ファクト画像生成の複雑なタスクに適合させることができる。
我々は,脳MRIと胸部X線による3つの時系列的ベンチマークデータセットを用いて,対物画像生成法について検討した。
論文 参考訳(メタデータ) (2024-12-30T01:59:34Z) - GAN-Based Architecture for Low-dose Computed Tomography Imaging Denoising [1.0138723409205497]
GAN(Generative Adversarial Networks)は低線量CT(LDCT)領域における革命的要素として浮上している。
本総説では,GANに基づくLDCT復調技術の急速な進歩を概観する。
論文 参考訳(メタデータ) (2024-11-14T15:26:10Z) - Radiology Report Generation Using Transformers Conditioned with
Non-imaging Data [55.17268696112258]
本稿では,胸部X線画像と関連する患者の人口統計情報を統合したマルチモーダルトランスフォーマーネットワークを提案する。
提案ネットワークは、畳み込みニューラルネットワークを用いて、CXRから視覚的特徴を抽出し、その視覚的特徴と患者の人口統計情報のセマンティックテキスト埋め込みを組み合わせたトランスフォーマーベースのエンコーダデコーダネットワークである。
論文 参考訳(メタデータ) (2023-11-18T14:52:26Z) - Beyond Images: An Integrative Multi-modal Approach to Chest X-Ray Report
Generation [47.250147322130545]
画像からテキストまでの放射線学レポート生成は,医療画像の発見を記述した放射線学レポートを自動生成することを目的としている。
既存の方法の多くは画像データのみに焦点をあてており、他の患者情報は放射線科医に公開されていない。
胸部X線レポートを生成するための多モードディープニューラルネットワークフレームワークを,非構造的臨床ノートとともにバイタルサインや症状などの構造化された患者データを統合することで提案する。
論文 参考訳(メタデータ) (2023-11-18T14:37:53Z) - On Sensitivity and Robustness of Normalization Schemes to Input
Distribution Shifts in Automatic MR Image Diagnosis [58.634791552376235]
深層学習(DL)モデルは、再構成画像を入力として、複数の疾患の診断において最先端のパフォーマンスを達成した。
DLモデルは、トレーニングとテストフェーズ間の入力データ分布の変化につながるため、さまざまなアーティファクトに敏感である。
本稿では,グループ正規化やレイヤ正規化といった他の正規化手法を用いて,画像のさまざまなアーチファクトに対して,モデル性能にロバスト性を注入することを提案する。
論文 参考訳(メタデータ) (2023-06-23T03:09:03Z) - Variational Knowledge Distillation for Disease Classification in Chest
X-Rays [102.04931207504173]
我々は,X線に基づく疾患分類のための新しい確率的推論フレームワークである反復的知識蒸留(VKD)を提案する。
提案手法の有効性を,X線画像とEHRを用いた3つの公開ベンチマークデータセットに示す。
論文 参考訳(メタデータ) (2021-03-19T14:13:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。