論文の概要: Cross Modality Image Translation In Medical Imaging Using Generative Frameworks
- arxiv url: http://arxiv.org/abs/2605.13686v1
- Date: Wed, 13 May 2026 15:41:44 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-14 23:30:28.147805
- Title: Cross Modality Image Translation In Medical Imaging Using Generative Frameworks
- Title(参考訳): 生成フレームワークを用いた医用画像のクロスモーダル画像変換
- Authors: Giulia Romoli, Alessia Capoccia, Filippo Ruffini, Francesco Di Feola, Luca Boldrini, Arturo Chiti, Renato Cuocolo, Tugba Akinci D'Antonoli, Fatemeh Darvizeh, Marcello Di Pumpo, Bradley J. Erickson, Liu Fang, Deborah Fazzini, Paola Feraco, Fabrizia Gelardi, Francesco Gossetti, Ana Isabel Hernáiz Ferrer, Michail E. Klontzas, Seyedmehdi Payabvash, Katrine Riklund, Sara N. Strandberg, Valerio Guarrasi, Paolo Soda,
- Abstract要約: 本研究は, 腫瘍画像における3次元I2I翻訳法の再現性, 標準化された比較評価である。
7つの生成モデル,3つの生成適応ネットワーク(GAN:Pix2Pix, CycleGAN, SRGAN)と4つの潜在生成モデル(Latent Diffusion Model, Latent Diffusion Model+ControlNet, Brownian Bridge, Flow Matching)を比較した。
その結果、GANは全てのタスクにおいて遅延生成モデルよりも優れており、SRGANは統計的に有意な優位性を達成していることがわかった。
- 参考スコア(独自算出の注目度): 5.785096712074492
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Medical image-to-image (I2I) translation enables virtual scanning, i.e. the synthesis of a target imaging modality from a source one without additional acquisitions. Despite growing interest, most proposed methods operate on 2D slices, are evaluated on isolated tasks with different experimental set-ups and lack clinical validation. The primary contribution of this work is a reproducible, standardized comparative evaluation of 3D I2I translation methods in oncological imaging, designed to standardize preprocessing, splitting, inference, and multi-level evaluation across heterogeneous clinical tasks. Within this framework, we compare seven generative models, three Generative Adversarial Networks (GANs: Pix2Pix, CycleGAN, SRGAN) and four latent generative models (Latent Diffusion Model, Latent Diffusion Model+ControlNet, Brownian Bridge, Flow Matching), across eleven datasets spanning three anatomical regions (head/neck, lung, pelvis) and four translation directions (cone-beam CT to CT, MRI to CT, CT to PET, MRI T2-weighted to T2-FLAIR), for a total of 77 experiments under uniform training, inference, and evaluation conditions. The results show that GANs outperform latent generative models across all tasks, with SRGAN achieving statistically significant superiority. Our lesion-level analysis reveals that all models struggle with small lesions and that, in CT to PET synthesis, models reproduce lesion shape more reliably than absolute uptake-related intensity. We also performed a Visual Turing test administered to 17 physicians, including 15 radiologists, which shows near-chance classification accuracy (56.7%), confirming that synthetic volumes are largely indistinguishable from real acquisitions, while exposing a dissociation between quantitative metrics and clinical preference.
- Abstract(参考訳): 医用画像画像変換(I2I)は、仮想走査を可能にする。
関心が高まりつつも、ほとんどの手法は2次元スライスで動作し、異なる実験セットで個別のタスクで評価され、臨床検証が欠如している。
本研究の主な貢献は, 腫瘍画像における3次元I2I翻訳法の再現性, 標準化された比較評価である。
本フレームワークでは,3つの生成モデル, Pix2Pix, CycleGAN, SRGAN) と4つの潜在生成モデル (潜時拡散モデル, 潜時拡散モデル+ControlNet, Brownian Bridge, Flow Matching) を比較し, 3つの解剖学的領域(頭頸部, 肺, 骨盤)と4つの翻訳方向(cone-beam CT, CT, CT, CT, PET, MRI T2-weighted to T2-FLAIR) にまたがる11個のデータセットを比較した。
その結果、GANは全てのタスクにおいて遅延生成モデルよりも優れており、SRGANは統計的に有意な優位性を達成していることがわかった。
病変レベル解析の結果,すべてのモデルが小さな病変に苦しむことが明らかとなり,CTからPETへの合成では,絶対吸収関連強度よりも確実に病変形状を再現することが示唆された。
また,15名の放射線科医を含む17名の医師を対象とした視覚的チューリングテストを実施し,その結果から,合成ボリュームが実際の取得と大きく区別できないことを確認し,定量的指標と臨床上の嗜好の解離を明らかにした。
関連論文リスト
- PHASOR: Anatomy- and Phase-Consistent Volumetric Diffusion for CT Virtual Contrast Enhancement [60.81732730684265]
本稿では,高忠実度仮想コントラスト拡張(VCE)のための体積拡散フレームワークPHASORを紹介する。
我々は、CTボリュームをコヒーレントシーケンスとして扱うことにより、ビデオ拡散モデルを利用して、構造的コヒーレンスとボリューム精度を向上させる。
まず, 解剖学的意味論に固有の拡張パターンを固定し, 臓器特異的なメモリを付加して, より詳細な情報を収集する。
第二に、インテンシティ・フェイズ・アウェアメント・アライメント・アライメント(IP-REPA)は、不完全な空間アライメントの影響を緩和しつつ、複雑なコントラスト信号を強調する。
論文 参考訳(メタデータ) (2026-04-01T15:57:18Z) - EqDiff-CT: Equivariant Conditional Diffusion model for CT Image Synthesis from CBCT [43.92108185590778]
画像誘導放射線療法(IGRT)に広く用いられているコーンビームCT(CBCT)
CBCTから高品質なCT画像を生成するために,EqDiff-CTという新しい拡散型条件生成モデルを提案する。
論文 参考訳(メタデータ) (2025-09-26T05:51:59Z) - Cascaded 3D Diffusion Models for Whole-body 3D 18-F FDG PET/CT synthesis from Demographics [13.016275337899895]
人口統計学変数から直接高忠実度3D PET/CTボリュームを合成するための3次元拡散モデルフレームワークを提案する。
初期スコアベース拡散モデルでは、人口統計学的変数のみから低分解能PET/CTボリュームを合成する。
この後、空間分解能を洗練させる超解像残留拡散モデルが続く。
論文 参考訳(メタデータ) (2025-05-28T15:38:33Z) - Improving Heart Rejection Detection in XPCI Images Using Synthetic Data Augmentation [0.0]
StyleGANは利用可能な3Rバイオプシーパッチで訓練され、その後、1万のリアルな合成画像を生成するために使用された。
これらは、ResNet-18分類器をバイナリーリジェクション分類のために訓練するための様々な構成において、レジェクション無しのサンプルである実際の0Rサンプルと組み合わせられた。
その結果, 実検体と組み合わせて使用する場合, 合成データにより分類性能が向上することが示唆された。
論文 参考訳(メタデータ) (2025-05-26T09:26:36Z) - 3D Nephrographic Image Synthesis in CT Urography with the Diffusion Model and Swin Transformer [3.8557197729550485]
提案手法は,高品質な3次元腎画像の合成を効果的に行う。
画像の品質を損なうことなく、CTUの放射線線量を33.3%削減することができる。
論文 参考訳(メタデータ) (2025-02-26T23:22:31Z) - Deep Learning for Vascular Segmentation and Applications in Phase
Contrast Tomography Imaging [33.23991248643144]
本稿では,多様な臓器にまたがる機械学習技術の現状を概説する。
我々のゴールは、このトピックの基礎を提供し、新しい画像モダリティで血管セグメンテーションに適用するための堅牢なベースラインモデルを特定することである。
HiP CTは、1ボクセルあたり20mmという前例のない解像度で、完全な臓器の3Dイメージングを可能にする。
論文 参考訳(メタデータ) (2023-11-22T11:15:38Z) - Validated respiratory drug deposition predictions from 2D and 3D medical
images with statistical shape models and convolutional neural networks [47.187609203210705]
患者固有の沈着モデリングのための自動計算フレームワークを開発し,検証することを目的としている。
2次元胸部X線と3次元CT画像から3次元患者の呼吸動態を生成できる画像処理手法が提案されている。
論文 参考訳(メタデータ) (2023-03-02T07:47:07Z) - Harmonizing Pathological and Normal Pixels for Pseudo-healthy Synthesis [68.5287824124996]
そこで本研究では,新しいタイプの識別器であるセグメンタを提案し,病変の正確な特定と擬似健康画像の視覚的品質の向上を図っている。
医用画像強調に生成画像を適用し,低コントラスト問題に対処するために拡張結果を利用する。
BraTSのT2モダリティに関する総合的な実験により、提案手法は最先端の手法よりも大幅に優れていることが示された。
論文 参考訳(メタデータ) (2022-03-29T08:41:17Z) - CyTran: A Cycle-Consistent Transformer with Multi-Level Consistency for
Non-Contrast to Contrast CT Translation [56.622832383316215]
コントラストCTを非コントラストCTに変換する手法を提案する。
提案手法は、CyTranを略して、サイクル一貫性のある生成逆転変換器に基づいている。
実験の結果、CyTranは競合するすべての手法より優れています。
論文 参考訳(メタデータ) (2021-10-12T23:25:03Z) - Synergistic Learning of Lung Lobe Segmentation and Hierarchical
Multi-Instance Classification for Automated Severity Assessment of COVID-19
in CT Images [61.862364277007934]
3次元CT画像におけるCOVID-19の重症度自動評価のための相乗的学習フレームワークを提案する。
マルチタスクのディープネットワーク(M$2$UNet)が開発され、新型コロナウイルス患者の重症度を評価する。
われわれのM$2$UNetはパッチレベルのエンコーダと肺葉分画のためのセグメンテーションサブネットワークと重度評価のための分類サブネットワークから構成されている。
論文 参考訳(メタデータ) (2020-05-08T03:16:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。