論文の概要: Lesion-Aware Post-Training of Latent Diffusion Models for Synthesizing Diffusion MRI from CT Perfusion
- arxiv url: http://arxiv.org/abs/2510.09056v1
- Date: Fri, 10 Oct 2025 06:51:27 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-14 00:38:48.29664
- Title: Lesion-Aware Post-Training of Latent Diffusion Models for Synthesizing Diffusion MRI from CT Perfusion
- Title(参考訳): CT灌流から拡散MRIを合成する潜在拡散モデルの病変認識後評価
- Authors: Junhyeok Lee, Hyunwoong Kim, Hyungjin Chung, Heeseong Eom, Joon Jang, Chul-Ho Sohn, Kyu Sung Choi,
- Abstract要約: ラテント拡散モデル(LDMs)は圧縮されたラテント空間における効率的な学習を活用する。
この効率性にはトレードオフがあり、重要なピクセルレベルの詳細を妥協させる可能性がある。
本稿では, 画像から画像への変換において, 病変対応の医用画素空間の目的を取り入れた, LDMの新たなトレーニングフレームワークを提案する。
- 参考スコア(独自算出の注目度): 12.777937532267105
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Image-to-Image translation models can help mitigate various challenges inherent to medical image acquisition. Latent diffusion models (LDMs) leverage efficient learning in compressed latent space and constitute the core of state-of-the-art generative image models. However, this efficiency comes with a trade-off, potentially compromising crucial pixel-level detail essential for high-fidelity medical images. This limitation becomes particularly critical when generating clinically significant structures, such as lesions, which often occupy only a small portion of the image. Failure to accurately reconstruct these regions can severely impact diagnostic reliability and clinical decision-making. To overcome this limitation, we propose a novel post-training framework for LDMs in medical image-to-image translation by incorporating lesion-aware medical pixel space objectives. This approach is essential, as it not only enhances overall image quality but also improves the precision of lesion delineation. We evaluate our framework on brain CT-to-MRI translation in acute ischemic stroke patients, where early and accurate diagnosis is critical for optimal treatment selection and improved patient outcomes. While diffusion MRI is the gold standard for stroke diagnosis, its clinical utility is often constrained by high costs and low accessibility. Using a dataset of 817 patients, we demonstrate that our framework improves overall image quality and enhances lesion delineation when synthesizing DWI and ADC images from CT perfusion scans, outperforming existing image-to-image translation models. Furthermore, our post-training strategy is easily adaptable to pre-trained LDMs and exhibits substantial potential for broader applications across diverse medical image translation tasks.
- Abstract(参考訳): 画像間翻訳モデルは、医用画像取得に固有の様々な課題を軽減するのに役立つ。
ラテント拡散モデル(LDMs)は圧縮されたラテント空間における効率的な学習を活用し、最先端の生成画像モデルのコアを構成する。
しかし、この効率性にはトレードオフがあり、高忠実度医療画像に不可欠なピクセルレベルの細部を妥協する可能性がある。
この制限は、画像のごく一部しか占めない病変などの臨床的に重要な構造を生成する際に特に重要となる。
これらの領域を正確に再構築できないことは、診断の信頼性と臨床的意思決定に深刻な影響を及ぼす。
この制限を克服するために,病変認識型医用画素空間の目的を取り入れた,医用画像・画像翻訳におけるLCMの新たなトレーニングフレームワークを提案する。
このアプローチは画像の全体的な品質を向上するだけでなく、病変のデライン化の精度も向上するので、不可欠である。
急性虚血性脳卒中患者の脳内CT-MRI翻訳の枠組みについて検討した。
拡散MRIは脳卒中診断のゴールドスタンダードであるが,高コストとアクセシビリティの低下により臨床応用が制限されることが多い。
817例のデータセットを用いて,DWI画像とADC画像をCT灌流スキャンから合成し,既存の画像と画像の翻訳モデルより優れた画像品質の向上と病変のデライン化を図った。
さらに,本研究のポストトレーニング戦略は,事前訓練されたLCMにも容易に適用可能であり,多様な医用画像翻訳タスクにまたがる幅広い応用の可能性を示している。
関連論文リスト
- Causal Disentanglement for Robust Long-tail Medical Image Generation [80.15257897500578]
そこで本研究では,病的特徴と構造的特徴を独立に生成する新しい医用画像生成フレームワークを提案する。
本稿では,病理所見から導かれる拡散モデルを用いて病理像をモデル化し,種々の対物画像の生成を可能にする。
論文 参考訳(メタデータ) (2025-04-20T01:54:18Z) - MedIL: Implicit Latent Spaces for Generating Heterogeneous Medical Images at Arbitrary Resolutions [2.2427832125073732]
MedILは、異質なサイズと解像度で医療画像をエンコードするために開発された、一級のオートエンコーダである。
我々は,MedILが大規模マルチサイト・マルチレゾリューションデータセットに対して臨床的に関連性のある特徴をいかに圧縮し,保存するかを示す。
論文 参考訳(メタデータ) (2025-04-12T19:52:56Z) - Latent Drifting in Diffusion Models for Counterfactual Medical Image Synthesis [55.959002385347645]
遅延ドリフトにより、医療画像に対して拡散モデルを条件付けし、反ファクト画像生成の複雑なタスクに適合させることができる。
我々は,脳MRIと胸部X線による3つの時系列的ベンチマークデータセットを用いて,対物画像生成法について検討した。
論文 参考訳(メタデータ) (2024-12-30T01:59:34Z) - A Unified Model for Compressed Sensing MRI Across Undersampling Patterns [69.19631302047569]
様々な計測アンサンプパターンと画像解像度に頑健な統合MRI再構成モデルを提案する。
我々のモデルは、拡散法よりも600$times$高速な推論で、最先端CNN(End-to-End VarNet)の4dBでSSIMを11%改善し、PSNRを4dB改善する。
論文 参考訳(メタデータ) (2024-10-05T20:03:57Z) - Multiscale Latent Diffusion Model for Enhanced Feature Extraction from Medical Images [5.395912799904941]
CTスキャナーモデルと取得プロトコルのバリエーションは、抽出した放射能特性に有意な変動をもたらす。
LTDiff++は医療画像の特徴抽出を強化するために設計されたマルチスケール潜在拡散モデルである。
論文 参考訳(メタデータ) (2024-10-05T02:13:57Z) - Cross-Modal Domain Adaptation in Brain Disease Diagnosis: Maximum Mean Discrepancy-based Convolutional Neural Networks [0.0]
脳障害は世界の健康にとって大きな課題であり、毎年何百万人もの死者を出している。
これらの疾患の正確な診断は、MRIやCTのような高度な医療画像技術に大きく依存している。
注釈付きデータの不足は、診断のための機械学習モデルをデプロイする上で大きな課題となる。
論文 参考訳(メタデータ) (2024-05-06T07:44:46Z) - On Sensitivity and Robustness of Normalization Schemes to Input
Distribution Shifts in Automatic MR Image Diagnosis [58.634791552376235]
深層学習(DL)モデルは、再構成画像を入力として、複数の疾患の診断において最先端のパフォーマンスを達成した。
DLモデルは、トレーニングとテストフェーズ間の入力データ分布の変化につながるため、さまざまなアーティファクトに敏感である。
本稿では,グループ正規化やレイヤ正規化といった他の正規化手法を用いて,画像のさまざまなアーチファクトに対して,モデル性能にロバスト性を注入することを提案する。
論文 参考訳(メタデータ) (2023-06-23T03:09:03Z) - Negligible effect of brain MRI data preprocessing for tumor segmentation [36.89606202543839]
我々は3つの公開データセットの実験を行い、ディープニューラルネットワークにおける異なる前処理ステップの効果を評価する。
その結果、最も一般的な標準化手順は、ネットワーク性能に何の価値も与えないことが示されている。
画像の規格化に伴う信号分散の低減のため,画像強度正規化手法はモデル精度に寄与しない。
論文 参考訳(メタデータ) (2022-04-11T17:29:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。