論文の概要: Domain-Specific Latent Representations Improve the Fidelity of Diffusion-Based Medical Image Super-Resolution
- arxiv url: http://arxiv.org/abs/2604.12152v1
- Date: Tue, 14 Apr 2026 00:11:23 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-15 19:11:32.169186
- Title: Domain-Specific Latent Representations Improve the Fidelity of Diffusion-Based Medical Image Super-Resolution
- Title(参考訳): ドメイン特異的潜在表現は拡散型医用画像超解像の忠実度を改善する
- Authors: Sebastian Cajas, Ashaba Judith, Rahul Gorijavolu, Sahil Kapadia, Hillary Clinton Kasimbazi, Leo Kinyera, Emmanuel Paul Kwesiga, Sri Sri Jaithra Varma Manthena, Luis Filipe Nakayama, Ninsiima Doreen, Leo Anthony Celi,
- Abstract要約: 拡散アーキテクチャではなく、デフォルトの選択が、再構築品質に対する支配的な制約であることを示す。
他の全てのパイプラインコンポーネントを固定し、一般的な安定拡散VAEをMedVAEに置き換える制御実験では、1.6万以上の医療画像で事前訓練されたドメイン固有のオートエンコーダが+2.91から+3.29dB PSNRの改善をもたらす。
- 参考スコア(独自算出の注目度): 1.9445587388663237
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Latent diffusion models for medical image super-resolution universally inherit variational autoencoders designed for natural photographs. We show that this default choice, not the diffusion architecture, is the dominant constraint on reconstruction quality. In a controlled experiment holding all other pipeline components fixed, replacing the generic Stable Diffusion VAE with MedVAE, a domain-specific autoencoder pretrained on more than 1.6 million medical images, yields +2.91 to +3.29 dB PSNR improvement across knee MRI, brain MRI, and chest X-ray (n = 1,820; Cohen's d = 1.37 to 1.86, all p < 10^{-20}, Wilcoxon signed-rank). Wavelet decomposition localises the advantage to the finest spatial frequency bands encoding anatomically relevant fine structure. Ablations across inference schedules, prediction targets, and generative architectures confirm the gap is stable within plus or minus 0.15 dB, while hallucination rates remain comparable between methods (Cohen's h < 0.02 across all datasets), establishing that reconstruction fidelity and generative hallucination are governed by independent pipeline components. These results provide a practical screening criterion: autoencoder reconstruction quality, measurable without diffusion training, predicts downstream SR performance (R^2 = 0.67), suggesting that domain-specific VAE selection should precede diffusion architecture search. Code and trained model weights are publicly available at https://github.com/sebasmos/latent-sr.
- Abstract(参考訳): 超高解像度医用画像の潜時拡散モデルは、自然写真用に設計された変分オートエンコーダを普遍的に継承する。
このデフォルトの選択は、拡散アーキテクチャではなく、再構築品質に対する支配的な制約であることを示す。
一般的な安定拡散VAEをMedVAEに置き換える制御された実験では、1.6万以上の医療画像で事前訓練されたドメイン固有のオートエンコーダが、膝MRI、脳MRI、胸部X線(n = 1,820; Cohen's d = 1.37 to 1.86, all p < 10^{-20}, Wilcoxon signed-rank)で+2.91から+3.29 dB PSNRの改善を達成した。
ウェーブレット分解は、解剖学的に関連する微細構造をコードする最も優れた空間周波数帯域の利点をローカライズする。
推論スケジュール、予測対象、生成的アーキテクチャ間のアブレーションにより、ギャップはプラスまたはマイナス0.15dB内で安定であり、幻覚率はメソッド間で同等であり(コーエンのh < 0.02は全てのデータセットにわたって)、再構成の忠実さと生成的幻覚は独立したパイプラインコンポーネントによって支配される。
自動エンコーダ再構成の品質は拡散訓練なしで測定可能であり、下流SR性能(R^2 = 0.67)を予測し、ドメイン固有のVAE選択が拡散アーキテクチャ探索に先立つことを示唆している。
コードとトレーニングされたモデルウェイトはhttps://github.com/sebasmos/latent-sr.comで公開されている。
関連論文リスト
- POWDR: Pathology-preserving Outpainting with Wavelet Diffusion for 3D MRI [7.901173149711112]
POWDRは、条件付きウェーブレット拡散モデルに基づく3次元MRIのための病理保存アウトペイントフレームワークである。
提案手法はウェーブレット領域の条件付けを利用して,遅延拡散モデルでよく見られる高周波ディテールとぼやけを増大させる。
論文 参考訳(メタデータ) (2026-01-14T00:20:13Z) - Cyclic Self-Supervised Diffusion for Ultra Low-field to High-field MRI Synthesis [20.659040331377216]
低磁場MRIは安価で、よりアクセシビリティが高く、安全であるが、低解像度で信号対雑音比が低い。
画像のコントラストにおいて、解剖学的な忠実さを保ち、きめ細かな構造の詳細を高め、ドメインギャップを埋める必要がある。
実低磁場MRIデータから高磁場MRI合成を行うために, 楕円型自己教師拡散(CSS-Diff)フレームワークを提案する。
論文 参考訳(メタデータ) (2025-10-15T16:41:54Z) - Efficient Image-to-Image Schrödinger Bridge for CT Field of View Extension [10.352797961760976]
画像から画像までのSchr"odinger Bridge (I$2$SB)拡散モデルに基づく効率的なCT FOV拡張フレームワークを提案する。
I$2$SBは、実データで49.8,HU、実データで152.0HUのルート平均二乗誤差(RMSE)値で優れた定量的性能を達成する。
1ステップの推論では、2Dスライスあたり0.19秒で再構築が可能で、cDDPM (135秒) よりも700倍のスピードアップを示し、拡散GAN (0.58秒) を超えている。
論文 参考訳(メタデータ) (2025-08-15T04:41:05Z) - MDPG: Multi-domain Diffusion Prior Guidance for MRI Reconstruction [0.4893345190925178]
MRI再構成タスクにおけるデータの一貫性を高めるために,MDPG(Multi- Domain Diffusion Prior Guidance)を提案する。
具体的には、まず、アンダーサンプル画像の効率的なエンコーディングと再構成を可能にする、ビジュアルマンバベースのバックボーンを構築する。
多レベル潜伏領域における効率的な融合のための新しい潜伏誘導注意(LGA)を提案する。
論文 参考訳(メタデータ) (2025-06-30T10:25:08Z) - Latent Diffusion Autoencoders: Toward Efficient and Meaningful Unsupervised Representation Learning in Medical Imaging [41.446379453352534]
LDAE(Latent Diffusion Autoencoder)は、医用画像における効率的で有意義な教師なし学習のための、エンコーダ-デコーダ拡散に基づく新しいフレームワークである。
本研究は,ADNIデータベースの脳MRIを用いたアルツハイマー病(AD)を事例として検討した。
論文 参考訳(メタデータ) (2025-04-11T15:37:46Z) - A Unified Model for Compressed Sensing MRI Across Undersampling Patterns [69.19631302047569]
様々な計測アンサンプパターンと画像解像度に頑健な統合MRI再構成モデルを提案する。
我々のモデルは、拡散法よりも600$times$高速な推論で、最先端CNN(End-to-End VarNet)の4dBでSSIMを11%改善し、PSNRを4dB改善する。
論文 参考訳(メタデータ) (2024-10-05T20:03:57Z) - DPER: Diffusion Prior Driven Neural Representation for Limited Angle and Sparse View CT Reconstruction [45.00528216648563]
Diffusion Prior Driven Neural Representation (DPER) は、異常に不適切なCT再構成逆問題に対処するために設計された、教師なしのフレームワークである。
DPERは、半二次分割法(HQS)アルゴリズムを採用し、逆問題からデータ忠実度とサブプロブレム前の分布に分解する。
LACTにおけるDPERの性能評価と2つの公開データセットを用いた超SVCT再構成に関する総合的な実験を行った。
論文 参考訳(メタデータ) (2024-04-27T12:55:13Z) - Domain-agnostic segmentation of thalamic nuclei from joint structural
and diffusion MRI [4.74939378804588]
視床核をT1から切り離すことができる最初のCNNと、リトレーニングや微調整なしに任意の解像度の拡散データを提示する。
我々のCNNは、入力の解像度に関係なく、0.7mm等方分解能のセグメンテーションを生成する。
論文 参考訳(メタデータ) (2023-05-05T10:26:50Z) - Negligible effect of brain MRI data preprocessing for tumor segmentation [36.89606202543839]
我々は3つの公開データセットの実験を行い、ディープニューラルネットワークにおける異なる前処理ステップの効果を評価する。
その結果、最も一般的な標準化手順は、ネットワーク性能に何の価値も与えないことが示されている。
画像の規格化に伴う信号分散の低減のため,画像強度正規化手法はモデル精度に寄与しない。
論文 参考訳(メタデータ) (2022-04-11T17:29:36Z) - An interpretable classifier for high-resolution breast cancer screening
images utilizing weakly supervised localization [45.00998416720726]
医用画像の特徴に対処する枠組みを提案する。
このモデルはまず、画像全体の低容量だがメモリ効率のよいネットワークを使用して、最も情報性の高い領域を識別する。
次に、選択したリージョンから詳細を収集するために、別の高容量ネットワークを適用します。
最後に、グローバルおよびローカル情報を集約して最終的な予測を行うフュージョンモジュールを使用する。
論文 参考訳(メタデータ) (2020-02-13T15:28:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。