論文の概要: DEMIST: \underline{DE}coupled \underline{M}ulti-stream latent d\underline{I}ffusion for Quantitative Myelin Map \underline{S}yn\underline{T}hesis
- arxiv url: http://arxiv.org/abs/2511.12396v1
- Date: Sun, 16 Nov 2025 00:19:48 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-18 14:36:24.015423
- Title: DEMIST: \underline{DE}coupled \underline{M}ulti-stream latent d\underline{I}ffusion for Quantitative Myelin Map \underline{S}yn\underline{T}hesis
- Title(参考訳): DEMIST: \underline{DE} Coupled \underline{M}ulti-stream latent d\underline{I}ffusion for Quantitative Myelin Map \underline{S}yn\underline{T}hesis
- Authors: Jiacheng Wang, Hao Li, Xing Yao, Ahmad Toubasi, Taegan Vinarsky, Caroline Gheen, Joy Derwenskus, Chaoyang Jin, Richard Dortch, Junzhong Xu, Francesca Bagnato, Ipek Oguz,
- Abstract要約: 定量的磁化転移(qMT)イメージングは、ミエリン感受性バイオマーカー、例えばプールサイズ比(PSR)を提供する
3つの相補的条件付き3次元潜在拡散モデルを用いて標準T1wおよびFLAIR画像からPSRマップを合成するDEMISTを提案する。
- 参考スコア(独自算出の注目度): 5.105133772716832
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Quantitative magnetization transfer (qMT) imaging provides myelin-sensitive biomarkers, such as the pool size ratio (PSR), which is valuable for multiple sclerosis (MS) assessment. However, qMT requires specialized 20-30 minute scans. We propose DEMIST to synthesize PSR maps from standard T1w and FLAIR images using a 3D latent diffusion model with three complementary conditioning mechanisms. Our approach has two stages: first, we train separate autoencoders for PSR and anatomical images to learn aligned latent representations. Second, we train a conditional diffusion model in this latent space on top of a frozen diffusion foundation backbone. Conditioning is decoupled into: (i) \textbf{semantic} tokens via cross-attention, (ii) \textbf{spatial} per-scale residual hints via a 3D ControlNet branch, and (iii) \textbf{adaptive} LoRA-modulated attention. We include edge-aware loss terms to preserve lesion boundaries and alignment losses to maintain quantitative consistency, while keeping the number of trainable parameters low and retaining the inductive bias of the pretrained model. We evaluate on 163 scans from 99 subjects using 5-fold cross-validation. Our method outperforms VAE, GAN and diffusion baselines on multiple metrics, producing sharper boundaries and better quantitative agreement with ground truth. Our code is publicly available at https://github.com/MedICL-VU/MS-Synthesis-3DcLDM.
- Abstract(参考訳): 定量的磁化転移(qMT)イメージングは、多発性硬化症(MS)評価に有用なプールサイズ比(PSR)などのミエリン感受性バイオマーカーを提供する。
しかし、qMTは特別な20-30分スキャンを必要とする。
3つの相補的条件付き3次元潜在拡散モデルを用いて標準T1wおよびFLAIR画像からPSRマップを合成するDEMISTを提案する。
提案手法は,まずPSRと解剖学的画像のための分離オートエンコーダを訓練し,一致した潜在表現を学習する。
第2に,凍結拡散基盤のバックボーン上に,この潜伏空間における条件拡散モデルを訓練する。
条件を次のように分離する。
(i)クロスアテンションによるtextbf{semantic}トークン
(ii)3D ControlNetブランチによる大規模残留ヒントあたりのtextbf{spatial}
(iii) <textbf{adaptive} LoRA-modulated attention
トレーニング可能なパラメータの数を低く保ち,事前訓練したモデルの帰納バイアスを保ちながら,病変境界とアライメント損失の量的整合性を維持するためのエッジ・アウェア・ロス項を含む。
99名の被験者から5倍のクロスバリデーションを用いて163回のスキャンを行った。
提案手法は, VAE, GAN, 拡散基線を複数の指標で比較し, よりシャープな境界と地上の真実との定量的な整合性を向上する。
私たちのコードはhttps://github.com/MedICL-VU/MS-Synthesis-3DcLDMで公開されています。
関連論文リスト
- T3: Test-Time Model Merging in VLMs for Zero-Shot Medical Imaging Analysis [15.624549727053475]
既存のモデルマージ技術は、様々な医学的手段で一貫した利益をもたらすことができません。
サンプル単位の係数を計算するバックプロパゲーションフリーフレームワークであるTest-Time Task Adaptive merging (T3)を導入する。
ドメイン内、ベース・ツー・ノーベル、および4つのモダリティにまたがる汚職にまたがる厳密な相互評価プロトコルを提案する。
論文 参考訳(メタデータ) (2025-10-31T08:05:40Z) - Score Distillation of Flow Matching Models [67.86066177182046]
我々は、Score Identity Distillation (SiD) を事前訓練されたテキスト対画像フローマッチングモデルに拡張する。
SiDは、データフリーとデータアシストの両方の設定で、これらのモデルですぐに使える。
これは、スコア蒸留がテキストと画像のフローマッチングモデルに広く適用されるという最初の体系的な証拠を提供する。
論文 参考訳(メタデータ) (2025-09-29T17:45:48Z) - Guiding Registration with Emergent Similarity from Pre-Trained Diffusion Models [16.2208278847136]
自然のRGB画像を生成するために専用に訓練されたオフザシェルフ拡散モデルは、医用画像における意味論的意味のある対応を識別できる。
本稿では,拡散モデルの特徴を類似度尺度として活用して,変形可能な画像登録ネットワークを導くことを提案する。
論文 参考訳(メタデータ) (2025-06-03T04:07:04Z) - Towards Unified and Lossless Latent Space for 3D Molecular Latent Diffusion Modeling [90.23688195918432]
3次元分子生成は、薬物発見と物質科学に不可欠である。
既存のアプローチは、典型的には不変かつ同変なモジュラリティに対して別々のラテント空間を保持する。
我々は,3次元分子を潜在空間から潜在配列に圧縮するマルチモーダルVAEである textbfUAE-3D を提案する。
論文 参考訳(メタデータ) (2025-03-19T08:56:13Z) - Rectified Diffusion Guidance for Conditional Generation [94.83538269086613]
CFGの背後にある理論を再検討し、不適切な組合せ係数(textiti.e.)が生成分布を期待的にシフトさせることを厳密に確認する。
提案手法は, 強みを考慮すれば, textbftextitform ソリューションが有効であることを示す。
実世界のデータに関する実証的な証拠は、我々の設計と既存の最先端拡散モデルとの整合性を実証している。
論文 参考訳(メタデータ) (2024-10-24T13:41:32Z) - Orthogonal Matrix Retrieval with Spatial Consensus for 3D Unknown-View
Tomography [58.60249163402822]
未知視トモグラフィ(UVT)は、未知のランダムな向きで2次元投影から3次元密度マップを再構成する。
提案したOMRはより堅牢で、従来の最先端のOMRアプローチよりも大幅に性能が向上している。
論文 参考訳(メタデータ) (2022-07-06T21:40:59Z) - Self-supervised 3D anatomy segmentation using self-distilled masked
image transformer (SMIT) [2.7298989068857487]
自己教師型学習は、畳み込みネットワークを用いた医用画像のセグメンテーションに成功している。
我々は、我々のアプローチがより正確で、他のプリテキストタスクよりも微調整データセットを少なくする必要があることを示した。
論文 参考訳(メタデータ) (2022-05-20T17:55:14Z) - Using the Order of Tomographic Slices as a Prior for Neural Networks
Pre-Training [1.1470070927586016]
ボリュームの代わりにスライス上でSortingLossを事前学習する手法を提案する。
ボリュームではなくスライスで事前トレーニングを行うので、スライスのスパースセットでモデルを微調整することができる。
提案手法はSimCLRと同等に動作し、2倍高速に動作し、1.5倍少ないメモリを必要とすることを示す。
論文 参考訳(メタデータ) (2022-03-17T14:58:15Z) - Non-line-of-Sight Imaging via Neural Transient Fields [52.91826472034646]
NLOS(non-Line-of-Sight)イメージングのためのニューラルモデリングフレームワークを提案する。
最近のNeRF(Neural Radiance Field)アプローチにインスパイアされた我々は、ニューラルネットワーク(NeTF)を表現するために多層パーセプトロン(MLP)を使用する。
共焦点と非共焦点の両方に適用可能な球状ボリュームnetf再構成パイプラインを定式化する。
論文 参考訳(メタデータ) (2021-01-02T05:20:54Z) - Manifold-Aware CycleGAN for High-Resolution Structural-to-DTI Synthesis [8.829738147738222]
本稿では,T1w画像から高分解能DTIの生成を学習する多様体対応CycleGANを提案する。
提案手法は,拡散測定値の計算やファイバトラクトグラフィーアルゴリズムの実行に使用可能な,現実的な高分解能DTIを生成することができる。
論文 参考訳(メタデータ) (2020-04-01T00:08:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。