論文の概要: ADP-DiT: Text-Guided Diffusion Transformer for Brain Image Generation in Alzheimer's Disease Progression
- arxiv url: http://arxiv.org/abs/2604.13495v1
- Date: Wed, 15 Apr 2026 05:30:14 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-16 20:38:32.398311
- Title: ADP-DiT: Text-Guided Diffusion Transformer for Brain Image Generation in Alzheimer's Disease Progression
- Title(参考訳): ADP-DiT:アルツハイマー病進行における脳画像生成のためのテキストガイド拡散変換器
- Authors: Juneyong Lee, Geonwoo Baek, Ikbeom Jang,
- Abstract要約: ADP-DiTは経時的ADMRI合成のための臨床用テキストコンディショニングトランスフォーマである。
DiTは、多領域の人口統計、診断(CN/MCI/AD)、神経心理学情報を自然言語のプロンプトとして符号化する。
ADP-DiTは712人の被験者から3,321個の3T T1重み付きスキャンを行い、SSIM 0.8739とPSNR 29.32 dBを達成し、+0.1087 SSIMと+6.08 dB PSNRでDiTベースラインを改良した。
- 参考スコア(独自算出の注目度): 0.7773571879033719
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Alzheimer's disease (AD) progresses heterogeneously across individuals, motivating subject-specific synthesis of follow-up magnetic resonance imaging (MRI) to support progression assessment. While Diffusion Transformers (DiT), an emerging transformer-based diffusion model, offer a scalable backbone for image synthesis, longitudinal AD MRI generation with clinically interpretable control over follow-up time and participant metadata remains underexplored. We present ADP-DiT, an interval-aware, clinically text-conditioned diffusion transformer for longitudinal AD MRI synthesis. ADP-DiT encodes follow-up interval together with multi-domain demographic, diagnostic (CN/MCI/AD), and neuropsychological information as a natural-language prompt, enabling time-specific control beyond coarse diagnostic stages. To inject this conditioning effectively, we use dual text encoders-OpenCLIP for vision-language alignment and T5 for richer clinical-language understanding. Their embeddings are fused into DiT through cross-attention for fine-grained guidance and adaptive layer normalization for global modulation. We further enhance anatomical fidelity by applying rotary positional embeddings to image tokens and performing diffusion in a pre-trained SDXL-VAE latent space to enable efficient high-resolution reconstruction. On 3,321 longitudinal 3T T1-weighted scans from 712 participants (259,038 image slices), ADP-DiT achieves SSIM 0.8739 and PSNR 29.32 dB, improving over a DiT baseline by +0.1087 SSIM and +6.08 dB PSNR while capturing progression-related changes such as ventricular enlargement and shrinking hippocampus. These results suggest that integrating comprehensive, subject-specific clinical conditions with architectures can improve longitudinal AD MRI synthesis.
- Abstract(参考訳): アルツハイマー病(AD)は、進行性評価をサポートするために、MRI(追跡磁気共鳴画像)の被験者特異的な合成を動機として、個人間で不均一に進行する。
Diffusion Transformers (DiT) は画像合成のためのスケーラブルなバックボーンを提供するが, 後続時間に対する臨床解釈が可能なAD MRI生成と, メタデータの探索は未定である。
ADP-DiTは経時的ADMRI合成のための臨床用テキストコンディショニングトランスフォーマである。
ADP-DiTは、多領域の人口統計、診断(CN/MCI/AD)、神経心理学情報を自然言語のプロンプトとして符号化し、粗い診断段階を超えた時間特異的制御を可能にする。
この条件を効果的に注入するために、視覚言語アライメントにはデュアルテキストエンコーダ-OpenCLIP、よりリッチな臨床言語理解にはT5を用いる。
それらの埋め込みは、細粒度誘導のためのクロスアテンションと、グローバル変調のための適応層正規化により、DiTに融合する。
我々は、画像トークンに回転位置埋め込みを適用し、訓練済みSDXL-VAE潜伏空間での拡散を行い、効率的な高分解能再構成を可能にすることにより、解剖学的忠実度をさらに向上する。
712人の被験者(259,038枚の画像スライス)の3,321個の縦3T T1強調スキャンで、ADP-DiTはSSIM 0.8739とPSNR 29.32 dBを達成し、心室拡張や海馬収縮などの進行に伴う変化を捉えながら、DiTベースラインを+0.1087 SSIMと+6.08 dB PSNRで改善した。
以上の結果から, 総括的, 主観的臨床条件とアーキテクチャの統合は, 経時的AD MRI合成を改善することが示唆された。
関連論文リスト
- PHASOR: Anatomy- and Phase-Consistent Volumetric Diffusion for CT Virtual Contrast Enhancement [60.81732730684265]
本稿では,高忠実度仮想コントラスト拡張(VCE)のための体積拡散フレームワークPHASORを紹介する。
我々は、CTボリュームをコヒーレントシーケンスとして扱うことにより、ビデオ拡散モデルを利用して、構造的コヒーレンスとボリューム精度を向上させる。
まず, 解剖学的意味論に固有の拡張パターンを固定し, 臓器特異的なメモリを付加して, より詳細な情報を収集する。
第二に、インテンシティ・フェイズ・アウェアメント・アライメント・アライメント(IP-REPA)は、不完全な空間アライメントの影響を緩和しつつ、複雑なコントラスト信号を強調する。
論文 参考訳(メタデータ) (2026-04-01T15:57:18Z) - 3D-LLDM: Label-Guided 3D Latent Diffusion Model for Improving High-Resolution Synthetic MR Imaging in Hepatic Structure Segmentation [11.912761174094795]
3D-LLDMはラベル誘導3D潜在拡散モデルであり、対応する解剖学的セグメンテーションマスクを備えた高品質な合成磁気共鳴(MR)ボリュームを生成する。
Gd-EOBPA造影剤で造影した肝胆道相MR画像を用いて肝,門脈,肝静脈,肝胆道癌の構造マスクを抽出した。
データ拡張に使用すると、合成ボリュームは5つのCNNアーキテクチャで最大11.153%のDiceスコアで癌セグメンテーションを改善する。
論文 参考訳(メタデータ) (2026-03-25T02:03:10Z) - Anatomically Guided Latent Diffusion for Brain MRI Progression Modeling [10.62087466710015]
Anatomically Guided Latent Diffusion Model (AG-LDM)は、解剖学的に一貫した進行を強制するセグメンテーション誘導フレームワークである。
軽量な3D組織セグメンテーションモデル(WarpSeg)は、オートエンコーダの微調整と拡散モデルトレーニングの両方において、明確な解剖学的監督を提供する。
論文 参考訳(メタデータ) (2026-01-21T01:45:36Z) - Multi-modal MRI-Based Alzheimer's Disease Diagnosis with Transformer-based Image Synthesis and Transfer Learning [0.0]
アルツハイマー病(英語: Alzheimer's disease, AD)は、進行性神経変性疾患であり、臨床症状の発症より何年も前から病理学的変化が始まっている。
T1w MRIから直接FAおよびMDマップを予測する3DトランスUNet画像合成フレームワークを提案する。
私のモデルは高忠実度マップを生成し、構造類似度指数(SSIM)が0.93を超え、ピアーソン相関が強い(>0.94)。
論文 参考訳(メタデータ) (2026-01-09T22:26:38Z) - Dual-Encoder Transformer-Based Multimodal Learning for Ischemic Stroke Lesion Segmentation Using Diffusion MRI [5.332404648315838]
ISLES 2022データセットからのマルチモーダル拡散MRIを用いて虚血性脳梗塞の分節について検討した。
U-Net、Swin-UNet、TransUNetなど、最先端の畳み込みとトランスフォーマーベースのアーキテクチャがベンチマークされている。
その結果、トランスフォーマーベースのモデルは畳み込みベースラインよりも優れており、提案したデュアルエンコーダのTransUNetは、テストセットで85.4%のDiceスコアに達した。
論文 参考訳(メタデータ) (2025-12-23T15:24:31Z) - Synthesizing Late-Stage Contrast Enhancement in Breast MRI: A Comprehensive Pipeline Leveraging Temporal Contrast Enhancement Dynamics [0.3499870393443268]
本研究では,後期DCE-MRI画像の初期段階データから合成するためのパイプラインを提案する。
提案手法では, コントラストエージェントの時間的挙動を利用して生成モデルの訓練を指導する, 新たな損失関数である時間強度損失(TI-loss)を導入する。
アノテーション付き領域における拡張パターンを検証するContrast Agent Pattern Score(mathcalCP_s$)と、実際の拡張と生成された拡張の違いを測定するAverage difference in Enhancement(mathcalED$)の2つの指標が画像品質を評価するために提案されている。
論文 参考訳(メタデータ) (2024-09-03T04:31:49Z) - SDR-Former: A Siamese Dual-Resolution Transformer for Liver Lesion
Classification Using 3D Multi-Phase Imaging [59.78761085714715]
本研究は肝病変分類のための新しいSDR-Formerフレームワークを提案する。
提案フレームワークは2つの臨床データセットに関する総合的な実験を通じて検証された。
科学コミュニティを支援するため,肝病変解析のための多段階MRデータセットを公開しています。
論文 参考訳(メタデータ) (2024-02-27T06:32:56Z) - Brain Imaging-to-Graph Generation using Adversarial Hierarchical Diffusion Models for MCI Causality Analysis [44.45598796591008]
機能的磁気共鳴画像(fMRI)を軽度認知障害解析のための効果的な接続性にマッピングするために,脳画像から画像へのBIGG(Brain Imaging-to-graph generation)フレームワークを提案する。
発電機の階層変換器は、複数のスケールでノイズを推定するように設計されている。
ADNIデータセットの評価は,提案モデルの有効性と有効性を示す。
論文 参考訳(メタデータ) (2023-05-18T06:54:56Z) - Negligible effect of brain MRI data preprocessing for tumor segmentation [36.89606202543839]
我々は3つの公開データセットの実験を行い、ディープニューラルネットワークにおける異なる前処理ステップの効果を評価する。
その結果、最も一般的な標準化手順は、ネットワーク性能に何の価値も与えないことが示されている。
画像の規格化に伴う信号分散の低減のため,画像強度正規化手法はモデル精度に寄与しない。
論文 参考訳(メタデータ) (2022-04-11T17:29:36Z) - Lesion Mask-based Simultaneous Synthesis of Anatomic and MolecularMR
Images using a GAN [59.60954255038335]
提案するフレームワークは,ストレッチアウトアップサンプリングモジュール,ブレインアトラスエンコーダ,セグメンテーション一貫性モジュール,マルチスケールラベルワイド識別器から構成される。
実際の臨床データを用いた実験により,提案モデルが最先端の合成法よりも優れた性能を発揮することが示された。
論文 参考訳(メタデータ) (2020-06-26T02:50:09Z) - Multifold Acceleration of Diffusion MRI via Slice-Interleaved Diffusion
Encoding (SIDE) [50.65891535040752]
本稿では,Slice-Interleaved Diffusionと呼ばれる拡散符号化方式を提案する。
SIDEは、拡散重み付き(DW)画像ボリュームを異なる拡散勾配で符号化したスライスでインターリーブする。
また,高いスライスアンサンプデータからDW画像を効果的に再構成するためのディープラーニングに基づく手法を提案する。
論文 参考訳(メタデータ) (2020-02-25T14:48:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。