論文の概要: CardioDiT: Latent Diffusion Transformers for 4D Cardiac MRI Synthesis
- arxiv url: http://arxiv.org/abs/2603.25194v1
- Date: Thu, 26 Mar 2026 08:59:07 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-27 20:52:48.1999
- Title: CardioDiT: Latent Diffusion Transformers for 4D Cardiac MRI Synthesis
- Title(参考訳): CardioDiT:4次元心臓MRI合成のための潜時拡散変換器
- Authors: Marvin Seyfarth, Sarah Kaye Müller, Arman Ghanaat, Isabelle Ayx, Fabian Fastenrath, Philipp Wild, Alexander Hertel, Theano Papavassiliu, Salman Ul Hassan Dar, Sandy Engelhardt,
- Abstract要約: CardioDiTは、拡散トランスを用いた短軸シネCMR合成のための完全な4次元潜伏拡散フレームワークである。
時間的VQ-Eは2D+VAtスライスをコンパクトなラテントに符号化し、拡散変圧器は完全な3D+tボリュームとして一緒にモデル化する。
その結果,スライス間の整合性,時間的コヒーレントな運動,解剖学的文脈,心機能分布が改善した。
- 参考スコア(独自算出の注目度): 30.824485997130925
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Latent diffusion models (LDMs) have recently achieved strong performance in 3D medical image synthesis. However, modalities like cine cardiac MRI (CMR), representing a temporally synchronized 3D volume across the cardiac cycle, add an additional dimension that most generative approaches do not model directly. Instead, they factorize space and time or enforce temporal consistency through auxiliary mechanisms such as anatomical masks. Such strategies introduce structural biases that may limit global context integration and lead to subtle spatiotemporal discontinuities or physiologically inconsistent cardiac dynamics. We investigate whether a unified 4D generative model can learn continuous cardiac dynamics without architectural factorization. We propose CardioDiT, a fully 4D latent diffusion framework for short-axis cine CMR synthesis based on diffusion transformers. A spatiotemporal VQ-VAE encodes 2D+t slices into compact latents, which a diffusion transformer then models jointly as complete 3D+t volumes, coupling space and time throughout the generative process. We evaluate CardioDiT on public CMR datasets and a larger private cohort, comparing it to baselines with progressively stronger spatiotemporal coupling. Results show improved inter-slice consistency, temporally coherent motion, and realistic cardiac function distributions, suggesting that explicit 4D modeling with a diffusion transformer provides a principled foundation for spatiotemporal cardiac image synthesis. Code and models trained on public data are available at https://github.com/Cardio-AI/cardiodit.
- Abstract(参考訳): 潜時拡散モデル (LDM) は近年, 3次元医用画像合成において高い性能を達成している。
しかし、シン心MRI(CMR)のようなモダリティは、心臓循環全体にわたって時間的に同期された3Dボリュームを表し、ほとんどの生成的アプローチが直接モデル化しない追加の次元を付加する。
代わりに、時間と空間を分解するか、解剖学的なマスクのような補助的なメカニズムを通じて時間的一貫性を強制する。
このような戦略は、グローバルな文脈統合を制限する構造バイアスを導入し、微妙な時空間不連続性や生理学的に一貫性のない心臓力学をもたらす可能性がある。
本研究では,建築因子化を伴わずに連続心力学を学習できる4次元モデルについて検討する。
拡散トランスを用いた短軸シネCMR合成のための,完全4次元潜伏拡散フレームワークCardioDiTを提案する。
時空間VQ-VAEは2D+tスライスをコンパクトなラテントに符号化し、拡散変圧器は生成過程全体を通して完全な3D+tボリューム、結合空間、時間として結合的にモデル化する。
パブリックなCMRデータセットとより大きなプライベートコホートを用いてCardioDiTを評価し,徐々に高頻度な時空間結合によるベースラインと比較した。
以上の結果から,拡散変圧器を用いた明示的な4次元モデリングが時空間心画像合成の基礎となることが示唆された。
公開データでトレーニングされたコードとモデルはhttps://github.com/Cardio-AI/cardiodit.comで公開されている。
関連論文リスト
- Orthogonal Spatial-temporal Distributional Transfer for 4D Generation [58.30004328671699]
既存の3次元拡散モデルと時間的拡散モデルから豊かな空間的先行を転送し、4次元合成を強化するフレームワークを提案する。
空間・時間差4D(STD-4D)拡散モデルを構築し,空間・時間差による4D映像を合成する。
実験の結果,提案手法は従来の手法よりも優れ,空間的時間的整合性と高品質な4D合成を実現していることがわかった。
論文 参考訳(メタデータ) (2026-03-05T11:52:21Z) - Chain of Flow: A Foundational Generative Framework for ECG-to-4D Cardiac Digital Twins [4.615980870195537]
チェイン・オブ・フロー(Chain of Flow、COF)は、心電図によって駆動される、単一の心臓循環から完全な4次元心構造と運動を再構築する生成フレームワークである。
心電図から直接4D臓器を再構築することで、COFは心臓のデジタル双生児を完全に生成し、患者固有の仮想心臓に変える。
論文 参考訳(メタデータ) (2026-02-26T12:06:43Z) - 3D Cardiac Anatomy Generation Using Mesh Latent Diffusion Models [9.749160335898255]
心臓解剖学の3次元メッシュ生成における潜時拡散モデルの適用について検討した。
急性心筋梗塞患者の左室心筋解剖の3次元メッシュのデータセットに本モデルを適用した。
MeshLDMは、末期拡張期(緩和期)と末期収縮期(収縮期)の心臓形態の特徴をうまく捉え、ゴールド標準よりも2.4%の人口差を持つメッシュを生成する。
論文 参考訳(メタデータ) (2025-08-18T16:53:20Z) - Articulated Kinematics Distillation from Video Diffusion Models [64.18346374534352]
Articulated Kinematics Distillation (AKD)は、高忠実度キャラクターアニメーションを生成するためのフレームワークである。
AKDはスケルトンに基づく3Dアセットの表現を使用しており、自由度(DoF)を大幅に削減している。
AKDは構造的整合性を維持しながら複雑な関節運動を蒸留する。
論文 参考訳(メタデータ) (2025-04-01T21:37:57Z) - X$^{2}$-Gaussian: 4D Radiative Gaussian Splatting for Continuous-time Tomographic Reconstruction [64.2059940799033]
現在の方法では、時間分解能を呼吸ゲーティング装置で固定相に識別する。
新規なフレームワークであるX$2$-Gaussianは、動的放射スプラッティングと自己監督型呼吸運動学習を統合することで、連続的な4DCT再構成を可能にする。
論文 参考訳(メタデータ) (2025-03-27T17:59:57Z) - MedTet: An Online Motion Model for 4D Heart Reconstruction [59.74234226055964]
本研究は, 術後の軽度データから3次元心臓運動を再構築するための新しいアプローチを提案する。
既存の方法では、フル3次元の体積像から3次元の臓器のジオメトリーを正確に再構築することができる。
このような部分的データから3次元運動を再構築するための汎用的なフレームワークを提案する。
論文 参考訳(メタデータ) (2024-12-03T17:18:33Z) - A personalized time-resolved 3D mesh generative model for unveiling normal heart dynamics [6.6350578770951385]
心臓左室の形状と運動パターンの分布を学習するための条件付き生成モデルであるMeshHeartを開発した。
MeshHeartに基づいて、3D+t心筋メッシュ配列の潜時空間を調査し、そのパーソナライズされた規範パターンから実際の心臓の偏差を定量化する距離距離測度である潜時デルタを提案する。
論文 参考訳(メタデータ) (2024-09-20T18:08:37Z) - Epicardium Prompt-guided Real-time Cardiac Ultrasound Frame-to-volume Registration [50.602074919305636]
本稿では,CU-Reg と呼ばれる,軽量でエンドツーエンドなカード・ツー・エンド・超音波フレーム・ツー・ボリューム・レジストレーション・ネットワークを提案する。
2次元スパースと3次元濃密な特徴の相互作用を増強するために,心内膜急速ガイドによる解剖学的手がかりを用い,その後,強化された特徴のボクセル的局所グロバル集約を行った。
論文 参考訳(メタデータ) (2024-06-20T17:47:30Z) - DMCVR: Morphology-Guided Diffusion Model for 3D Cardiac Volume
Reconstruction [33.59945107137013]
現在の心臓MRIによる再建技術は、平面解像度が制限された2Dである。
本稿では,高解像度2次元画像とそれに対応する3次元再構成ボリュームを合成する3次元心容積再構成のための形態誘導拡散モデルDMCVRを提案する。
論文 参考訳(メタデータ) (2023-08-18T00:48:30Z) - DeepRecon: Joint 2D Cardiac Segmentation and 3D Volume Reconstruction
via A Structure-Specific Generative Method [12.26150675728958]
本稿では,複数の臨床的に不可欠な結果を生成する,エンドツーエンドの潜在空間ベースのフレームワークであるDeepReconを提案する。
本手法は,心構造に対する正確な意味情報を含むシネ画像の最適潜時表現を同定する。
特に,本モデルでは,正確な意味情報と心構造のセグメンテーションを併用して合成画像を生成する。
論文 参考訳(メタデータ) (2022-06-14T20:46:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。