論文の概要: Latent Interpolation Learning Using Diffusion Models for Cardiac Volume Reconstruction
- arxiv url: http://arxiv.org/abs/2508.13826v1
- Date: Tue, 19 Aug 2025 13:36:16 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-20 15:36:31.938023
- Title: Latent Interpolation Learning Using Diffusion Models for Cardiac Volume Reconstruction
- Title(参考訳): 拡散モデルを用いた心容積再構成のための潜時補間学習
- Authors: Niklas Bubeck, Suprosanna Shit, Chen Chen, Can Zhao, Pengfei Guo, Dong Yang, Georg Zitzlsberger, Daguang Xu, Bernhard Kainz, Daniel Rueckert, Jiazhen Pan,
- Abstract要約: 心臓共鳴画像(CMR)は心血管疾患の診断・管理に重要なツールである。
その効用は、しばしば2D短軸スライスをスパースに取得することで制限され、不完全なボリューム情報をもたらす。
既存の手法では、事前定義されたスキームへの依存、計算の非効率性、追加入力への依存など、課題に直面している。
- 参考スコア(独自算出の注目度): 26.7771170972558
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Cardiac Magnetic Resonance (CMR) imaging is a critical tool for diagnosing and managing cardiovascular disease, yet its utility is often limited by the sparse acquisition of 2D short-axis slices, resulting in incomplete volumetric information. Accurate 3D reconstruction from these sparse slices is essential for comprehensive cardiac assessment, but existing methods face challenges, including reliance on predefined interpolation schemes (e.g., linear or spherical), computational inefficiency, and dependence on additional semantic inputs such as segmentation labels or motion data. To address these limitations, we propose a novel \textbf{Ca}rdiac \textbf{L}atent \textbf{I}nterpolation \textbf{D}iffusion (CaLID) framework that introduces three key innovations. First, we present a data-driven interpolation scheme based on diffusion models, which can capture complex, non-linear relationships between sparse slices and improves reconstruction accuracy. Second, we design a computationally efficient method that operates in the latent space and speeds up 3D whole-heart upsampling time by a factor of 24, reducing computational overhead compared to previous methods. Third, with only sparse 2D CMR images as input, our method achieves SOTA performance against baseline methods, eliminating the need for auxiliary input such as morphological guidance, thus simplifying workflows. We further extend our method to 2D+T data, enabling the effective modeling of spatiotemporal dynamics and ensuring temporal coherence. Extensive volumetric evaluations and downstream segmentation tasks demonstrate that CaLID achieves superior reconstruction quality and efficiency. By addressing the fundamental limitations of existing approaches, our framework advances the state of the art for spatio and spatiotemporal whole-heart reconstruction, offering a robust and clinically practical solution for cardiovascular imaging.
- Abstract(参考訳): 心臓磁気共鳴画像(CMR)は、心臓血管疾患の診断と管理に重要なツールであるが、2D短軸スライス(英語版)のスパース取得によってしばしば有用性が制限され、不完全な容積情報をもたらす。
これらのスパーススライスからの正確な3D再構成は、包括的な心臓評価には不可欠であるが、既存の手法では、あらかじめ定義された補間スキーム(例えば、線形または球面)への依存、計算の非効率性、セグメンテーションラベルやモーションデータなどの追加の意味入力への依存など、課題に直面している。
これらの制約に対処するために、三つの重要な革新をもたらす新しい \textbf{Ca}rdiac \textbf{L}atent \textbf{I}nterpolation \textbf{D}iffusion (CaLID) フレームワークを提案する。
まず,拡散モデルに基づくデータ駆動補間手法を提案する。
第二に,潜時空間で動作する計算効率のよい手法を設計し,従来の手法と比較して計算オーバーヘッドを減らし,24倍の時間で3次元全体のアップサンプリング時間を高速化する。
第3に,2次元CMR画像のみを入力として,本手法はベースライン法に対するSOTA性能を実現し,形態的ガイダンスなどの補助入力の必要性を排除し,ワークフローを簡素化する。
さらにこの手法を2D+Tデータに拡張し,時空間力学の効果的なモデリングと時間的コヒーレンスを確保する。
大規模なボリューム評価と下流セグメンテーションタスクは、CaLIDがより優れた再構築品質と効率を達成することを示す。
既存のアプローチの基本的限界に対処することにより,我々のフレームワークは,心血管画像に対する堅牢かつ臨床的に有効なソリューションとして,時空間の時空間的再建と時空間的再建の最先端を推し進める。
関連論文リスト
- TRACE: Temporally Reliable Anatomically-Conditioned 3D CT Generation with Enhanced Efficiency [40.82927972746919]
TRACEは、時間的アライメントを備えた3D医療画像を生成するフレームワークである。
重なり合うフレームフレームは、対をフレキシブルな長さシーケンスに分割し、時間的および解剖学的に整列された3Dボリュームに再構成する。
論文 参考訳(メタデータ) (2025-07-01T14:35:39Z) - Learning to Align and Refine: A Foundation-to-Diffusion Framework for Occlusion-Robust Two-Hand Reconstruction [50.952228546326516]
単眼画像からの両手再建は、複雑でダイナミックな手の位置が原因で、永続的な課題に直面している。
既存のアプローチはそのようなアライメントの問題に悩まされ、しばしば不整合と侵入の成果物をもたらす。
本稿では,視覚基礎モデルからの2次元事前ガイダンスを正確に整合させる2段階のファンデーション・ツー・ディフュージョンフレームワークを提案する。
論文 参考訳(メタデータ) (2025-03-22T14:42:27Z) - Motion-enhancement to Echocardiography Segmentation via Inserting a Temporal Attention Module: An Efficient, Adaptable, and Scalable Approach [4.923733944174007]
本稿では,時間的アテンションモジュールが複数回の特徴的相互作用を抽出する,新しい計算効率の代替手法を提案する。
このモジュールは、既存のCNNやTransformerベースのネットワークにシームレスに統合できる。
この結果から,TAMの堅牢性,スケーラビリティ,多種多様なデータセットとバックボーン間の一般化性が確認された。
論文 参考訳(メタデータ) (2025-01-24T21:35:24Z) - Re-Visible Dual-Domain Self-Supervised Deep Unfolding Network for MRI Reconstruction [48.30341580103962]
本稿では、これらの問題に対処するために、新しい再視覚的二重ドメイン自己教師型深層展開ネットワークを提案する。
エンド・ツー・エンドの再構築を実現するために,シャンブルとポック・プロキシ・ポイント・アルゴリズム(DUN-CP-PPA)に基づく深層展開ネットワークを設計する。
高速MRIおよびIXIデータセットを用いて行った実験により,本手法は再建性能において最先端の手法よりも有意に優れていることが示された。
論文 参考訳(メタデータ) (2025-01-07T12:29:32Z) - ALOcc: Adaptive Lifting-based 3D Semantic Occupancy and Cost Volume-based Flow Prediction [89.89610257714006]
既存の手法は、これらのタスクの要求に応えるために高い精度を優先する。
本稿では,3次元セマンティック占有率予測とフロー推定のための一連の改善点を紹介する。
私たちの純粋な時間的アーキテクチャフレームワークであるALOccは、速度と精度の最適なトレードオフを実現しています。
論文 参考訳(メタデータ) (2024-11-12T11:32:56Z) - Fully Differentiable Correlation-driven 2D/3D Registration for X-ray to CT Image Fusion [3.868072865207522]
画像ベース剛性2D/3Dレジストレーションは, 蛍光ガイド下外科手術において重要な技術である。
デュアルブランチCNN変換器エンコーダを用いた完全微分型相関型ネットワークを提案する。
組込み情報に基づく低周波特徴と高周波特徴の分解に対して相関型損失を提案する。
論文 参考訳(メタデータ) (2024-02-04T14:12:51Z) - Interpretable 2D Vision Models for 3D Medical Images [47.75089895500738]
本研究では,3次元画像処理における中間特徴表現を用いた2次元ネットワークの適応手法を提案する。
我々は、ベンチマークとして3D MedMNISTデータセットと、既存の手法に匹敵する数百の高分解能CTまたはMRIスキャンからなる2つの実世界のデータセットを示す。
論文 参考訳(メタデータ) (2023-07-13T08:27:09Z) - Real-time landmark detection for precise endoscopic submucosal
dissection via shape-aware relation network [51.44506007844284]
内視鏡下粘膜下郭清術における高精度かつリアルタイムなランドマーク検出のための形状認識型関係ネットワークを提案する。
まず,ランドマーク間の空間的関係に関する先行知識を直感的に表現する関係キーポイント・ヒートマップを自動生成するアルゴリズムを考案する。
次に、事前知識を学習プロセスに段階的に組み込むために、2つの補完的な正規化手法を開発する。
論文 参考訳(メタデータ) (2021-11-08T07:57:30Z) - Three-Dimensional Embedded Attentive RNN (3D-EAR) Segmentor for Left
Ventricle Delineation from Myocardial Velocity Mapping [1.8653386811342048]
MVM-CMRデータセットのための組み込みマルチチャネルアテンション機構とLSTMベースのリカレントニューラルネットワーク(RNN)を備えた3D-UNETバックボーンアーキテクチャを組み込んだ新しいフルオートマチックフレームワークを提案する。
3D-UNETのベースラインモデルと、組み込み型LSTMモジュールと各種損失関数の有無の比較により、提案モデルが最先端のベースラインモデルより大幅に改善されたことを実証できます。
論文 参考訳(メタデータ) (2021-04-26T11:04:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。