論文の概要: LiFT: Lifted Inter-slice Feature Trajectories for 3D Image Generation from 2D Generators
- arxiv url: http://arxiv.org/abs/2605.19060v1
- Date: Mon, 18 May 2026 19:30:19 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-20 15:03:08.961787
- Title: LiFT: Lifted Inter-slice Feature Trajectories for 3D Image Generation from 2D Generators
- Title(参考訳): LiFT:2次元発電機からの3次元画像生成のためのリフティング・インタースライス機能軌跡
- Authors: Xinhe Zhang, Yuyang Zhang, Pengfei Jin, Arnau Marin-Llobet, Na Li, Quanzheng Li,
- Abstract要約: LiFTは、3次元ボリューム合成をスライス毎の画像生成とスライス間軌道学習に分解する、リフテッド・インタースライス・フィーチャー・トラジェクトリのフレームワークである。
我々は BraTS 2023 (unconditional and missing-modality MR) と SynthRAD 2023 (MR-to-CT) の LiFT の評価を行った。
- 参考スコア(独自算出の注目度): 15.815426921881382
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: High-resolution 3D medical image generation remains challenging because fully volumetric models are computationally expensive, while efficient 2D slice generators often fail to preserve anatomical consistency across the third dimension. We propose LiFT, a framework for Lifted inter-slice Feature Trajectories that factorizes 3D volume synthesis into per-slice image generation and inter-slice trajectory learning. Rather than modeling the volumetric distribution end-to-end, LiFT treats a volume as an ordered trajectory in feature space, capturing how anatomical structures appear, transform, and disappear across depth. A tri-planar drifting loss aligns the trajectory of generated slices with the trajectories of real volumes, enabling distributional learning over inter-slice progressions in unconditional generation; in paired translation, a bidirectional $z$-context mixer trained against the registered target supplies through-plane coherence while preserving per-slice fidelity. We evaluate LiFT on BraTS 2023 (unconditional and missing-modality MR) and SynthRAD2023 (MR-to-CT). Across these settings, LiFT preserves per-slice quality, approaches the reported cWDM missing-MR reconstruction quality at $\sim$$135\times$ lower inference cost (without formal equivalence testing), and improves through-plane coherence on MR-to-CT relative to a no-mapper ablation, demonstrating that lightweight inter-slice trajectory learning is a viable route to high-resolution 3D medical synthesis.
- Abstract(参考訳): 完全体積モデルが計算に高価であるのに対して、効率的な2次元スライスジェネレータは3次元にわたる解剖学的一貫性を維持するのに失敗することが多いため、高解像度の3D医療画像生成は依然として困難である。
本稿では,Lfted Inter-Slice Feature Trajectories のためのフレームワーク LiFT を提案する。
体積分布をエンドツーエンドにモデル化する代わりに、LiFTは体積を特徴空間における順序付けられた軌道として扱い、解剖学的構造がどのように出現し、変形し、深さにわたって消えていくかを捉えている。
三平面ドリフト損失は、生成されたスライスの軌跡と実ボリュームの軌跡とを一致させ、非条件生成におけるスライス間進行の分布学習を可能にする。
我々は BraTS 2023 (unconditional and missing-modality MR) と SynthRAD 2023 (MR-to-CT) でLiFTを評価した。
これらの設定全体にわたって、LiFTはスライス毎の品質を維持し、報告されたcWDMの欠落したMR再構成品質を$$135\times$低い推論コスト(正式な等価性テストなしで)にアプローチし、非マッパーアブレーションに対するMR-to-CTの面内コヒーレンスを改善し、軽量なスライス間軌道学習が高解像度の3D医療合成への有効な経路であることを実証した。
関連論文リスト
- RegFormer++: An Efficient Large-Scale 3D LiDAR Point Registration Network with Projection-Aware 2D Transformer [71.59462491691819]
本稿では,大規模クラウドアライメントを実現するために,RegFormer++と呼ばれる新しいエンド・ツー・エンド差動トランスフォーマネットワークを提案する。
元の3D座標を2次元投影位置に充填するため、設計したトランスフォーマーは2次元処理における高効率と3次元幾何情報からの精度の両面から恩恵を受けることができる。
KITTI、NuScenes、Argoverseのデータセットを用いた実験により、我々のモデルは精度と効率の両面で最先端のパフォーマンスを達成することが示された。
論文 参考訳(メタデータ) (2026-03-15T09:03:10Z) - Preoperative-to-intraoperative Liver Registration for Laparoscopic Surgery via Latent-Grounded Correspondence Constraints [51.7011449975586]
Land-Regは変形可能な登録フレームワークで、潜伏した2D-3Dのランドマーク対応を学習する。
厳格な登録のために、Land-Regはクロスモーダルラテントアライメントモジュールを採用している。
類似性マッチングを持つ不確実なオーバーラップランドマーク検出器を提案し, 明確な2D-3Dランドマーク対応を強く推定する。
論文 参考訳(メタデータ) (2026-03-02T10:44:03Z) - ERGO: Excess-Risk-Guided Optimization for High-Fidelity Monocular 3D Gaussian Splatting [63.138778159026934]
本稿では,ERGOと呼ばれる過度のリスク分解によって導かれる適応最適化フレームワークを提案する。
ERGOはビュー固有の過剰リスクを動的に推定し、最適化中の損失重みを適応的に調整する。
Google Scanned ObjectsデータセットとOmniObject3Dデータセットの実験は、既存の最先端メソッドよりもERGOの方が優れていることを示している。
論文 参考訳(メタデータ) (2026-02-10T20:44:43Z) - Multimodal Visual Surrogate Compression for Alzheimer's Disease Classification [69.87877580725768]
MVSC(Multimodal Visual Surrogate Compression)は、大規模な3D sMRIボリュームをコンパクトな2D機能に圧縮し、適応させることを学ぶ。
MVSCには2つの重要なコンポーネントがある: テキストガイダンスの下でグローバルなクロススライスコンテキストをキャプチャするボリュームコンテキストと、テキストエンハンスでパッチワイズな方法でスライスレベルの情報を集約するAdaptive Slice Fusionモジュール。
論文 参考訳(メタデータ) (2026-01-29T13:05:46Z) - Fast Multi-Stack Slice-to-Volume Reconstruction via Multi-Scale Unrolled Optimization [6.712738779940082]
本稿では,複数の2次元スライススタックを融合してコヒーレントな3次元構造を復元する高速畳み込みフレームワークを提案する。
胎児脳MRIを用いて, 高品質な3Dボリュームを10秒未満で再構成し, 1sスライス登録と精度を最先端の反復SVRパイプラインと比較した。
論文 参考訳(メタデータ) (2026-01-12T13:18:49Z) - TRACE: Temporally Reliable Anatomically-Conditioned 3D CT Generation with Enhanced Efficiency [40.82927972746919]
TRACEは、時間的アライメントを備えた3D医療画像を生成するフレームワークである。
重なり合うフレームフレームは、対をフレキシブルな長さシーケンスに分割し、時間的および解剖学的に整列された3Dボリュームに再構成する。
論文 参考訳(メタデータ) (2025-07-01T14:35:39Z) - Two-and-a-half Order Score-based Model for Solving 3D Ill-posed Inverse
Problems [7.074380879971194]
本稿では,3次元ボリューム再構成のための2次半順序スコアベースモデル(TOSM)を提案する。
トレーニング期間中、TOSMは2次元空間のデータ分布を学習し、トレーニングの複雑さを低減する。
再構成フェーズでは、TOSMは3方向の相補的なスコアを利用して、3次元空間のデータ分布を更新する。
論文 参考訳(メタデータ) (2023-08-16T17:07:40Z) - JOTR: 3D Joint Contrastive Learning with Transformers for Occluded Human
Mesh Recovery [84.67823511418334]
本稿では,3次元メッシュ復元のためのTRansformersフレームワークを用いた3次元ジョイントコントラスト学習について述べる。
提案手法は,2D$&$3D対応結果を得るために,2Dおよび3D表現を融合するエンコーダ・デコーダ変換器アーキテクチャを含む。
論文 参考訳(メタデータ) (2023-07-31T02:58:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。