論文の概要: Structure-Adaptive Sparse Diffusion in Voxel Space for 3D Medical Image Enhancement
- arxiv url: http://arxiv.org/abs/2604.17773v1
- Date: Mon, 20 Apr 2026 03:52:49 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-21 21:52:52.683039
- Title: Structure-Adaptive Sparse Diffusion in Voxel Space for 3D Medical Image Enhancement
- Title(参考訳): 3次元医用画像強調のためのボクセル空間における構造適応スパース拡散
- Authors: Hongxu Jiang, Fei Li, Boxiao Yu, Ying Zhang, Kaleb Smith, Kuang Gong, Wei Shao,
- Abstract要約: 3次元3D画像強調は,CT,PET,MRIの診断において重要である。
そこで本研究では,一様サブサンプリングタイムステップのコンパクトなセット上で,サンプルをトレーニングし,サンプルをサンプル化する,スパースボクセル空間拡散フレームワークを提案する。
我々のフレームワークは、圧縮を損なわずに微細な解剖学的詳細を保存しつつ、最大10倍のトレーニングアクセラレーションを実現している。
- 参考スコア(独自算出の注目度): 10.028882244604809
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Three-dimensional (3D) medical image enhancement, including denoising and super-resolution, is critical for clinical diagnosis in CT, PET, and MRI. Although diffusion models have shown remarkable success in 2D medical imaging, scaling them to high-resolution 3D volumes remains computationally prohibitive due to lengthy diffusion trajectories over high-dimensional volumetric data. We observe that in conditional enhancement, strong anatomical priors in the degraded input render dense noise schedules largely redundant. Leveraging this insight, we propose a sparse voxel-space diffusion framework that trains and samples on a compact set of uniformly subsampled timesteps. The network predicts clean data directly on the data manifold, supervised in velocity space for stable gradient scaling. A lightweight Structure-aware Trajectory Modulation (STM) module recalibrates time embeddings at each network block based on local anatomical content, enabling structure-adaptive denoising over the shared sparse schedule. Operating directly in voxel space, our framework preserves fine anatomical detail without lossy compression while achieving up to $10\times$ training acceleration. Experiments on four datasets spanning CT, PET, and MRI demonstrate state-of-the-art performance on both denoising and super-resolution tasks. Our code is publicly available at: https://github.com/mirthAI/sparse-3d-diffusion.
- Abstract(参考訳): 3次元3D画像強調は,CT,PET,MRIの診断において重要である。
拡散モデルは2次元の医用画像で顕著に成功したが、高次元の体積データよりも長い拡散軌跡のため、高解像度の3次元ボリュームにスケールすることは計算的に禁じられている。
条件付き拡張では、劣化した入力における強い解剖学的先行が高密度ノイズスケジュールをほとんど冗長にする。
この知見を生かして、一様にサンプリングされたタイムステップのコンパクトなセット上で、サンプルを訓練するスパースボクセル空間拡散フレームワークを提案する。
ネットワークはデータ多様体上で直接クリーンなデータを予測し、安定した勾配スケーリングのために速度空間で教師される。
軽量なStructure-Aware Trajectory Modulation (STM)モジュールは、局所的な解剖学的内容に基づいて各ネットワークブロックに時間埋め込みを調整し、共有されたスパーススケジュールを構造適応的記述を可能にする。
我々のフレームワークは、ボクセル空間で直接動作し、損失のある圧縮を伴わずに微細な解剖学的詳細を保存し、最大10\times$トレーニングアクセラレーションを達成します。
CT、PET、MRIにまたがる4つのデータセットの実験は、偏執的タスクと超解像的タスクの両方で最先端のパフォーマンスを示す。
私たちのコードは、https://github.com/mirthAI/sparse-3d-diffusion.comで公開されています。
関連論文リスト
- MedPruner: Training-Free Hierarchical Token Pruning for Efficient 3D Medical Image Understanding in Vision-Language Models [59.180043227905294]
MedPrunerは、3次元医用画像の効率的な理解のためのトレーニング不要でモデルに依存しない階層的トークンプレーニングフレームワークである。
我々は、MedPrunerによって、MedGemmaのようなモデルが元の性能を維持したり、超えたりすることが可能であり、ビジュアルトークンの5%以下を維持していることを示す。
論文 参考訳(メタデータ) (2026-03-12T07:37:00Z) - Improving 2D Diffusion Models for 3D Medical Imaging with Inter-Slice Consistent Stochasticity [47.52394044948656]
ICS(Inter-Slice Consistentity)は、拡散サンプリング中のインタースライス一貫性を促進する戦略である。
ISCSは、追加の計算コストなしで、任意の2Dトレーニングされた拡散ベースの3D再構成パイプラインにドロップすることができる。
論文 参考訳(メタデータ) (2026-02-04T02:54:08Z) - SUFFICIENT: A scan-specific unsupervised deep learning framework for high-resolution 3D isotropic fetal brain MRI reconstruction [7.268308489093152]
等方性HR容積再構成のための教師なし反復SVR-SRRフレームワークを提案する。
高分解能(HR)ボリュームを生成するために、ディープイメージ事前フレームワーク内に埋め込まれたデコードネットワークを包括的画像劣化モデルに組み込む。
大規模動乱シミュレーションデータと臨床データを用いて行った実験は,提案手法の優れた性能を示す。
論文 参考訳(メタデータ) (2025-05-23T04:53:59Z) - Introducing 3D Representation for Medical Image Volume-to-Volume Translation via Score Fusion [3.3559609260669303]
Score-Fusionは、垂直に訓練された2次元拡散モデルをスコア関数空間に組み込むことで、3次元表現を効果的に学習する新しいボリューム変換モデルである。
Score-Fusionは,3次元医用画像の高分解能・モダリティ変換において,高い精度と容積忠実性が得られることを示す。
論文 参考訳(メタデータ) (2025-01-13T15:54:21Z) - StableDreamer: Taming Noisy Score Distillation Sampling for Text-to-3D [88.66678730537777]
本稿では3つの進歩を取り入れた方法論であるStableDreamerを紹介する。
まず、SDS生成前の等価性と、簡単な教師付きL2再構成損失を定式化する。
第2に,画像空間拡散は幾何学的精度に寄与するが,色調の鮮明化には潜時空間拡散が不可欠であることを示す。
論文 参考訳(メタデータ) (2023-12-02T02:27:58Z) - DEFN: Dual-Encoder Fourier Group Harmonics Network for Three-Dimensional Indistinct-Boundary Object Segmentation [6.0920148653974255]
本稿では,学習コーパス内の不明瞭な境界オブジェクトの表現多様性を高めるために,欠陥注入(SDi)を導入する。
そこで我々はDEFN(Dual-Encoder Fourier Group Harmonics Network)を提案する。
論文 参考訳(メタデータ) (2023-11-01T12:33:04Z) - 4D Spatio-Temporal Convolutional Networks for Object Position Estimation
in OCT Volumes [69.62333053044712]
3次元畳み込みニューラルネットワーク(CNN)は、単一のOCT画像を用いたマーカーオブジェクトのポーズ推定に有望な性能を示した。
我々は3次元CNNを4次元時間CNNに拡張し、マーカーオブジェクト追跡のための追加の時間情報の影響を評価する。
論文 参考訳(メタデータ) (2020-07-02T12:02:20Z) - Multifold Acceleration of Diffusion MRI via Slice-Interleaved Diffusion
Encoding (SIDE) [50.65891535040752]
本稿では,Slice-Interleaved Diffusionと呼ばれる拡散符号化方式を提案する。
SIDEは、拡散重み付き(DW)画像ボリュームを異なる拡散勾配で符号化したスライスでインターリーブする。
また,高いスライスアンサンプデータからDW画像を効果的に再構成するためのディープラーニングに基づく手法を提案する。
論文 参考訳(メタデータ) (2020-02-25T14:48:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。