論文の概要: PPDM: Pixel Puzzling Diffusion Model for Speed and Memory Efficient Volumetric Medical Image Translation
- arxiv url: http://arxiv.org/abs/2606.15323v1
- Date: Sat, 13 Jun 2026 14:32:03 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-16 16:21:33.354195
- Title: PPDM: Pixel Puzzling Diffusion Model for Speed and Memory Efficient Volumetric Medical Image Translation
- Title(参考訳): PPDM: 高速・記憶能医用画像翻訳のための画素パズリング拡散モデル
- Authors: Tianqi Chen, Jun Hou, Yinchi Zhou, James S. Duncan, Chi Liu, Bo Zhou,
- Abstract要約: Pixel Puzzling Diffusion Model (PPDM)は、メモリと高速な3D画像変換のためのフレームワークである。
PPDMは,低位PET陰影化,関節性PET陰影化,減衰補正を含む,複数の難易度な3次元画像翻訳タスクに対して評価を行った。
- 参考スコア(独自算出の注目度): 16.556040700298027
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Diffusion models have demonstrated superior fidelity for medical image-to-image translation, but their extension to high-resolution 3D volumes is severely constrained by prohibitive computational cost and GPU memory requirements. Existing memory-efficient strategies often compromise global volumetric consistency or fine anatomical detail. In this work, we propose the Pixel Puzzling Diffusion Model (PPDM), a simple and effective framework for memory- and speed-efficient 3D medical image translation. PPDM introduces a reversible pixel puzzle-unpuzzle operator that trades spatial resolution for channel dimensionality, substantially reducing activation memory while preserving global context. To further improve efficiency and stability, we adopt a direct bridge diffusion formulation that starts from the conditional input rather than pure noise, enabling the model to focus on task-relevant residuals. In addition, a puzzle-gradient loss is incorporated to enforce spatial coherence and suppress grid-like artifacts introduced by spatial rearrangement. We evaluate PPDM on multiple challenging 3D medical image translation tasks, including low-count PET denoising, joint PET denoising and attenuation correction, and cross-modal MRI translation. Across all tasks, PPDM consistently matches or outperforms full 3D diffusion models while reducing training GPU memory usage by up to an order of magnitude and significantly accelerating inference, and it outperforms existing memory-efficient diffusion approaches based on latent compression or frequency decomposition. These results demonstrate that PPDM provides a practical and scalable solution for high-fidelity 3D diffusion-based medical image translation under limited computational resources.
- Abstract(参考訳): 拡散モデルは、医用画像から画像への変換において優れた忠実性を示しているが、高解像度の3Dボリュームへの拡張は、計算コストとGPUメモリの要求によって厳しく制約されている。
既存のメモリ効率の戦略は、大域的なボリューム一貫性や微妙な解剖学的詳細を損なうことが多い。
本研究では,メモリと高速な3次元医用画像変換のための簡易かつ効果的なフレームワークであるPixel Puzzling Diffusion Model (PPDM)を提案する。
PPDMは,空間分解能をチャネル次元と交換し,グローバルなコンテキストを保ちながらアクティベーションメモリを大幅に削減する,可逆的画素パズルアンプズル演算子を導入している。
効率と安定性をさらに向上するために、純粋雑音ではなく条件入力から始まる直接橋梁拡散式を採用し、タスク関連残差に焦点を絞ることができる。
さらに、空間コヒーレンスを強制し、空間再構成によって導入された格子状アーティファクトを抑えるために、パズルの段階的な損失が組み込まれている。
PPDMは,低位PET陰影化,関節性PET陰影化,減衰補正,MRI横断翻訳など,複数の難易度な3次元画像翻訳タスクに対して評価を行った。
すべてのタスクにおいて、PPDMは、トレーニングGPUメモリ使用量を最大で桁違いに削減し、推論を著しく加速しながら、完全な3D拡散モデルに一貫して適合または性能を向上し、潜在圧縮や周波数分解に基づく既存のメモリ効率の拡散アプローチよりも優れています。
これらの結果から,PPDMは,限られた計算資源下での高忠実度3次元拡散型医用画像翻訳のための実用的でスケーラブルなソリューションであることが示された。
関連論文リスト
- Structure-Adaptive Sparse Diffusion in Voxel Space for 3D Medical Image Enhancement [10.028882244604809]
3次元3D画像強調は,CT,PET,MRIの診断において重要である。
そこで本研究では,一様サブサンプリングタイムステップのコンパクトなセット上で,サンプルをトレーニングし,サンプルをサンプル化する,スパースボクセル空間拡散フレームワークを提案する。
我々のフレームワークは、圧縮を損なわずに微細な解剖学的詳細を保存しつつ、最大10倍のトレーニングアクセラレーションを実現している。
論文 参考訳(メタデータ) (2026-04-20T03:52:49Z) - PGP-DiffSR: Phase-Guided Progressive Pruning for Efficient Diffusion-based Image Super-Resolution [95.61422489193113]
拡散モデルから冗長情報を除去する軽量拡散法 PGP-DiffSR を開発した。
本手法は,計算負荷とメモリ消費を大幅に削減しつつ,競合する復元品質を実現する。
論文 参考訳(メタデータ) (2025-12-02T12:06:39Z) - DiP: Taming Diffusion Models in Pixel Space [91.51011771517683]
Diffusion Transformer (DiT) バックボーンは、効率的なグローバル構造構築のために大きなパッチで動作する。
共同トレーニングされた軽量パッチディーラーヘッドは、コンテキスト機能を活用して、きめ細かいローカル詳細を復元する。
論文 参考訳(メタデータ) (2025-11-24T06:55:49Z) - Accelerating 3D Photoacoustic Computed Tomography with End-to-End Physics-Aware Neural Operators [74.65171736966131]
光音響計算トモグラフィ(PACT)は、光コントラストと超音波分解能を組み合わせることで、光拡散限界を超える深部像を実現する。
現在の実装では、高密度トランスデューサアレイと長い取得時間を必要とし、臨床翻訳を制限している。
本研究では,センサ計測からボリューム再構成まで,逆音響マッピングを直接学習する物理認識モデルであるPanoを紹介する。
論文 参考訳(メタデータ) (2025-09-11T23:12:55Z) - StoDIP: Efficient 3D MRF image reconstruction with deep image priors and stochastic iterations [3.4453266252081645]
StoDIPは, 3次元MRFイメージングに基いて, 地上構造のないDeep Image Prior (DIP) 再構成を拡張した新しいアルゴリズムである。
健康なボランティアの脳全体をスキャンしたデータセットで、StoDIPは、質的にも質的にも、地道な再建ベースラインよりも優れたパフォーマンスを示した。
論文 参考訳(メタデータ) (2024-08-05T10:32:06Z) - Blaze3DM: Marry Triplane Representation with Diffusion for 3D Medical Inverse Problem Solving [8.544098279063597]
本稿では,コンパクトな三面体ニューラルフィールドと強力な拡散モデルを統合することにより,高速かつ高忠実な生成を可能にする新しいアプローチBlaze3DMを提案する。
技術的には、Blaze3DMは、データ依存の3次元平面埋め込みと共有デコーダを同時に最適化し、各3次元平面を対応する3次元ボリュームに再構成することから始まる。
スパースビューCT、リミテッドアングルCT、圧縮センシングMRI、MRI等方的超解像を含むゼロショット3次元医療逆問題解決実験は、Blaze3DMが最先端性能を達成するだけでなく、計算効率も著しく向上することを示した。
論文 参考訳(メタデータ) (2024-05-24T06:07:27Z) - Hierarchical Integration Diffusion Model for Realistic Image Deblurring [71.76410266003917]
拡散モデル (DM) は画像劣化に導入され, 有望な性能を示した。
本稿では,階層型統合拡散モデル(HI-Diff)を提案する。
人工的および実世界のぼかしデータセットの実験は、HI-Diffが最先端の手法より優れていることを示した。
論文 参考訳(メタデータ) (2023-05-22T12:18:20Z) - Memory-Efficient 3D Denoising Diffusion Models for Medical Image Processing [0.9424565541639366]
本稿では,3次元拡散モデルにおける資源消費の削減法について述べる。
本論文の主な貢献は,メモリ効率のパッチベース拡散モデルである。
提案した拡散モデルは,任意の画像生成タスクに適用できるが,BraTS 2020データセットの腫瘍セグメンテーションタスクについて評価する。
論文 参考訳(メタデータ) (2023-03-27T15:10:19Z) - Dimensionality-Varying Diffusion Process [52.52681373641533]
拡散モデルは、信号破壊プロセスを逆転して新しいデータを生成することを学習する。
信号分解による前方拡散過程の理論的一般化を行う。
FFHQで訓練された拡散モデルのFIDを,52.40から10.46までの1024Times1024$解像度で改善する。
論文 参考訳(メタデータ) (2022-11-29T09:05:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。