論文の概要: Efficient Image-to-Image Schrödinger Bridge for CT Field of View Extension
- arxiv url: http://arxiv.org/abs/2508.11211v1
- Date: Fri, 15 Aug 2025 04:41:05 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-18 14:51:23.746316
- Title: Efficient Image-to-Image Schrödinger Bridge for CT Field of View Extension
- Title(参考訳): ビュー拡張のCTフィールドのための効率的な画像から画像へのシュレーディンガーブリッジ
- Authors: Zhenhao Li, Long Yang, Xiaojie Yin, Haijun Yu, Jiazhou Wang, Hongbin Han, Weigang Hu, Yixing Huang,
- Abstract要約: 画像から画像までのSchr"odinger Bridge (I$2$SB)拡散モデルに基づく効率的なCT FOV拡張フレームワークを提案する。
I$2$SBは、実データで49.8,HU、実データで152.0HUのルート平均二乗誤差(RMSE)値で優れた定量的性能を達成する。
1ステップの推論では、2Dスライスあたり0.19秒で再構築が可能で、cDDPM (135秒) よりも700倍のスピードアップを示し、拡散GAN (0.58秒) を超えている。
- 参考スコア(独自算出の注目度): 10.352797961760976
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Computed tomography (CT) is a cornerstone imaging modality for non-invasive, high-resolution visualization of internal anatomical structures. However, when the scanned object exceeds the scanner's field of view (FOV), projection data are truncated, resulting in incomplete reconstructions and pronounced artifacts near FOV boundaries. Conventional reconstruction algorithms struggle to recover accurate anatomy from such data, limiting clinical reliability. Deep learning approaches have been explored for FOV extension, with diffusion generative models representing the latest advances in image synthesis. Yet, conventional diffusion models are computationally demanding and slow at inference due to their iterative sampling process. To address these limitations, we propose an efficient CT FOV extension framework based on the image-to-image Schr\"odinger Bridge (I$^2$SB) diffusion model. Unlike traditional diffusion models that synthesize images from pure Gaussian noise, I$^2$SB learns a direct stochastic mapping between paired limited-FOV and extended-FOV images. This direct correspondence yields a more interpretable and traceable generative process, enhancing anatomical consistency and structural fidelity in reconstructions. I$^2$SB achieves superior quantitative performance, with root-mean-square error (RMSE) values of 49.8\,HU on simulated noisy data and 152.0HU on real data, outperforming state-of-the-art diffusion models such as conditional denoising diffusion probabilistic models (cDDPM) and patch-based diffusion methods. Moreover, its one-step inference enables reconstruction in just 0.19s per 2D slice, representing over a 700-fold speedup compared to cDDPM (135s) and surpassing diffusionGAN (0.58s), the second fastest. This combination of accuracy and efficiency makes I$^2$SB highly suitable for real-time or clinical deployment.
- Abstract(参考訳): CT(Computed tomography)は、非侵襲的、高分解能な内部解剖学的構造可視化のための基礎像のモダリティである。
しかし、スキャン対象がスキャナの視野を超えると、投影データが切り離され、不完全な再構成とFOV境界付近の人工物が発音される。
従来の再建アルゴリズムは、そのようなデータから正確な解剖を復元するのに苦労し、臨床信頼性を制限している。
FOV拡張のためのディープラーニングアプローチが検討されており、拡散生成モデルは画像合成の最新の進歩を表している。
しかし、従来の拡散モデルは反復的なサンプリングプロセスのため、計算的に要求され、推論が遅くなっている。
これらの制約に対処するために,画像から画像へのSchr\"odinger Bridge (I$^2$SB)拡散モデルに基づく効率的なCT FOV拡張フレームワークを提案する。
純粋なガウス雑音から画像を合成する従来の拡散モデルとは異なり、I$^2$SBはペア限定FOV画像と拡張FOV画像の直接確率写像を学習する。
この直接対応は、より解釈可能でトレース可能な生成過程をもたらし、再構成における解剖学的一貫性と構造的忠実性を高める。
I$^2$SBは、実データ上で49.8\,HU、実データで152.0HUのルート平均二乗誤差(RMSE)値、条件付き拡散確率モデル(cDDPM)やパッチベースの拡散法などの最先端拡散モデルよりも優れた定量的性能を達成する。
さらに1ステップの推論では、2Dスライスあたりわずか0.19秒で再構築が可能で、cDDPM (135秒) に比べて700倍のスピードアップを示し、拡散GAN (0.58秒) を上回っている。
この精度と効率の組み合わせにより、I$^2$SBはリアルタイムまたは臨床展開に非常に適している。
関連論文リスト
- PWD: Prior-Guided and Wavelet-Enhanced Diffusion Model for Limited-Angle CT [6.532073662427578]
LACT再構成のための先行情報埋め込みとウェーブレット特徴融合高速サンプリング拡散モデルを提案する。
PWDは、LACTの再構成忠実性を保ちながら効率的なサンプリングを可能にする。
PWDは50ステップしかサンプリングしないため、PSNRの少なくとも1.7dB改善とSSIMの10%向上を実現している。
論文 参考訳(メタデータ) (2025-06-30T08:28:32Z) - Latent Drifting in Diffusion Models for Counterfactual Medical Image Synthesis [55.959002385347645]
遅延ドリフトにより、医療画像に対して拡散モデルを条件付けし、反ファクト画像生成の複雑なタスクに適合させることができる。
我々は,脳MRIと胸部X線による3つの時系列的ベンチマークデータセットを用いて,対物画像生成法について検討した。
論文 参考訳(メタデータ) (2024-12-30T01:59:34Z) - FCDM: A Physics-Guided Bidirectional Frequency Aware Convolution and Diffusion-Based Model for Sinogram Inpainting [14.043383277622874]
フルビューのシノグラムは高い放射線線量と長いスキャン時間を必要とする。
スパースビューCTは、この負担を軽減するが、構造的な信号損失を伴う不完全なシノグラムを生じる。
本研究では,Ninogram に適した拡散型フレームワークであるmodelnameを提案する。
論文 参考訳(メタデータ) (2024-08-26T12:31:38Z) - Speeding up Photoacoustic Imaging using Diffusion Models [0.0]
光音響顕微鏡(PAM)は、光学的および音響的イメージングを統合し、組織内の光学吸収成分を検出するための浸透深度を向上させる。
レーザーパルス繰り返し速度による速度制限により、計算手法の潜在的な役割は、PAMイメージングの加速において強調される。
PAM画像の高速化に拡散モデルを用いた,新しい高適応DiffPamアルゴリズムを提案する。
論文 参考訳(メタデータ) (2023-12-14T11:34:27Z) - Simultaneous Image-to-Zero and Zero-to-Noise: Diffusion Models with Analytical Image Attenuation [53.04220377034574]
高品質(未条件)な画像生成のための前方拡散プロセスに解析的画像減衰プロセスを導入することを提案する。
本手法は,フォワード画像からノイズへのマッピングを,テクスチメジからゼロへのマッピングとテクスティケロ・ツー・ノイズマッピングの同時マッピングとして表現する。
我々は,CIFAR-10やCelebA-HQ-256などの無条件画像生成や,超解像,サリエンシ検出,エッジ検出,画像インペインティングなどの画像条件下での下流処理について実験を行った。
論文 参考訳(メタデータ) (2023-06-23T18:08:00Z) - Hierarchical Integration Diffusion Model for Realistic Image Deblurring [71.76410266003917]
拡散モデル (DM) は画像劣化に導入され, 有望な性能を示した。
本稿では,階層型統合拡散モデル(HI-Diff)を提案する。
人工的および実世界のぼかしデータセットの実験は、HI-Diffが最先端の手法より優れていることを示した。
論文 参考訳(メタデータ) (2023-05-22T12:18:20Z) - On Distillation of Guided Diffusion Models [94.95228078141626]
そこで本研究では,分類器を含まない誘導拡散モデルから抽出し易いモデルへ抽出する手法を提案する。
画素空間上で訓練された標準拡散モデルに対して,本手法は元のモデルに匹敵する画像を生成することができる。
遅延空間で訓練された拡散モデル(例えば、安定拡散)に対して、我々の手法は1から4段階のデノナイジングステップで高忠実度画像を生成することができる。
論文 参考訳(メタデータ) (2022-10-06T18:03:56Z) - Fast Unsupervised Brain Anomaly Detection and Segmentation with
Diffusion Models [1.6352599467675781]
脳画像における異常検出とセグメント分割のための拡散モデルに基づく手法を提案する。
拡散モデルは,2次元CTおよびMRIデータを用いた一連の実験において,自己回帰的アプローチと比較して競争性能が向上する。
論文 参考訳(メタデータ) (2022-06-07T17:30:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。