論文の概要: Latent Space Consistency for Sparse-View CT Reconstruction
- arxiv url: http://arxiv.org/abs/2507.11152v1
- Date: Tue, 15 Jul 2025 10:02:19 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-16 19:46:03.066941
- Title: Latent Space Consistency for Sparse-View CT Reconstruction
- Title(参考訳): Sparse-View CT 再構成のための潜時空間整合性
- Authors: Duoyou Chen, Yunqing Chen, Can Zhang, Zhou Wang, Cheng Chen, Ruoxiu Xiao,
- Abstract要約: 潜在拡散モデル(LDM)は3次元CTの領域において有望な可能性を証明している。
2次元X線画像から潜伏した3D情報を効率的に抽出するために、クロスモーダル特徴コントラスト学習を用いる。
その結果, CLS-DMは標準的なボクセルレベルの指標で古典的, 最先端の生成モデルよりも優れていた。
- 参考スコア(独自算出の注目度): 10.057432803124167
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Computed Tomography (CT) is a widely utilized imaging modality in clinical settings. Using densely acquired rotational X-ray arrays, CT can capture 3D spatial features. However, it is confronted with challenged such as significant time consumption and high radiation exposure. CT reconstruction methods based on sparse-view X-ray images have garnered substantial attention from researchers as they present a means to mitigate costs and risks. In recent years, diffusion models, particularly the Latent Diffusion Model (LDM), have demonstrated promising potential in the domain of 3D CT reconstruction. Nonetheless, due to the substantial differences between the 2D latent representation of X-ray modalities and the 3D latent representation of CT modalities, the vanilla LDM is incapable of achieving effective alignment within the latent space. To address this issue, we propose the Consistent Latent Space Diffusion Model (CLS-DM), which incorporates cross-modal feature contrastive learning to efficiently extract latent 3D information from 2D X-ray images and achieve latent space alignment between modalities. Experimental results indicate that CLS-DM outperforms classical and state-of-the-art generative models in terms of standard voxel-level metrics (PSNR, SSIM) on the LIDC-IDRI and CTSpine1K datasets. This methodology not only aids in enhancing the effectiveness and economic viability of sparse X-ray reconstructed CT but can also be generalized to other cross-modal transformation tasks, such as text-to-image synthesis. We have made our code publicly available at https://anonymous.4open.science/r/CLS-DM-50D6/ to facilitate further research and applications in other domains.
- Abstract(参考訳): CT(Computed Tomography)は臨床現場で広く用いられている画像モダリティである。
密集した回転X線アレイを用いて、CTは3次元空間的特徴を捉えることができる。
しかし、かなりの時間消費や高放射線被曝といった課題に直面している。
スパースビューX線画像に基づくCT再構成法は,コストとリスクを軽減する手段として,研究者の注目を集めている。
近年, 拡散モデル, 特に潜在拡散モデル (LDM) は, 3次元CT再構成の領域において有望な可能性を示している。
それにもかかわらず、X線モダリティの2次元潜在表現とCTモダリティの3次元潜在表現との大きな違いがあるため、バニラLDMは潜時空間内で効果的なアライメントを達成できない。
そこで本研究では,2次元X線画像から遅延3D情報を効率よく抽出し,モダリティ間の遅延空間アライメントを実現するために,クロスモーダル特徴のコントラスト学習を取り入れたConsistent Latent Space Diffusion Model (CLS-DM)を提案する。
CLS-DMは、LIDC-IDRIおよびCTSpine1Kデータセットの標準ボクセルレベルの指標(PSNR、SSIM)において、古典的および最先端の生成モデルよりも優れていた。
この手法は、スパースX線再構成CTの有効性と経済性を高めるだけでなく、テキスト・ツー・イメージ合成などの他のモーダル・トランスフォーメーション・タスクにも応用できる。
当社のコードはhttps://anonymous.4open.science/r/CLS-DM-50D6/で公開されています。
関連論文リスト
- 3D Wavelet Latent Diffusion Model for Whole-Body MR-to-CT Modality Translation [13.252652406393205]
既存の全身画像のためのMR-to-CT法では、生成したCT画像と入力したMR画像との空間的アライメントが低くなることが多い。
本稿では,これらの制約に対処する新しい3次元ウェーブレット遅延拡散モデル(3D-WLDM)を提案する。
エンコーダ・デコーダアーキテクチャにWavelet Residual Moduleを組み込むことで,画像空間と潜伏空間をまたいだ微細な特徴の捕捉と再構築が促進される。
論文 参考訳(メタデータ) (2025-07-14T06:17:05Z) - TRACE: Temporally Reliable Anatomically-Conditioned 3D CT Generation with Enhanced Efficiency [40.82927972746919]
TRACEは、時間的アライメントを備えた3D医療画像を生成するフレームワークである。
重なり合うフレームフレームは、対をフレキシブルな長さシーケンスに分割し、時間的および解剖学的に整列された3Dボリュームに再構成する。
論文 参考訳(メタデータ) (2025-07-01T14:35:39Z) - 3D-CT-GPT: Generating 3D Radiology Reports through Integration of Large Vision-Language Models [51.855377054763345]
本稿では,VQAに基づく医用視覚言語モデルである3D-CT-GPTについて紹介する。
パブリックデータセットとプライベートデータセットの両方の実験により、3D-CT-GPTはレポートの正確さと品質という点で既存の手法を著しく上回っていることが示された。
論文 参考訳(メタデータ) (2024-09-28T12:31:07Z) - DIFR3CT: Latent Diffusion for Probabilistic 3D CT Reconstruction from Few Planar X-Rays [15.83915012691264]
DIFR3CTは平面X線観測から可塑性CT体積を生成する3次元潜時拡散モデルである。
本研究は,DIFR3CTが従来の画素レベルにおいて,近年のスパースCT再建ベースラインより優れていることを示す実験である。
また,DIFR3CTはモンテカルロサンプリングによる不確実な定量化をサポートし,再現信頼性を計測する機会を提供することを示した。
論文 参考訳(メタデータ) (2024-08-27T14:58:08Z) - DiffuX2CT: Diffusion Learning to Reconstruct CT Images from Biplanar X-Rays [41.393567374399524]
条件拡散過程として超スパースX線からのCT再構成をモデル化したDiffuX2CTを提案する。
これにより、DiffuX2CTは2次元X線から3次元構造情報を復元できる構造制御可能な再構成を実現する。
コントリビューションとして,LumbarVと呼ばれる実世界の腰椎CTデータセットを新しいベンチマークとして収集し,X線からのCT再構成の臨床的意義と性能を検証した。
論文 参考訳(メタデータ) (2024-07-18T14:20:04Z) - CoCPF: Coordinate-based Continuous Projection Field for Ill-Posed Inverse Problem in Imaging [78.734927709231]
スパース・ビュー・コンピュート・トモグラフィー(SVCT)の再構成は,スパース・サンプリングによるCT画像の取得を目的としている。
暗黙的な神経表現(INR)技術は、不備のため、その分野に「かなりの穴」(すなわち、未モデル化空間)を残し、準最適結果をもたらす可能性がある。
SVCT再構成のためのホールフリー表現場を構築することを目的としたコーディネート型連続射影場(CoCPF)を提案する。
論文 参考訳(メタデータ) (2024-06-21T08:38:30Z) - C^2RV: Cross-Regional and Cross-View Learning for Sparse-View CBCT Reconstruction [17.54830070112685]
コーンビームCT(CBCT)は医療現場で広く用いられている画像技術である。
コーン状X線による測定により, CBCTの復元が困難になる。
本稿では,3次元空間におけるクロスリージョン学習を実現するために,明示的なマルチスケールボリューム表現を活用してC2RVを提案する。
論文 参考訳(メタデータ) (2024-06-06T09:37:56Z) - SDR-Former: A Siamese Dual-Resolution Transformer for Liver Lesion
Classification Using 3D Multi-Phase Imaging [59.78761085714715]
本研究は肝病変分類のための新しいSDR-Formerフレームワークを提案する。
提案フレームワークは2つの臨床データセットに関する総合的な実験を通じて検証された。
科学コミュニティを支援するため,肝病変解析のための多段階MRデータセットを公開しています。
論文 参考訳(メタデータ) (2024-02-27T06:32:56Z) - On the Localization of Ultrasound Image Slices within Point Distribution
Models [84.27083443424408]
甲状腺疾患は高分解能超音波(US)で診断されることが多い
縦断追跡は病理甲状腺形態の変化をモニタリングするための重要な診断プロトコルである。
3次元形状表現におけるUS画像の自動スライスローカライズのためのフレームワークを提案する。
論文 参考訳(メタデータ) (2023-09-01T10:10:46Z) - MedNeRF: Medical Neural Radiance Fields for Reconstructing 3D-aware
CT-Projections from a Single X-ray [14.10611608681131]
過剰な電離放射線は、体に決定論的かつ有害な影響をもたらす可能性がある。
本稿では,CTプロジェクションの再構成を学習する深層学習モデルを提案する。
論文 参考訳(メタデータ) (2022-02-02T13:25:23Z) - Automated Model Design and Benchmarking of 3D Deep Learning Models for
COVID-19 Detection with Chest CT Scans [72.04652116817238]
3D胸部CTスキャン分類のための3D DLモデルを自動的に検索するための差別化可能なニューラルネットワーク探索(DNAS)フレームワークを提案する。
また,我々のモデルのクラスアクティベーションマッピング(cam)技術を利用して,結果の解釈可能性を提供する。
論文 参考訳(メタデータ) (2021-01-14T03:45:01Z) - Revisiting 3D Context Modeling with Supervised Pre-training for
Universal Lesion Detection in CT Slices [48.85784310158493]
CTスライスにおける普遍的病変検出のための3Dコンテキスト強化2D特徴を効率的に抽出するための修飾擬似3次元特徴ピラミッドネットワーク(MP3D FPN)を提案する。
新たな事前学習手法により,提案したMP3D FPNは,DeepLesionデータセット上での最先端検出性能を実現する。
提案された3Dプリトレーニングウェイトは、他の3D医療画像分析タスクのパフォーマンスを高めるために使用できる。
論文 参考訳(メタデータ) (2020-12-16T07:11:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。