論文の概要: X-GRM: Large Gaussian Reconstruction Model for Sparse-view X-rays to Computed Tomography
- arxiv url: http://arxiv.org/abs/2505.15235v1
- Date: Wed, 21 May 2025 08:14:10 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-22 15:42:59.217145
- Title: X-GRM: Large Gaussian Reconstruction Model for Sparse-view X-rays to Computed Tomography
- Title(参考訳): X-GRM:Sparse-view X-rayの大規模ガウス再構成モデルとCT
- Authors: Yifan Liu, Wuyang Li, Weihao Yu, Chenxin Li, Alexandre Alahi, Max Meng, Yixuan Yuan,
- Abstract要約: X線ガウス再構成モデル(X-GRM)はスパースビュー2次元X線投影から3次元CTを再構成するための大型フィードモデルである。
X-GRMはスケーラブルなトランスフォーマーベースのアーキテクチャを使用して、任意の数のスパースX線入力を符号化し、異なるビューからのトークンを効率的に統合する。
X-GRMのトレーニングを支援するため,さまざまな臓器に約15,000個のCT/X線ペアを含む大規模CT再構成データセットであるReconX-15Kを収集した。
- 参考スコア(独自算出の注目度): 89.84588038174721
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Computed Tomography serves as an indispensable tool in clinical workflows, providing non-invasive visualization of internal anatomical structures. Existing CT reconstruction works are limited to small-capacity model architecture, inflexible volume representation, and small-scale training data. In this paper, we present X-GRM (X-ray Gaussian Reconstruction Model), a large feedforward model for reconstructing 3D CT from sparse-view 2D X-ray projections. X-GRM employs a scalable transformer-based architecture to encode an arbitrary number of sparse X-ray inputs, where tokens from different views are integrated efficiently. Then, tokens are decoded into a new volume representation, named Voxel-based Gaussian Splatting (VoxGS), which enables efficient CT volume extraction and differentiable X-ray rendering. To support the training of X-GRM, we collect ReconX-15K, a large-scale CT reconstruction dataset containing around 15,000 CT/X-ray pairs across diverse organs, including the chest, abdomen, pelvis, and tooth etc. This combination of a high-capacity model, flexible volume representation, and large-scale training data empowers our model to produce high-quality reconstructions from various testing inputs, including in-domain and out-domain X-ray projections. Project Page: https://github.com/CUHK-AIM-Group/X-GRM.
- Abstract(参考訳): Computed Tomographyは、臨床ワークフローにおいて必須のツールであり、内部解剖学的構造を非侵襲的に可視化する。
既存のCT再構成作業は、小容量モデルアーキテクチャ、非フレキシブルボリューム表現、および小規模のトレーニングデータに限られている。
本稿では,スパースビュー2次元X線投影から3次元CTを再構成する大規模なフィードフォワードモデルであるX-GRM(X-ray Gaussian Reconstruction Model)を提案する。
X-GRMはスケーラブルなトランスフォーマーベースのアーキテクチャを使用して、任意の数のスパースX線入力を符号化し、異なるビューからのトークンを効率的に統合する。
次にトークンをVoxGS(Voxel-based Gaussian Splatting)という新しいボリューム表現にデコードし,効率的なCTボリューム抽出とX線レンダリングを実現する。
X-GRMのトレーニングを支援するため,胸部,腹部,骨盤,歯など多様な臓器に約15,000個のCT/X線ペアを含む大規模CT再構成データセットであるReconX-15Kを収集した。
この高容量モデル、フレキシブルボリューム表現、大規模トレーニングデータの組み合わせにより、ドメイン内およびドメイン外のX線プロジェクションを含む様々なテストインプットから高品質な再構成を生成することができる。
Project Page: https://github.com/CUHK-AIM-Group/X-GRM.com
関連論文リスト
- X-LRM: X-ray Large Reconstruction Model for Extremely Sparse-View Computed Tomography Recovery in One Second [52.11676689269379]
スパースビュー3次元CT再構成は, 限られた2次元X線投影から構造を復元することを目的としている。
既存のフィードフォワード手法は、CNNベースのアーキテクチャの限られた能力と大規模なトレーニングデータセットの不足によって制約される。
X線大画像再構成モデル(X-LRM)を提案する。
論文 参考訳(メタデータ) (2025-03-09T01:39:59Z) - Fan-Beam CT Reconstruction for Unaligned Sparse-View X-ray Baggage Dataset [0.0]
不整合多視点X線バッグデータを用いたキャリブレーションと再構成手法を提案する。
提案手法は,多スペクトル神経減衰場再構成とLinear pushbroom (LPB) カメラモデルを用いたポーズ最適化を組み合わせたものである。
論文 参考訳(メタデータ) (2024-12-04T05:16:54Z) - Differentiable Voxel-based X-ray Rendering Improves Sparse-View 3D CBCT Reconstruction [4.941613865666241]
本稿では, Cone-Beam Computed Tomography (CBCT) の自己教師型フレームワークであるDiffVoxについて紹介する。
その結果,高忠実度3D CBCT量を少ないX線から再構成し,電離放射線曝露を低減し,診断の有用性を向上する可能性が示唆された。
論文 参考訳(メタデータ) (2024-11-28T15:49:08Z) - X-Recon: Learning-based Patient-specific High-Resolution CT Reconstruction from Orthogonal X-Ray Images [14.04604990570727]
X-Reconは、左右胸部X線画像に基づく再構成ネットワークである。
PTX-Segはゼロショット気胸セグメンテーションアルゴリズムである。
再現度はピーク信号対雑音比を含むいくつかの指標で最先端の性能を達成した。
論文 参考訳(メタデータ) (2024-07-22T03:55:36Z) - R$^2$-Gaussian: Rectifying Radiative Gaussian Splatting for Tomographic Reconstruction [53.19869886963333]
3次元ガウススプラッティング(3DGS)は画像のレンダリングと表面再構成において有望な結果を示した。
本稿では,Sparse-viewトモグラフィ再構成のための3DGSベースのフレームワークであるR2$-Gaussianを紹介する。
論文 参考訳(メタデータ) (2024-05-31T08:39:02Z) - Radiative Gaussian Splatting for Efficient X-ray Novel View Synthesis [88.86777314004044]
我々は,X線ノベルビュー可視化のための3次元ガウシアンスプラッティングに基づくフレームワーク,すなわちX-ガウシアンを提案する。
実験の結果,X-Gaussianは6.5dBの最先端手法より優れており,トレーニング時間は15%未満であり,推論速度は73倍であることがわかった。
論文 参考訳(メタデータ) (2024-03-07T00:12:08Z) - XProspeCT: CT Volume Generation from Paired X-Rays [0.0]
我々は、X線画像をシミュレーションCTボリュームに変換するために、以前の研究に基づいて構築した。
モデルバリエーションには、UNetアーキテクチャ、カスタム接続、アクティベーション関数、損失関数、新しいバックプロジェクションアプローチなどがある。
論文 参考訳(メタデータ) (2024-02-11T21:57:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。