論文の概要: Swin-X2S: Reconstructing 3D Shape from 2D Biplanar X-ray with Swin Transformers
- arxiv url: http://arxiv.org/abs/2501.05961v1
- Date: Fri, 10 Jan 2025 13:41:10 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-01-13 15:26:39.541797
- Title: Swin-X2S: Reconstructing 3D Shape from 2D Biplanar X-ray with Swin Transformers
- Title(参考訳): Swin-X2S:スウィントランスを用いた2次元バイプレナーX線からの3次元形状再構成
- Authors: Kuan Liu, Zongyuan Ying, Jie Jin, Dongyan Li, Ping Huang, Wenjian Wu, Zhe Chen, Jin Qi, Yong Lu, Lianfu Deng, Bo Chen,
- Abstract要約: Swin-X2Sは2次元X線画像から3次元のセグメンテーションとラベリングを再構築するエンド・ツー・エンドのディープラーニング手法である。
エンコーダとデコーダをブリッジするために次元拡張モジュールを導入し、2Dピクセルから3Dボクセルへのスムーズな変換を保証する。
- 参考スコア(独自算出の注目度): 8.357602965532923
- License:
- Abstract: The conversion from 2D X-ray to 3D shape holds significant potential for improving diagnostic efficiency and safety. However, existing reconstruction methods often rely on hand-crafted features, manual intervention, and prior knowledge, resulting in unstable shape errors and additional processing costs. In this paper, we introduce Swin-X2S, an end-to-end deep learning method for directly reconstructing 3D segmentation and labeling from 2D biplanar orthogonal X-ray images. Swin-X2S employs an encoder-decoder architecture: the encoder leverages 2D Swin Transformer for X-ray information extraction, while the decoder employs 3D convolution with cross-attention to integrate structural features from orthogonal views. A dimension-expanding module is introduced to bridge the encoder and decoder, ensuring a smooth conversion from 2D pixels to 3D voxels. We evaluate proposed method through extensive qualitative and quantitative experiments across nine publicly available datasets covering four anatomies (femur, hip, spine, and rib), with a total of 54 categories. Significant improvements over previous methods have been observed not only in the segmentation and labeling metrics but also in the clinically relevant parameters that are of primary concern in practical applications, which demonstrates the promise of Swin-X2S to provide an effective option for anatomical shape reconstruction in clinical scenarios. Code implementation is available at: \url{https://github.com/liukuan5625/Swin-X2S}.
- Abstract(参考訳): 2次元のX線から3次元の形状への変換は、診断効率と安全性を向上させる重要な可能性を秘めている。
しかし、既存の再構築手法は手作りの特徴、手作業による介入、事前知識に依存しており、不安定な形状の誤りや処理コストが増大する。
本稿では,2次元平面直交X線画像からの3次元分割とラベル付けを直接再構成するエンドツーエンドの深層学習手法であるSwin-X2Sを紹介する。
エンコーダはX線情報抽出に2D Swin Transformerを使用し、デコーダは直交ビューから構造的特徴を統合するために3D畳み込みを用いる。
エンコーダとデコーダをブリッジするために次元拡張モジュールを導入し、2Dピクセルから3Dボクセルへのスムーズな変換を保証する。
提案手法は,4つの解剖群(大腿骨, 大腿骨, 脊椎, リブ)を網羅した9つの公用データセットに対して, 54のカテゴリーで定性的, 定量的に評価した。
従来の方法よりも重要な改善は, セグメンテーションやラベル付けの指標だけでなく, 臨床応用における主要な関心事である臨床関連パラメータにも見られ, 臨床シナリオにおける解剖学的形状再構築の有効な選択肢として, Swin-X2S が期待されている。
コードの実装は: \url{https://github.com/liukuan5625/Swin-X2S} で利用可能である。
関連論文リスト
- 3DPX: Single Panoramic X-ray Analysis Guided by 3D Oral Structure Reconstruction [19.164694943725202]
パノラマX線(パノラマX線、英: Panoramic X-ray、PX)は、歯学の実践において、広範囲の可用性と低コストのため一般的なモダリティである。
3次元構造の2次元投影として、PXは解剖学的情報損失に悩まされ、PX診断は3次元画像モダリティと比較して制限される。
PX画像解析に使用する2次元PXから欠落した3次元解剖情報を合成する2D-to-3D再構成法が検討されている。
論文 参考訳(メタデータ) (2024-09-27T12:44:06Z) - 3DPX: Progressive 2D-to-3D Oral Image Reconstruction with Hybrid MLP-CNN Networks [16.931777224277347]
パノラマX線(パノラマX線、英: Panoramic X-ray、PX)は、歯科医療において、広く利用でき、低コストである。
2次元投影画像として、PXは3次元解剖情報を含まない。
2次元から3次元の経口PX再構成のためのプログレッシブハイブリッド多層パーセプトロン(MLP)-CNNピラミドネットワーク(DPX)を提案する。
論文 参考訳(メタデータ) (2024-08-02T14:28:10Z) - Cross-Dimensional Medical Self-Supervised Representation Learning Based on a Pseudo-3D Transformation [68.60747298865394]
擬似3D変換(CDSSL-P3D)に基づく新しい三次元SSLフレームワークを提案する。
具体的には、2D画像を3Dデータに整合したフォーマットに変換するim2colアルゴリズムに基づく画像変換を提案する。
この変換は2次元および3次元データのシームレスな統合を可能にし、3次元医用画像解析のための相互教師あり学習を容易にする。
論文 参考訳(メタデータ) (2024-06-03T02:57:25Z) - R$^2$-Gaussian: Rectifying Radiative Gaussian Splatting for Tomographic Reconstruction [53.19869886963333]
3次元ガウススプラッティング(3DGS)は画像のレンダリングと表面再構成において有望な結果を示した。
本稿では,Sparse-viewトモグラフィ再構成のための3DGSベースのフレームワークであるR2$-Gaussianを紹介する。
論文 参考訳(メタデータ) (2024-05-31T08:39:02Z) - NDC-Scene: Boost Monocular 3D Semantic Scene Completion in Normalized
Device Coordinates Space [77.6067460464962]
SSC(Monocular 3D Semantic Scene Completion)は、単一の画像から複雑なセマンティックスや幾何学的形状を予測し、3D入力を必要としないため、近年大きな注目を集めている。
我々は,3次元空間に投影された2次元特徴の特徴的曖昧さ,3次元畳み込みのPose Ambiguity,深さの異なる3次元畳み込みにおける不均衡など,現在の最先端手法におけるいくつかの重要な問題を明らかにする。
シーン補完ネットワーク(NDC-Scene)を考案し,2を直接拡張する。
論文 参考訳(メタデータ) (2023-09-26T02:09:52Z) - Multi-dimension unified Swin Transformer for 3D Lesion Segmentation in
Multiple Anatomical Locations [1.7413461132662074]
3次元病変分割のためのMDU-ST(multi-dimension unified Swin transformer)と呼ばれる新しいモデルを提案する。
ネットワークの性能はDice similarity coefficient(DSC)とHausdorff distance(HD)で内部の3D病変データセットを用いて評価される。
提案手法は, 放射線学および腫瘍成長モデル研究を支援するために, 自動3次元病変セグメンテーションを行うために用いられる。
論文 参考訳(メタデータ) (2023-09-04T21:24:00Z) - Geometry-Aware Attenuation Learning for Sparse-View CBCT Reconstruction [53.93674177236367]
Cone Beam Computed Tomography (CBCT) は臨床画像撮影において重要な役割を担っている。
従来の方法では、高品質な3D CBCT画像の再構成には数百の2次元X線投影が必要である。
これにより、放射線線量を減らすため、スパースビューCBCT再構成への関心が高まっている。
本稿では,この問題を解決するために,新しい幾何対応エンコーダデコーダフレームワークを提案する。
論文 参考訳(メタデータ) (2023-03-26T14:38:42Z) - CNN-based real-time 2D-3D deformable registration from a single X-ray
projection [2.1198879079315573]
本稿では, フルオロスコープ画像を用いたリアルタイム2D-3D非剛体登録法を提案する。
術前スキャンから解剖学の変位場と2次元投影からなるデータセットを生成する。
ニューラルネットワークは、未知の3D変位場を単一の投影画像から回復するように訓練される。
論文 参考訳(メタデータ) (2022-12-15T09:57:19Z) - IGCN: Image-to-graph Convolutional Network for 2D/3D Deformable
Registration [1.2246649738388387]
単一視点2次元投影画像に対する3次元臓器メッシュの変形可能な登録を実現する画像間畳み込みネットワークを提案する。
複数臓器間の関係を考慮に入れた形状予測は, 臨床的に許容できる精度で放射線像からの呼吸運動と変形を予測するのに有用である。
論文 参考訳(メタデータ) (2021-10-31T12:48:37Z) - FCOS3D: Fully Convolutional One-Stage Monocular 3D Object Detection [78.00922683083776]
一般的な2D検出器をこの3Dタスクで動作させることは簡単ではない。
本報告では,完全畳み込み型単段検出器を用いた手法を用いてこの問題を考察する。
私たちのソリューションは、NeurIPS 2020のnuScenes 3D検出チャレンジのすべてのビジョンのみの方法の中で1位を獲得します。
論文 参考訳(メタデータ) (2021-04-22T09:35:35Z) - Revisiting 3D Context Modeling with Supervised Pre-training for
Universal Lesion Detection in CT Slices [48.85784310158493]
CTスライスにおける普遍的病変検出のための3Dコンテキスト強化2D特徴を効率的に抽出するための修飾擬似3次元特徴ピラミッドネットワーク(MP3D FPN)を提案する。
新たな事前学習手法により,提案したMP3D FPNは,DeepLesionデータセット上での最先端検出性能を実現する。
提案された3Dプリトレーニングウェイトは、他の3D医療画像分析タスクのパフォーマンスを高めるために使用できる。
論文 参考訳(メタデータ) (2020-12-16T07:11:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。