論文の概要: SpineContextResUNet: A Computationally Efficient Residual UNet for Spine CT Segmentation
- arxiv url: http://arxiv.org/abs/2605.20760v1
- Date: Wed, 20 May 2026 06:00:23 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-21 19:19:56.512206
- Title: SpineContextResUNet: A Computationally Efficient Residual UNet for Spine CT Segmentation
- Title(参考訳): SpineContextResUNet: Spine CTセグメンテーションのための計算効率の良い残留UNet
- Authors: K S Nithurshen, Saurabh J. Shigwan,
- Abstract要約: SpineContextResUNetは高速な脊髄局在化のための計算効率の良い3次元残留U-Netである。
我々のアーキテクチャは、長距離解剖学的依存関係をキャプチャするために並列な多次元畳み込みを利用する軽量なContext Blockを統合している。
当社のモデルは、堅牢な推論を実行し、ポイント・オブ・ケアの診断とエッジプラットフォームへのデプロイに有効なソリューションとなる。
- 参考スコア(独自算出の注目度): 0.21485350418225244
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Automated segmentation of the vertebral column in Computed Tomography (CT) scans is a prerequisite for pathological assessment and surgical planning. However, state-of-the-art methods, particularly those based on Transformers or large-scale ensembles, demand substantial GPU resources, creating a barrier for clinical adoption in resource-constrained environments or on edge devices. To address this, we introduce SpineContextResUNet, a computationally efficient 3D Residual U-Net designed for rapid spinal localization. Our architecture integrates a lightweight Context Block that employs parallel multi-dilated convolutions to capture long-range anatomical dependencies without the high latency of Recurrent Neural Networks (RNNs) or the memory overhead of Self-Attention mechanisms. Extensive validation on two public benchmarks, VerSe2020 and CTSpine1K, demonstrates that our model achieves a Dice score of 88.17% and 88.13% respectively. To evaluate performance under strict hardware constraints, we compared our model against a bottlenecked SwinUNETR scaled to match our ~1.7M hardware footprint. While the constrained Transformer suffers severe performance degradation due to a lack of spatial inductive biases in a limited-data regime, our CNN-based approach successfully maintains high accuracy. Crucially, heavy baselines like TotalSegmentator fail due to memory exhaustion on commodity hardware (Intel Core i5, 8GB RAM), our model performs robust inference, making it a viable solution for point-of-care diagnostics and deployment on edge platforms like the Nvidia Jetson Orin Nano.
- Abstract(参考訳): Computed Tomography(CT)スキャンにおける椎体の自動分節化は,病理学的評価と手術計画の前提条件である。
しかし、最先端の方法、特にトランスフォーマーや大規模なアンサンブルに基づくものでは、相当なGPUリソースを必要としており、リソース制約された環境やエッジデバイスで臨床導入の障壁を形成している。
そこで本稿では,高速な脊髄局在化のために設計された3次元残留U-NetであるSpineContextResUNetを紹介する。
我々のアーキテクチャは、並列多次元畳み込みを利用した軽量なContext Blockを統合し、リカレントニューラルネットワーク(RNN)のレイテンシや自己保持機構のメモリオーバーヘッドを伴わずに、長距離解剖学的依存関係をキャプチャする。
VerSe2020とCTSpine1Kの2つの公開ベンチマークに対する大規模な検証は、我々のモデルがそれぞれ88.17%と88.13%のDiceスコアを達成したことを示している。
厳格なハードウェア制約下での性能を評価するため、我々は、ボトルネック付きSwinUNETRのスケールを約1.7Mのハードウェアフットプリントに合わせるために、モデルを比較した。
制約付きトランスフォーマーは,データ構造に空間的帰納バイアスが欠如しているため,厳しい性能劣化に悩まされるが,我々のCNNベースのアプローチは高い精度を維持している。
重要なことに、TotalSegmentatorのようなヘビーベースラインは、コモディティハードウェア(Intel Core i5, 8GB RAM)のメモリ枯渇によって失敗する。
関連論文リスト
- Efficient KernelSHAP Explanations for Patch-based 3D Medical Image Segmentation [0.7178174536168246]
本稿では,ユーザ定義の関心領域と受容野サポートに基づく3次元医用画像セグメンテーションのための効率的なフレームワークを提案する。
キャッシュは冗長な計算を著しく削減し(15%から30%)、忠実さと解釈性が明確なトレードオフを示すことを示す。
論文 参考訳(メタデータ) (2026-04-13T17:43:33Z) - CT Scans As Video: Efficient Intracranial Hemorrhage Detection Using Multi-Object Tracking [0.9332987715848716]
本稿では,2次元検出の効率と3次元コンテキストの必要性を両立させる軽量コンピュータビジョンフレームワークを開発する。
計算コストのごく一部で3Dコンテキスト推論を近似することにより,リアルタイム患者優先化のためのスケーラブルなソリューションを提供する。
論文 参考訳(メタデータ) (2026-01-05T19:49:51Z) - DRBD-Mamba for Robust and Efficient Brain Tumor Segmentation with Analytical Insights [54.87947751720332]
脳腫瘍の正確なセグメンテーションは、臨床診断と治療に重要である。
マンバを拠点とするState Space Modelsは、有望なパフォーマンスを示している。
本稿では,計算オーバーヘッドを最小限に抑えながら,マルチスケールの長距離依存関係をキャプチャするマルチ解像度双方向マンバを提案する。
論文 参考訳(メタデータ) (2025-10-16T07:31:21Z) - ReCoGNet: Recurrent Context-Guided Network for 3D MRI Prostate Segmentation [11.248082139905865]
アノテーション付きデータとしてMRIシーケンスをモデル化するハイブリッドアーキテクチャを提案する。
本手法では, 深層保存型DeepVLab3バックボーンを用いて, それぞれのMRIスライスから高レベルなセマンティック特徴を抽出し, コンブLSTM層で構築した再帰的畳み込みヘッドを用いて, スライス間の情報統合を行う。
現状の2D, 3Dセグメンテーションモデルと比較して, 精度, リコール, IoU, Dice similarity Coefficient (DSC) およびロバストネスの点で優れた性能を示す。
論文 参考訳(メタデータ) (2025-06-24T14:56:55Z) - MambaClinix: Hierarchical Gated Convolution and Mamba-Based U-Net for Enhanced 3D Medical Image Segmentation [6.673169053236727]
医用画像分割のための新しいU字型アーキテクチャであるMambaClinixを提案する。
MambaClinixは、階層的なゲート畳み込みネットワークとMambaを適応的なステージワイドフレームワークに統合する。
以上の結果から,MambaClinixは低モデルの複雑さを維持しつつ高いセグメンテーション精度を達成できることが示唆された。
論文 参考訳(メタデータ) (2024-09-19T07:51:14Z) - LATUP-Net: A Lightweight 3D Attention U-Net with Parallel Convolutions for Brain Tumor Segmentation [7.1789008189318455]
LATUP-Netは、並列畳み込みを備えた軽量な3DアテンションU-Netである。
高いセグメンテーション性能を維持しつつ、計算要求を大幅に削減するように設計されている。
BraTS 2020データセットの平均Diceスコアは88.41%、83.82%、73.67%であり、BraTS 2021データセットでは、それぞれ90.29%、89.54%、83.92%である。
論文 参考訳(メタデータ) (2024-04-09T00:05:45Z) - Leveraging Frequency Domain Learning in 3D Vessel Segmentation [50.54833091336862]
本研究では,Fourier領域学習を3次元階層分割モデルにおけるマルチスケール畳み込みカーネルの代用として活用する。
管状血管分割作業において,新しいネットワークは顕著なサイス性能(ASACA500が84.37%,ImageCASが80.32%)を示した。
論文 参考訳(メタデータ) (2024-01-11T19:07:58Z) - UNETR++: Delving into Efficient and Accurate 3D Medical Image Segmentation [93.88170217725805]
本稿では,高画質なセグメンテーションマスクと,パラメータ,計算コスト,推論速度の両面での効率性を提供するUNETR++という3次元医用画像セグメンテーション手法を提案する。
我々の設計の核となるのは、空間的およびチャネル的な識別的特徴を効率的に学習する、新しい効率的な対注意ブロック(EPA)の導入である。
Synapse, BTCV, ACDC, BRaTs, Decathlon-Lungの5つのベンチマークで評価した結果, 効率と精度の両面で, コントリビューションの有効性が示された。
論文 参考訳(メタデータ) (2022-12-08T18:59:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。