論文の概要: Geometrical Cross-Attention and Nonvoid Voxelization for Efficient 3D Medical Image Segmentation
- arxiv url: http://arxiv.org/abs/2604.05515v1
- Date: Tue, 07 Apr 2026 07:13:36 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-08 17:42:09.677484
- Title: Geometrical Cross-Attention and Nonvoid Voxelization for Efficient 3D Medical Image Segmentation
- Title(参考訳): 効率的な3次元医用画像分割のための幾何学的クロスアテンションと非ボイドボクセル化
- Authors: Chenxin Yuan, Shoupeng Chen, Haojiang Ye, Yiming Miao, Limei Peng, Pin-Han Ho,
- Abstract要約: GCNV-Netは3方向動的非ボイドボクセル変換器(3DNVT)を統合した新しい3次元医用セグメンテーションフレームワークである
非ボイドボクセル化プロセスは情報領域のみであり、セグメンテーション品質を損なうことなく計算の冗長性を著しく低減する。
Diceでは0.65%,IoUでは0.63%,NSDでは1%,HD95では比較的14.5%を達成している。
- 参考スコア(独自算出の注目度): 7.130249306182679
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Accurate segmentation of 3D medical scans is crucial for clinical diagnostics and treatment planning, yet existing methods often fail to achieve both high accuracy and computational efficiency across diverse anatomies and imaging modalities. To address these challenges, we propose GCNV-Net, a novel 3D medical segmentation framework that integrates a Tri-directional Dynamic Nonvoid Voxel Transformer (3DNVT), a Geometrical Cross-Attention module (GCA), and Nonvoid Voxelization. The 3DNVT dynamically partitions relevant voxels along the three orthogonal anatomical planes, namely the transverse, sagittal, and coronal planes, enabling effective modeling of complex 3D spatial dependencies. The GCA mechanism explicitly incorporates geometric positional information during multi-scale feature fusion, significantly enhancing fine-grained anatomical segmentation accuracy. Meanwhile, Nonvoid Voxelization processes only informative regions, greatly reducing redundant computation without compromising segmentation quality, and achieves a 56.13% reduction in FLOPs and a 68.49% reduction in inference latency compared to conventional voxelization. We evaluate GCNV-Net on multiple widely used benchmarks: BraTS2021, ACDC, MSD Prostate, MSD Pancreas, and AMOS2022. Our method achieves state-of-the-art segmentation performance across all datasets, outperforming the best existing methods by 0.65% on Dice, 0.63% on IoU, 1% on NSD, and relatively 14.5% on HD95. All results demonstrate that GCNV-Net effectively balances accuracy and efficiency, and its robustness across diverse organs, disease conditions, and imaging modalities highlights strong potential for clinical deployment.
- Abstract(参考訳): 3次元医用スキャンの正確なセグメンテーションは臨床診断や治療計画に欠かせないが、既存の手法では様々な解剖学や画像モダリティの精度と計算効率の両立に失敗することが多い。
これらの課題に対処するために,3方向動的非ボイドボクセル変換器(3DNVT),幾何学的クロスアテンションモジュール(GCA),非ボイドボクセル化を統合した新しい3次元医用セグメンテーションフレームワークであるGCNV-Netを提案する。
3DNVTは、3つの直交解剖面、すなわち横面、矢状面、コロナ面に沿って関連するボクセルを動的に分割し、複雑な3次元空間依存の効果的なモデリングを可能にする。
GCA機構はマルチスケールな特徴融合中に幾何学的位置情報を明示的に組み込んでおり、微粒な解剖学的セグメンテーションの精度を著しく向上させる。
一方、非ボイドボクセル化プロセスは情報領域のみであり、セグメンテーション品質を損なうことなく冗長な計算を大幅に削減し、FLOPの56.13%の削減、従来のボクセル化に比べて推論遅延の68.49%の削減を実現している。
我々は,複数の広く使用されているベンチマーク(BraTS2021,ACDC,MSD Prostate,MSD Pancreas,AMOS2022)でGCNV-Netを評価した。
Diceでは0.65%,IoUでは0.63%,NSDでは1%,HD95では比較的14.5%を達成している。
これらの結果はGCNV-Netが精度と効率のバランスを効果的に保ち、様々な臓器、疾患条件、画像モダリティにまたがる堅牢性は、臨床展開の強い可能性を浮き彫りにしていることを示している。
関連論文リスト
- Tracing 3D Anatomy in 2D Strokes: A Multi-Stage Projection Driven Approach to Cervical Spine Fracture Identification [6.060672815761177]
本研究は,3次元CTボリュームにおける椎体レベル骨折検出のための2次元投射型椎体分割法の有効性について検討した。
全視野からYOLOv8モデルを用いて関心領域を同定し, 3次元頚椎領域を近似した。
DenseNet121-Unetベースのマルチラベルセグメンテーションは、分散およびエネルギーベースのプロジェクションを利用して、Diceスコア87.86パーセントを達成する。
論文 参考訳(メタデータ) (2026-01-21T18:15:47Z) - Cancer-Net PCa-MultiSeg: Multimodal Enhancement of Prostate Cancer Lesion Segmentation Using Synthetic Correlated Diffusion Imaging [55.62977326180104]
前立腺癌病変の分節化に対する近年の深層学習アプローチは,限られた性能を達成している。
本稿では,標準拡散型プロトコルの拡張として,合成相関拡散イメージング(CDI$s$)について検討する。
以上の結果から,PCa病変セグメント化タスクの実践的ドロップイン強化として,CDI$s$に対する検証済み統合経路が確立された。
論文 参考訳(メタデータ) (2025-11-11T04:16:12Z) - DRBD-Mamba for Robust and Efficient Brain Tumor Segmentation with Analytical Insights [54.87947751720332]
脳腫瘍の正確なセグメンテーションは、臨床診断と治療に重要である。
マンバを拠点とするState Space Modelsは、有望なパフォーマンスを示している。
本稿では,計算オーバーヘッドを最小限に抑えながら,マルチスケールの長距離依存関係をキャプチャするマルチ解像度双方向マンバを提案する。
論文 参考訳(メタデータ) (2025-10-16T07:31:21Z) - HANS-Net: Hyperbolic Convolution and Adaptive Temporal Attention for Accurate and Generalizable Liver and Tumor Segmentation in CT Imaging [2.7205074719266062]
腹部CT像における肝・腫瘍の正確なセグメンテーションは確実な診断と治療計画に重要である。
ニューラル表現とシナプティック・プラスティック・ネットワーク(HANS-Net)を用いたハイパーボリック・コンボリューションの導入
HANS-Netは、階層的幾何表現のための双曲的畳み込み、マルチスケールテクスチャ学習のためのウェーブレットインスパイアされた分解モジュール、暗黙の神経表現分岐を組み合わせた。
論文 参考訳(メタデータ) (2025-07-15T13:56:37Z) - A Continual Learning-driven Model for Accurate and Generalizable Segmentation of Clinically Comprehensive and Fine-grained Whole-body Anatomies in CT [67.34586036959793]
完全に注釈付きCTデータセットは存在せず、すべての解剖学がトレーニングのために記述されている。
完全解剖を分割できる連続学習駆動CTモデルを提案する。
単体CT分割モデルCL-Netは, 臨床的に包括的に包括的に235個の粒状体解剖の集合を高精度に分割することができる。
論文 参考訳(メタデータ) (2025-03-16T23:55:02Z) - S3TU-Net: Structured Convolution and Superpixel Transformer for Lung Nodule Segmentation [5.2752693301728355]
マルチ次元空間コネクタとスーパーピクセルベースの視覚変換器を統合したセグメンテーションモデルS3TU-Netを提案する。
S3TU-NetはマルチビューCNN-Transformerハイブリッドアーキテクチャ上に構築されており、スーパーピクセルアルゴリズム、構造化重み付け、空間シフト技術が組み込まれている。
LIDC-IDRIデータセットの実験結果は、S3TU-Netがそれぞれ89.04%、90.73%、90.70%のDSC、精度、IoUを達成したことを示している。
論文 参考訳(メタデータ) (2024-11-19T15:00:18Z) - 3DSAM-adapter: Holistic adaptation of SAM from 2D to 3D for promptable tumor segmentation [52.699139151447945]
医用画像の領域分割を行うために, SAMを2次元から3次元に変換する新しい適応法を提案する。
本モデルでは, 腎腫瘍, 膵腫瘍, 大腸癌の3つのタスクのうち8.25%, 29.87%, 10.11%の3つのタスクにおいて, ドメイン・オブ・ザ・アーティヴ・メディカル・イメージ・セグメンテーション・モデルより優れ, 肝腫瘍セグメンテーションでも同様の性能が得られる。
論文 参考訳(メタデータ) (2023-06-23T12:09:52Z) - Joint Semi-supervised 3D Super-Resolution and Segmentation with Mixed
Adversarial Gaussian Domain Adaptation [13.477290490742224]
医用画像の高解像度化は、画像の解像度を向上させることを目的としているが、従来は低解像度データセットの特徴に基づいて訓練されている。
本稿では,画像とそのラベルの同時超解像を行う半教師付きマルチタスク生成対向ネットワーク(Gemini-GAN)を提案する。
提案手法は, 成人1,331人, 成人205人のトランスナショナル多民族集団に対して広く評価された。
論文 参考訳(メタデータ) (2021-07-16T15:42:39Z) - Fully Automated 3D Segmentation of MR-Imaged Calf Muscle Compartments:
Neighborhood Relationship Enhanced Fully Convolutional Network [6.597152960878372]
FilterNetは新しい完全畳み込みネットワーク(FCN)であり、個々のふくらはぎの筋肉の区画分割にエッジ対応の制約を埋め込む。
FCNは健常者10名, 疾患者30名のT1強調MRI像を4倍のクロスバリデーションで評価した。
論文 参考訳(メタデータ) (2020-06-21T22:53:58Z) - A Global Benchmark of Algorithms for Segmenting Late Gadolinium-Enhanced
Cardiac Magnetic Resonance Imaging [90.29017019187282]
現在世界最大の心臓LGE-MRIデータセットである154個の3D LGE-MRIを用いた「2018 left Atrium Challenge」。
技術および生物学的指標を用いた提案アルゴリズムの解析を行った。
その結果, 最上部法は93.2%, 平均表面は0.7mmであった。
論文 参考訳(メタデータ) (2020-04-26T08:49:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。