論文の概要: GCA-ResUNet: Medical Image Segmentation Using Grouped Coordinate Attention
- arxiv url: http://arxiv.org/abs/2512.23990v1
- Date: Tue, 30 Dec 2025 05:13:20 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-01 23:27:28.286069
- Title: GCA-ResUNet: Medical Image Segmentation Using Grouped Coordinate Attention
- Title(参考訳): GCA-ResUNet: Grouped Coordinate Attention を用いた医用画像分割
- Authors: Jun Ding, Shang Gao,
- Abstract要約: GCA-ResUNetは、軽量でプラグ&プレイのGrouped Coordinate Attention (GCA)モジュールを備えた効率的な医用画像セグメンテーションフレームワークである。
Synapse と ACDC の2つの広く使われているベンチマークによる大規模な実験では、それぞれ GCA-ResUNet が 86.11% と 92.64% のDice のスコアを達成している。
- 参考スコア(独自算出の注目度): 3.6679095759171645
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Accurate segmentation of heterogeneous anatomical structures is pivotal for computer-aided diagnosis and subsequent clinical decision-making. Although U-Net based convolutional neural networks have achieved remarkable progress, their intrinsic locality and largely homogeneous attention formulations often limit the modeling of long-range contextual dependencies, especially in multi-organ scenarios and low-contrast regions. Transformer-based architectures mitigate this issue by leveraging global self-attention, but they usually require higher computational resources and larger training data, which may impede deployment in resource-constrained clinical environments.In this paper, we propose GCA-ResUNet, an efficient medical image segmentation framework equipped with a lightweight and plug-and-play Grouped Coordinate Attention (GCA) module. The proposed GCA decouples channel-wise context modeling into multiple groups to explicitly account for semantic heterogeneity across channels, and integrates direction-aware coordinate encoding to capture structured spatial dependencies along horizontal and vertical axes. This design enhances global representation capability while preserving the efficiency advantages of CNN backbones. Extensive experiments on two widely used benchmarks, Synapse and ACDC, demonstrate that GCA-ResUNet achieves Dice scores of 86.11% and 92.64%, respectively, outperforming a range of representative CNN and Transformer-based methods, including Swin-UNet and TransUNet. In particular, GCA-ResUNet yields consistent improvements in delineating small anatomical structures with complex boundaries. These results indicate that the proposed approach provides a favorable trade-off between segmentation accuracy and computational efficiency, offering a practical and scalable solution for clinical deployment.
- Abstract(参考訳): 不均一な解剖学的構造の正確なセグメンテーションは、コンピュータ支援診断とその後の臨床診断に重要である。
U-Netベースの畳み込みニューラルネットワークは目覚ましい進歩を遂げているが、その固有の局所性と主に均一な注意の定式化は、特に多臓器シナリオや低コントラスト領域において、長距離コンテキスト依存のモデリングを制限していることが多い。
トランスフォーマーベースのアーキテクチャは、グローバルな自己注意を活用することでこの問題を緩和するが、通常は高い計算資源とより大きなトレーニングデータを必要とするため、リソース制約のある臨床環境への展開を阻害する可能性がある。
提案したGCAは,チャネルのコンテキストモデリングを複数のグループに分離し,チャネル間の意味的不均一性を明示的に説明し,方向対応座標符号化を統合し,水平軸と垂直軸に沿った構造的空間依存を捉える。
この設計は、CNNバックボーンの効率性を維持しながら、グローバル表現能力を向上する。
Synapse と ACDC の2つの広く使われているベンチマークにおいて、GCA-ResUNet がそれぞれ86.11%と92.64%のDiceスコアを達成し、Swin-UNet や TransUNet など様々な代表的 CNN と Transformer ベースの手法より優れていることを示した。
特に、GCA-ResUNetは、複雑な境界を持つ小さな解剖学的構造を、一貫した改善をもたらす。
これらの結果から,提案手法はセグメンテーション精度と計算効率のトレードオフを良好に実現し,臨床展開のための実用的でスケーラブルなソリューションを提供することが示唆された。
関連論文リスト
- TGC-Net: A Structure-Aware and Semantically-Aligned Framework for Text-Guided Medical Image Segmentation [56.09179939570486]
本稿では,パラメータ効率,タスク固有適応に着目したCLIPベースのフレームワークであるTGC-Netを提案する。
TGC-Netは、挑戦的なベンチマークで顕著なDiceゲインを含む、トレーニング可能なパラメータをかなり少なくして、最先端のパフォーマンスを実現している。
論文 参考訳(メタデータ) (2025-12-24T12:06:26Z) - GCA-ResUNet:Image segmentation in medical images using grouped coordinate attention [3.6679095759171645]
GCA-ResUNetは、Grouped Coordinate AttentionをResNet-50残留ブロックに統合する効率的なセグメンテーションネットワークである。
Synapseデータセットでは、GCA-ResUNetが86.11%のDiceスコアを獲得し、ACDCデータセットでは92.64%に達する。
論文 参考訳(メタデータ) (2025-11-18T03:13:34Z) - RWKV-UNet: Improving UNet with Long-Range Cooperation for Effective Medical Image Segmentation [70.79072961974141]
本稿では,RWKV構造をU-Netアーキテクチャに統合する新しいモデルであるRWKV-UNetを提案する。
この統合により、長い範囲の依存関係をキャプチャし、コンテキスト理解を改善するモデルの能力が向上する。
11のベンチマークデータセットの実験により、RWKV-UNetは様々なタイプの医用画像セグメンテーションタスクで最先端のパフォーマンスを達成することが示された。
論文 参考訳(メタデータ) (2025-01-14T22:03:00Z) - Perspective+ Unet: Enhancing Segmentation with Bi-Path Fusion and Efficient Non-Local Attention for Superior Receptive Fields [19.71033340093199]
本稿では,医療画像のセグメンテーションの限界を克服する新しいアーキテクチャであるspective+Unetを提案する。
このフレームワークは ENLTB という名前の効率的な非局所トランスフォーマーブロックを組み込んでおり、これはカーネル関数近似を利用して、効率的な長距離依存性キャプチャを行う。
ACDCとデータセットに関する実験結果から,提案したパースペクティブ+Unetの有効性が示された。
論文 参考訳(メタデータ) (2024-06-20T07:17:39Z) - GCtx-UNet: Efficient Network for Medical Image Segmentation [0.2353157426758003]
GCtx-UNetは軽量なセグメンテーションアーキテクチャで、最先端のアプローチよりも正確さでグローバルおよびローカルの画像特徴をキャプチャできる。
GCtx-UNetは、Synapseの多臓器腹部CTデータセット、ACDCの心臓MRIデータセット、およびいくつかのポリープセグメンテーションデータセットで評価される。
論文 参考訳(メタデータ) (2024-06-09T19:17:14Z) - BRAU-Net++: U-Shaped Hybrid CNN-Transformer Network for Medical Image Segmentation [11.986549780782724]
医用画像の正確な分割作業のために,BRAU-Net++ というハイブリッドで効果的な CNN-Transformer ネットワークを提案する。
具体的には、BRAU-Net++は、U字型エンコーダデコーダ構造を設計するために、コアビルディングブロックとしてバイレベルルーティングアテンションを使用する。
提案手法は,そのベースラインであるBRAU-Netを含む,最先端の手法を超越した手法である。
論文 参考訳(メタデータ) (2024-01-01T10:49:09Z) - Dual-scale Enhanced and Cross-generative Consistency Learning for Semi-supervised Medical Image Segmentation [49.57907601086494]
医用画像のセグメンテーションはコンピュータ支援診断において重要な役割を担っている。
半教師型医用画像(DEC-Seg)のための新しいDual-scale Enhanced and Cross-generative consistency learning frameworkを提案する。
論文 参考訳(メタデータ) (2023-12-26T12:56:31Z) - Cross-Modality Brain Tumor Segmentation via Bidirectional
Global-to-Local Unsupervised Domain Adaptation [61.01704175938995]
本論文では,UDAスキームに基づくBiGL(Bidirectional Global-to-Local)適応フレームワークを提案する。
具体的には、脳腫瘍をセグメント化するために、双方向画像合成およびセグメンテーションモジュールを提案する。
提案手法は, 最先端の非教師なし領域適応法を大きなマージンで上回っている。
論文 参考訳(メタデータ) (2021-05-17T10:11:45Z) - Unsupervised Bidirectional Cross-Modality Adaptation via Deeply
Synergistic Image and Feature Alignment for Medical Image Segmentation [73.84166499988443]
我々は、Synergistic Image and Feature Alignment (SIFA)と名付けられた新しい教師なしドメイン適応フレームワークを提案する。
提案するSIFAは、画像と特徴の両方の観点から、ドメインの相乗的アライメントを行う。
2つの異なるタスクに対する実験結果から,SIFA法は未ラベル対象画像のセグメンテーション性能を向上させるのに有効であることが示された。
論文 参考訳(メタデータ) (2020-02-06T13:49:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。