論文の概要: GCA-ResUNet:Image segmentation in medical images using grouped coordinate attention
- arxiv url: http://arxiv.org/abs/2511.14087v1
- Date: Tue, 18 Nov 2025 03:13:34 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-19 16:23:52.903002
- Title: GCA-ResUNet:Image segmentation in medical images using grouped coordinate attention
- Title(参考訳): GCA-ResUNet:グループ座標アテンションを用いた医用画像のイメージセグメンテーション
- Authors: Jun Ding, Shang Gao,
- Abstract要約: GCA-ResUNetは、Grouped Coordinate AttentionをResNet-50残留ブロックに統合する効率的なセグメンテーションネットワークである。
Synapseデータセットでは、GCA-ResUNetが86.11%のDiceスコアを獲得し、ACDCデータセットでは92.64%に達する。
- 参考スコア(独自算出の注目度): 3.6679095759171645
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Medical image segmentation underpins computer-aided diagnosis and therapy by supporting clinical diagnosis, preoperative planning, and disease monitoring. While U-Net style convolutional neural networks perform well due to their encoder-decoder structures with skip connections, they struggle to capture long-range dependencies. Transformer-based variants address global context but often require heavy computation and large training datasets. This paper proposes GCA-ResUNet, an efficient segmentation network that integrates Grouped Coordinate Attention (GCA) into ResNet-50 residual blocks. GCA uses grouped coordinate modeling to jointly encode global dependencies across channels and spatial locations, strengthening feature representation and boundary delineation while adding minimal parameter and FLOP overhead compared with self-attention. On the Synapse dataset, GCA-ResUNet achieves a Dice score of 86.11%, and on the ACDC dataset, it reaches 92.64%, surpassing several state-of-the-art baselines while maintaining fast inference and favorable computational efficiency. These results indicate that GCA offers a practical way to enhance convolutional architectures with global modeling capability, enabling high-accuracy and resource-efficient medical image segmentation.
- Abstract(参考訳): 医用画像のセグメンテーションは、臨床診断、術前計画、疾患モニタリングをサポートすることによって、コンピュータ支援された診断と治療を支える。
U-Netスタイルの畳み込みニューラルネットワークは、接続をスキップするエンコーダデコーダ構造のためによく機能するが、長距離依存を捉えるのに苦労する。
トランスフォーマーベースの変種は、グローバルコンテキストに対処するが、重い計算と大規模なトレーニングデータセットを必要とすることが多い。
本稿では、GCA(Grouped Coordinate Attention)をResNet-50残余ブロックに統合した効率的なセグメンテーションネットワークであるGCA-ResUNetを提案する。
GCAはグループ座標モデルを用いて、チャネルと空間的位置のグローバルな依存関係を共同で符号化し、特徴表現と境界デラインを強化し、自己アテンションと比較して最小のパラメータとFLOPオーバーヘッドを追加する。
Synapseデータセットでは、GCA-ResUNetが86.11%のDiceスコアを獲得し、ACDCデータセットでは92.64%に達し、いくつかの最先端のベースラインを超え、高速な推論と良好な計算効率を維持している。
これらの結果から,GCAはグローバルなモデリング機能を備えた畳み込みアーキテクチャを実践的に拡張し,高精度かつ資源効率の高い医用画像セグメント化を実現することが示唆された。
関連論文リスト
- GCtx-UNet: Efficient Network for Medical Image Segmentation [0.2353157426758003]
GCtx-UNetは軽量なセグメンテーションアーキテクチャで、最先端のアプローチよりも正確さでグローバルおよびローカルの画像特徴をキャプチャできる。
GCtx-UNetは、Synapseの多臓器腹部CTデータセット、ACDCの心臓MRIデータセット、およびいくつかのポリープセグメンテーションデータセットで評価される。
論文 参考訳(メタデータ) (2024-06-09T19:17:14Z) - Leveraging Frequency Domain Learning in 3D Vessel Segmentation [50.54833091336862]
本研究では,Fourier領域学習を3次元階層分割モデルにおけるマルチスケール畳み込みカーネルの代用として活用する。
管状血管分割作業において,新しいネットワークは顕著なサイス性能(ASACA500が84.37%,ImageCASが80.32%)を示した。
論文 参考訳(メタデータ) (2024-01-11T19:07:58Z) - BRAU-Net++: U-Shaped Hybrid CNN-Transformer Network for Medical Image Segmentation [11.986549780782724]
医用画像の正確な分割作業のために,BRAU-Net++ というハイブリッドで効果的な CNN-Transformer ネットワークを提案する。
具体的には、BRAU-Net++は、U字型エンコーダデコーダ構造を設計するために、コアビルディングブロックとしてバイレベルルーティングアテンションを使用する。
提案手法は,そのベースラインであるBRAU-Netを含む,最先端の手法を超越した手法である。
論文 参考訳(メタデータ) (2024-01-01T10:49:09Z) - Dual-scale Enhanced and Cross-generative Consistency Learning for Semi-supervised Medical Image Segmentation [49.57907601086494]
医用画像のセグメンテーションはコンピュータ支援診断において重要な役割を担っている。
半教師型医用画像(DEC-Seg)のための新しいDual-scale Enhanced and Cross-generative consistency learning frameworkを提案する。
論文 参考訳(メタデータ) (2023-12-26T12:56:31Z) - GAEI-UNet: Global Attention and Elastic Interaction U-Net for Vessel
Image Segmentation [0.0]
血管画像のセグメンテーションは、血管疾患の早期発見と治療を支援する医療診断において重要な役割を担っている。
本稿では,グローバルアテンションと弾性相互作用に基づく手法を組み合わせた新しいモデルGAEI-UNetを提案する。
ターゲット形状と予測形状のずれによって生じる力を捕捉することにより,本モデルでは,容器ネットワークの正確なトポロジを効果的に学習する。
論文 参考訳(メタデータ) (2023-08-16T13:10:32Z) - Semantic segmentation of surgical hyperspectral images under geometric
domain shifts [69.91792194237212]
本稿では、幾何学的アウト・オブ・ディストリビューション(OOD)データの存在下で、最先端のセマンティックセグメンテーションネットワークを初めて分析する。
有機移植(Organ transplantation)と呼ばれる専用の拡張技術により、一般化可能性にも対処する。
提案手法は,SOA DSCの最大67 % (RGB) と90% (HSI) を改善し,実際のOODテストデータ上での分配内性能と同等の性能を示す。
論文 参考訳(メタデータ) (2023-03-20T09:50:07Z) - PSGR: Pixel-wise Sparse Graph Reasoning for COVID-19 Pneumonia
Segmentation in CT Images [83.26057031236965]
画像中の新型コロナウイルス感染領域セグメンテーションの長距離依存性のモデリングを強化するために,PSGRモジュールを提案する。
PSGRモジュールは不正確なピクセルからノードへの投影を回避し、グローバルな推論のために各ピクセル固有の情報を保存する。
このソリューションは、3つの公開データセット上の4つの広く使われているセグメンテーションモデルに対して評価されている。
論文 参考訳(メタデータ) (2021-08-09T04:58:23Z) - Multi-Level Graph Convolutional Network with Automatic Graph Learning
for Hyperspectral Image Classification [63.56018768401328]
HSI分類のための自動グラフ学習法(MGCN-AGL)を用いたマルチレベルグラフ畳み込みネットワーク(GCN)を提案する。
空間的に隣接する領域における重要度を特徴付けるために注意機構を利用することで、最も関連性の高い情報を適応的に組み込んで意思決定を行うことができる。
MGCN-AGLは局所的に生成した表現表現に基づいて画像領域間の長距離依存性を符号化する。
論文 参考訳(メタデータ) (2020-09-19T09:26:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。