論文の概要: GPAFormer: Graph-guided Patch Aggregation Transformer for Efficient 3D Medical Image Segmentation
- arxiv url: http://arxiv.org/abs/2604.06658v1
- Date: Wed, 08 Apr 2026 04:17:58 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-09 17:30:51.331662
- Title: GPAFormer: Graph-guided Patch Aggregation Transformer for Efficient 3D Medical Image Segmentation
- Title(参考訳): GPAFormer: 3次元医用画像分割のためのグラフ誘導パッチ集約変換器
- Authors: Chung-Ming Lo, I-Yun Liu, Wei-Yang Lin,
- Abstract要約: GPAFormerは、3D画像セグメンテーション用に設計された軽量ネットワークアーキテクチャである。
GPAFormerにはMASA(Multi-scale attention-guided stacked aggregate)とMPGA(Multi-Aware patch graph aggregator)という2つのコアモジュールが組み込まれている。
- 参考スコア(独自算出の注目度): 2.209475514606477
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Deep learning has been widely applied to 3D medical image segmentation tasks. However, due to the diversity of imaging modalities, the high-dimensional nature of the data, and the heterogeneity of anatomical structures, achieving both segmentation accuracy and computational efficiency in multi-organ segmentation remains a challenge. This study proposed GPAFormer, a lightweight network architecture specifically designed for 3D medical image segmentation, emphasizing efficiency while keeping high accuracy. GPAFormer incorporated two core modules: the multi-scale attention-guided stacked aggregation (MASA) and the mutual-aware patch graph aggregator (MPGA). MASA utilized three parallel paths with different receptive fields, combined through planar aggregation, to enhance the network's capability in handling structures of varying sizes. MPGA employed a graph-guided approach to dynamically aggregate regions with similar feature distributions based on inter-patch feature similarity and spatial adjacency, thereby improving the discrimination of both internal and boundary structures of organs. Experiments were performed on public whole-body CT and MRI datasets including BTCV, Synapse, ACDC, and BraTS. Compared to the existed 3D segmentation networkd, GPAFormer using only 1.81 M parameters achieved overall highest DSC on BTCV (75.70%), Synapse (81.20%), ACDC (89.32%), and BraTS (82.74%). Using consumer level GPU, the inference time for one validation case of BTCV spent less than one second. The results demonstrated that GPAFormer balanced accuracy and efficiency in multi-organ, multi-modality 3D segmentation tasks across various clinical scenarios especially for resource-constrained and time-sensitive clinical environments.
- Abstract(参考訳): 深層学習は3次元医用画像のセグメンテーションタスクに広く応用されている。
しかし, 画像の多様性, データの高次元的性質, 解剖学的構造の不均一性などにより, 多臓器セグメンテーションにおけるセグメンテーション精度と計算効率の両立は依然として困難である。
本研究では,3次元医用画像セグメンテーションに特化して設計された軽量ネットワークアーキテクチャであるGPAFormerを提案する。
GPAFormerはMASA(Multi-scale attention-guided stacked aggregate)とMPGA(Multi-aware patch graph aggregator)という2つのコアモジュールを組み込んだ。
MASAは、異なる受容場を持つ3つの並列経路を利用し、様々な大きさの構造を扱う際のネットワークの能力を高めるために、平面アグリゲーションを通じて組み合わせた。
MPGAは、パッチ間の特徴的類似性と空間的隣接性に基づいて、類似した特徴分布を持つ領域を動的に集約するグラフ誘導手法を用いて、臓器の内部構造と境界構造の両方の識別を改善した。
BTCV、Synapse、ACDC、BraTSなど、一般の全身CTおよびMRIデータセットで実験を行った。
既存の3Dセグメンテーションネットワークと比較すると、GPAFormerはBTCV(75.70%)、Synapse(81.20%)、ACDC(89.32%)、BraTS(82.74%)で1.81Mのパラメータしか使用していない。
コンシューマレベルのGPUを使用すると、BTCVの1つのバリデーションケースの推論時間は1秒未満であった。
その結果, GPAFormerは, 資源制約, 時間感受性の異なる臨床環境において, 多臓器多様性3Dセグメンテーションタスクにおいて, 精度と効率のバランスをとっていた。
関連論文リスト
- Augmentation is AUtO-Net: Augmentation-Driven Contrastive Multiview
Learning for Medical Image Segmentation [3.1002416427168304]
この論文は網膜血管セグメンテーションの課題に焦点を当てている。
深層学習に基づく医用画像セグメンテーションアプローチの広範な文献レビューを提供する。
効率的でシンプルな多視点学習フレームワークを提案する。
論文 参考訳(メタデータ) (2023-11-02T06:31:08Z) - 3DSAM-adapter: Holistic adaptation of SAM from 2D to 3D for promptable tumor segmentation [52.699139151447945]
医用画像の領域分割を行うために, SAMを2次元から3次元に変換する新しい適応法を提案する。
本モデルでは, 腎腫瘍, 膵腫瘍, 大腸癌の3つのタスクのうち8.25%, 29.87%, 10.11%の3つのタスクにおいて, ドメイン・オブ・ザ・アーティヴ・メディカル・イメージ・セグメンテーション・モデルより優れ, 肝腫瘍セグメンテーションでも同様の性能が得られる。
論文 参考訳(メタデータ) (2023-06-23T12:09:52Z) - UNETR++: Delving into Efficient and Accurate 3D Medical Image Segmentation [93.88170217725805]
本稿では,高画質なセグメンテーションマスクと,パラメータ,計算コスト,推論速度の両面での効率性を提供するUNETR++という3次元医用画像セグメンテーション手法を提案する。
我々の設計の核となるのは、空間的およびチャネル的な識別的特徴を効率的に学習する、新しい効率的な対注意ブロック(EPA)の導入である。
Synapse, BTCV, ACDC, BRaTs, Decathlon-Lungの5つのベンチマークで評価した結果, 効率と精度の両面で, コントリビューションの有効性が示された。
論文 参考訳(メタデータ) (2022-12-08T18:59:57Z) - UNesT: Local Spatial Representation Learning with Hierarchical
Transformer for Efficient Medical Segmentation [29.287521185541298]
我々は、UNesTが常に最先端の性能を達成し、その一般化性とデータ効率を評価することを示す。
我々は、UNesTが常に最先端の性能を達成し、その一般化性とデータ効率を評価することを示す。
論文 参考訳(メタデータ) (2022-09-28T19:14:38Z) - Two-Stream Graph Convolutional Network for Intra-oral Scanner Image
Segmentation [133.02190910009384]
本稿では,2ストリームグラフ畳み込みネットワーク(TSGCN)を提案する。
TSGCNは3次元歯(表面)セグメンテーションにおいて最先端の方法よりも優れています。
論文 参考訳(メタデータ) (2022-04-19T10:41:09Z) - Multi-organ Segmentation Network with Adversarial Performance Validator [10.775440368500416]
本稿では,2次元から3次元のセグメンテーションフレームワークに対向的な性能検証ネットワークを導入する。
提案したネットワークは, 2次元粗い結果から3次元高品質なセグメンテーションマスクへの変換を行い, 共同最適化によりセグメンテーション精度が向上する。
NIH膵分節データセットの実験では、提案したネットワークが小臓器分節の最先端の精度を達成し、過去の最高性能を上回った。
論文 参考訳(メタデータ) (2022-04-16T18:00:29Z) - Few-shot image segmentation for cross-institution male pelvic organs
using registration-assisted prototypical learning [13.567073992605797]
本研究は,医用画像のための最初の3D画像間セグメンテーションネットワークを提案する。
興味のある8つの領域を持つ前立腺がん患者のラベル付き多施設データセットを使用する。
内蔵登録機構は、被験者間の一貫性のある解剖学の事前知識を効果的に活用することができる。
論文 参考訳(メタデータ) (2022-01-17T11:44:10Z) - Automatic size and pose homogenization with spatial transformer network
to improve and accelerate pediatric segmentation [51.916106055115755]
空間変換器ネットワーク(STN)を利用することにより、ポーズとスケール不変の新たなCNNアーキテクチャを提案する。
私たちのアーキテクチャは、トレーニング中に一緒に見積もられる3つのシーケンシャルモジュールで構成されています。
腹部CTスキャナーを用いた腎および腎腫瘍の分節法について検討した。
論文 参考訳(メタデータ) (2021-07-06T14:50:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。