論文の概要: GLIMS: Attention-Guided Lightweight Multi-Scale Hybrid Network for Volumetric Semantic Segmentation
- arxiv url: http://arxiv.org/abs/2404.17854v1
- Date: Sat, 27 Apr 2024 10:18:55 GMT
- ステータス: 処理完了
- システム内更新日: 2024-04-30 19:01:27.405338
- Title: GLIMS: Attention-Guided Lightweight Multi-Scale Hybrid Network for Volumetric Semantic Segmentation
- Title(参考訳): GLIMS: ボリュームセマンティックセマンティックセグメンテーションのためのアテンションガイド型軽量マルチスケールハイブリッドネットワーク
- Authors: Ziya Ata Yazıcı, İlkay Öksüz, Hazım Kemal Ekenel,
- Abstract要約: 我々はGLIMSと呼ばれるデータ効率の高い注意誘導型ハイブリッドボリュームセグメンテーションネットワークを開発した。
GLIMSは、細かな境界セグメンテーションのための表現的特徴をローカライズするために、Channel and Space-Wise Attention Blocks (CSAB)を通して注意誘導セグメンテーションアプローチを採用している。
GLIMSはBraTS2021とBTCVデータセットで優れた性能を示し、Swin UNETRのパフォーマンスを上回った。
- 参考スコア(独自算出の注目度): 0.9897828700959131
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Convolutional Neural Networks (CNNs) have become widely adopted for medical image segmentation tasks, demonstrating promising performance. However, the inherent inductive biases in convolutional architectures limit their ability to model long-range dependencies and spatial correlations. While recent transformer-based architectures address these limitations by leveraging self-attention mechanisms to encode long-range dependencies and learn expressive representations, they often struggle to extract low-level features and are highly dependent on data availability. This motivated us for the development of GLIMS, a data-efficient attention-guided hybrid volumetric segmentation network. GLIMS utilizes Dilated Feature Aggregator Convolutional Blocks (DACB) to capture local-global feature correlations efficiently. Furthermore, the incorporated Swin Transformer-based bottleneck bridges the local and global features to improve the robustness of the model. Additionally, GLIMS employs an attention-guided segmentation approach through Channel and Spatial-Wise Attention Blocks (CSAB) to localize expressive features for fine-grained border segmentation. Quantitative and qualitative results on glioblastoma and multi-organ CT segmentation tasks demonstrate GLIMS' effectiveness in terms of complexity and accuracy. GLIMS demonstrated outstanding performance on BraTS2021 and BTCV datasets, surpassing the performance of Swin UNETR. Notably, GLIMS achieved this high performance with a significantly reduced number of trainable parameters. Specifically, GLIMS has 47.16M trainable parameters and 72.30G FLOPs, while Swin UNETR has 61.98M trainable parameters and 394.84G FLOPs. The code is publicly available on https://github.com/yaziciz/GLIMS.
- Abstract(参考訳): 畳み込みニューラルネットワーク(CNN)は医用画像分割タスクに広く採用され、有望な性能を示している。
しかし、畳み込みアーキテクチャの固有の帰納バイアスは、長距離依存と空間的相関をモデル化する能力を制限する。
最近のトランスフォーマーベースのアーキテクチャは、長距離依存関係をエンコードして表現表現を学ぶための自己認識メカニズムを活用することでこれらの制限に対処しているが、低レベルの機能を引き出すのに苦労し、データ可用性に大きく依存することが多い。
これは、データ効率の高い注意誘導型ハイブリッドボリュームセグメンテーションネットワークであるGLIMSの開発の動機となった。
GLIMSは、Dilated Feature Aggregator Convolutional Blocks (DACB) を用いて、局所的な特徴相関を効率的にキャプチャする。
さらに、組み込まれたSwin Transformerベースのボトルネックは、局所的およびグローバル的特徴をブリッジし、モデルの堅牢性を改善する。
さらに、GLIMSは、細かな境界セグメンテーションのための表現的特徴をローカライズするために、Channel and Space-Wise Attention Blocks (CSAB)を通して注意誘導セグメンテーションアプローチを採用している。
グリオ芽腫と多臓器CTの分画タスクの定量的および質的結果は、GLIMSの有効性を複雑さと正確性の観点から示している。
GLIMSはBraTS2021とBTCVデータセットで優れた性能を示し、Swin UNETRのパフォーマンスを上回った。
特に、GLIMSはこの高い性能を達成し、トレーニング可能なパラメータの数を大幅に削減した。
具体的には、GLIMSは47.16Mのトレーニング可能なパラメータと72.30GのFLOPを持ち、Swin UNETRは61.98Mのトレーニング可能なパラメータと394.84GのFLOPを持つ。
コードはhttps://github.com/yaziciz/GLIMSで公開されている。
関連論文リスト
- A Study on the Performance of U-Net Modifications in Retroperitoneal Tumor Segmentation [45.39707664801522]
後腹膜には、稀な良性および悪性型を含む様々な腫瘍があり、診断と治療の課題を引き起こす。
腫瘍径の推定は不規則な形状のため困難であり,手動分割は時間を要する。
本研究は,CNN,ViT,Mamba,xLSTMなどのU-Net拡張を,新しい社内CTデータセットと公開臓器セグメンテーションデータセットに基づいて評価する。
論文 参考訳(メタデータ) (2025-02-01T04:25:28Z) - Adaptive Clustering for Efficient Phenotype Segmentation of UAV Hyperspectral Data [1.6135226672466307]
無人航空機 (UAV) とハイパースペクトルイメージング (HSI) が組み合わさって、環境および農業用途の可能性を秘めている。
本稿では,リアルタイムツリー表現型セグメンテーションのためのオンラインハイパースペクトル簡易線形反復クラスタリングアルゴリズム(OHSLIC)を提案する。
論文 参考訳(メタデータ) (2025-01-17T13:48:04Z) - Multi-Level Embedding and Alignment Network with Consistency and Invariance Learning for Cross-View Geo-Localization [2.733505168507872]
CVGL(Cross-View Geo-Localization)は、最もよく似たGPSタグ付き衛星画像を取得することで、ドローン画像のローカライゼーションを決定する。
既存の手法は、モデルの性能を改善する際に、計算と記憶の要求が増大する問題をしばしば見落としている。
マルチレベル・エンベディング・アライメント・ネットワーク(MEAN)と呼ばれる軽量なアライメント・ネットワークを提案する。
論文 参考訳(メタデータ) (2024-12-19T13:10:38Z) - SHERL: Synthesizing High Accuracy and Efficient Memory for Resource-Limited Transfer Learning [63.93193829913252]
本稿では,リソース制限シナリオに対するSHERLと呼ばれる革新的なMETL戦略を提案する。
初期経路では、中間出力は反冗長動作によって統合される。
遅延ルートでは、最小限の遅延事前トレーニングされたレイヤを利用することで、メモリオーバーヘッドのピーク需要を軽減できる。
論文 参考訳(メタデータ) (2024-07-10T10:22:35Z) - ELGC-Net: Efficient Local-Global Context Aggregation for Remote Sensing Change Detection [65.59969454655996]
本稿では,変化領域を正確に推定するために,リッチな文脈情報を利用する効率的な変化検出フレームワークELGC-Netを提案する。
提案するELGC-Netは、リモートセンシング変更検出ベンチマークにおいて、最先端の性能を新たに設定する。
また,ELGC-Net-LWも導入した。
論文 参考訳(メタデータ) (2024-03-26T17:46:25Z) - Heterogenous Memory Augmented Neural Networks [84.29338268789684]
ニューラルネットワークのための新しいヘテロジニアスメモリ拡張手法を提案する。
学習可能なメモリトークンをアテンション機構付きで導入することにより、膨大な計算オーバーヘッドを伴わずに性能を効果的に向上させることができる。
In-distriion (ID) と Out-of-distriion (OOD) の両方の条件下での様々な画像およびグラフベースのタスクに対するアプローチを示す。
論文 参考訳(メタデータ) (2023-10-17T01:05:28Z) - EGE-UNet: an Efficient Group Enhanced UNet for skin lesion segmentation [10.781609227329321]
EGE-UNet(Efficient Group Enhanced UNet)は、医用画像のセグメンテーションにおいて、より効率的なアプローチである。
我々は,GHPA (Group multi-axis Hadamard Product Attention Module) とGAB (Group Aggregation Bridge Module) を軽量に組み込んだ。
本モデルでは,パラメータと計算コストをそれぞれ494xと160xに削減し,セグメンテーション性能を向上する。
論文 参考訳(メタデータ) (2023-07-17T13:28:58Z) - Efficient Long Sequence Modeling via State Space Augmented Transformer [92.74707853711374]
我々はSPADE($underlinetextbfS$tate sunderlinetextbfP$ace)を提案する。
我々は,SPADEの底層にSSMを付加し,他の層に対して効率的な局所的注意法を適用した。
Long Range Arenaベンチマークと言語モデリングタスクの実験結果から,提案手法の有効性が示された。
論文 参考訳(メタデータ) (2022-12-15T20:51:27Z) - UNETR++: Delving into Efficient and Accurate 3D Medical Image Segmentation [93.88170217725805]
本稿では,高画質なセグメンテーションマスクと,パラメータ,計算コスト,推論速度の両面での効率性を提供するUNETR++という3次元医用画像セグメンテーション手法を提案する。
我々の設計の核となるのは、空間的およびチャネル的な識別的特徴を効率的に学習する、新しい効率的な対注意ブロック(EPA)の導入である。
Synapse, BTCV, ACDC, BRaTs, Decathlon-Lungの5つのベンチマークで評価した結果, 効率と精度の両面で, コントリビューションの有効性が示された。
論文 参考訳(メタデータ) (2022-12-08T18:59:57Z) - GMLP: Building Scalable and Flexible Graph Neural Networks with
Feature-Message Passing [16.683813354137254]
Graph Multi-layer Perceptron (GMLP)は、ニューラルアップデートとメッセージパッシングを分離する。
11のベンチマークデータセットに対して広範な評価を行う。
論文 参考訳(メタデータ) (2021-04-20T10:19:21Z) - GSTO: Gated Scale-Transfer Operation for Multi-Scale Feature Learning in
Pixel Labeling [92.90448357454274]
本稿では,空間教師付き機能を他のスケールに適切に移行するためのGated Scale-Transfer Operation (GSTO)を提案する。
GSTOをHRNetにプラグインすることで、ピクセルラベリングの強力なバックボーンが得られます。
実験の結果,GSTOはマルチスケール機能アグリゲーションモジュールの性能を大幅に向上させることができることがわかった。
論文 参考訳(メタデータ) (2020-05-27T13:46:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。