論文の概要: EGE-UNet: an Efficient Group Enhanced UNet for skin lesion segmentation
- arxiv url: http://arxiv.org/abs/2307.08473v1
- Date: Mon, 17 Jul 2023 13:28:58 GMT
- ステータス: 処理完了
- システム内更新日: 2023-07-18 13:16:09.179822
- Title: EGE-UNet: an Efficient Group Enhanced UNet for skin lesion segmentation
- Title(参考訳): EGE-UNet:皮膚病変セグメンテーションのための効率的なグループ拡張UNet
- Authors: Jiacheng Ruan, Mingye Xie, Jingsheng Gao, Ting Liu, and Yuzhuo Fu
- Abstract要約: EGE-UNet(Efficient Group Enhanced UNet)は、医用画像のセグメンテーションにおいて、より効率的なアプローチである。
我々は,GHPA (Group multi-axis Hadamard Product Attention Module) とGAB (Group Aggregation Bridge Module) を軽量に組み込んだ。
本モデルでは,パラメータと計算コストをそれぞれ494xと160xに削減し,セグメンテーション性能を向上する。
- 参考スコア(独自算出の注目度): 10.781609227329321
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Transformer and its variants have been widely used for medical image
segmentation. However, the large number of parameter and computational load of
these models make them unsuitable for mobile health applications. To address
this issue, we propose a more efficient approach, the Efficient Group Enhanced
UNet (EGE-UNet). We incorporate a Group multi-axis Hadamard Product Attention
module (GHPA) and a Group Aggregation Bridge module (GAB) in a lightweight
manner. The GHPA groups input features and performs Hadamard Product Attention
mechanism (HPA) on different axes to extract pathological information from
diverse perspectives. The GAB effectively fuses multi-scale information by
grouping low-level features, high-level features, and a mask generated by the
decoder at each stage. Comprehensive experiments on the ISIC2017 and ISIC2018
datasets demonstrate that EGE-UNet outperforms existing state-of-the-art
methods. In short, compared to the TransFuse, our model achieves superior
segmentation performance while reducing parameter and computation costs by 494x
and 160x, respectively. Moreover, to our best knowledge, this is the first
model with a parameter count limited to just 50KB. Our code is available at
https://github.com/JCruan519/EGE-UNet.
- Abstract(参考訳): Transformerとその変種は医療画像のセグメンテーションに広く使われている。
しかし、これらのモデルの多くのパラメータと計算負荷は、モバイルの健康アプリケーションには不向きである。
この問題に対処するために、より効率的なアプローチとして、EGE-UNet(Efficient Group Enhanced UNet)を提案する。
我々は,GHPA (Group multi-axis Hadamard Product Attention Module) とGAB (Group Aggregation Bridge Module) を軽量に組み込んだ。
GHPAは、様々な視点から病理情報を抽出するために、異なる軸にアダマール製品注意機構(HPA)を入力し、実行する。
GABは、各ステージでデコーダによって生成された低レベル特徴、高レベル特徴、マスクをグループ化することにより、マルチスケール情報を効果的に融合する。
ISIC2017とISIC2018データセットに関する包括的な実験は、EGE-UNetが既存の最先端の手法より優れていることを示した。
要するに、TransFuseと比較して、パラメータと計算コストをそれぞれ494xと160xに削減しながら、より優れたセグメンテーション性能を実現する。
さらに、私たちの知る限りでは、パラメータ数が50KBに制限された最初のモデルです。
私たちのコードはhttps://github.com/JCruan519/EGE-UNetで公開されています。
関連論文リスト
- Bridge the Points: Graph-based Few-shot Segment Anything Semantically [79.1519244940518]
プレトレーニング技術の最近の進歩により、視覚基礎モデルの能力が向上した。
最近の研究はSAMをFew-shot Semantic segmentation (FSS)に拡張している。
本稿では,グラフ解析に基づく簡易かつ効果的な手法を提案する。
論文 参考訳(メタデータ) (2024-10-09T15:02:28Z) - Prompting Segment Anything Model with Domain-Adaptive Prototype for Generalizable Medical Image Segmentation [49.5901368256326]
医用画像のセグメンテーションにおけるセグメンテーションモデル(DAPSAM)の微調整のための新しいドメイン適応型プロンプトフレームワークを提案する。
DAPSAMは,2つの医療画像分割タスクにおいて,異なるモダリティで最先端のパフォーマンスを実現する。
論文 参考訳(メタデータ) (2024-09-19T07:28:33Z) - ASPS: Augmented Segment Anything Model for Polyp Segmentation [77.25557224490075]
SAM(Segment Anything Model)は、ポリープセグメンテーションに先例のないポテンシャルを導入している。
SAMのTransformerベースの構造は、グローバルおよび低周波情報を優先する。
CFAはトレーニング可能なCNNエンコーダブランチと凍結したViTエンコーダを統合し、ドメイン固有の知識の統合を可能にする。
論文 参考訳(メタデータ) (2024-06-30T14:55:32Z) - GLIMS: Attention-Guided Lightweight Multi-Scale Hybrid Network for Volumetric Semantic Segmentation [0.9897828700959131]
我々はGLIMSと呼ばれるデータ効率の高い注意誘導型ハイブリッドボリュームセグメンテーションネットワークを開発した。
GLIMSは、細かな境界セグメンテーションのための表現的特徴をローカライズするために、Channel and Space-Wise Attention Blocks (CSAB)を通して注意誘導セグメンテーションアプローチを採用している。
GLIMSはBraTS2021とBTCVデータセットで優れた性能を示し、Swin UNETRのパフォーマンスを上回った。
論文 参考訳(メタデータ) (2024-04-27T10:18:55Z) - GRA: Detecting Oriented Objects through Group-wise Rotating and Attention [64.21917568525764]
GRA(Group-wise Rotating and Attention)モジュールは、オブジェクト指向オブジェクト検出のためのバックボーンネットワークにおける畳み込み操作を置き換えるために提案されている。
GRAは、グループワイド回転(Group-wise Rotating)とグループワイド注意(Group-wise Attention)という2つの重要なコンポーネントを含む、さまざまな向きのオブジェクトのきめ細かい特徴を適応的にキャプチャすることができる。
GRAはDOTA-v2.0ベンチマークで新しい最先端(SOTA)を実現し、以前のSOTA法と比較してパラメータを50%近く削減した。
論文 参考訳(メタデータ) (2024-03-17T07:29:32Z) - Parameter Efficient Fine-tuning via Cross Block Orchestration for Segment Anything Model [81.55141188169621]
PEFTにクロスブロックオーケストレーション機構を組み、SAM(Segment Anything Model)の様々な下流シナリオへの適応を可能にする。
本稿では,超複素層から重みが生じる線形射影ヘッドを導入するブロック内拡張モジュールを提案する。
提案手法は,約1Kのパラメータのみを付加した新規シナリオにおいて,セグメンテーション性能を大幅に向上させる。
論文 参考訳(メタデータ) (2023-11-28T11:23:34Z) - Efficient Remote Sensing Segmentation With Generative Adversarial
Transformer [5.728847418491545]
本稿では,高精度なセマンティックセマンティックセグメンテーションを実現するためのGATrans(Generative Adversarial Transfomer)を提案する。
このフレームワークはGTNet(Global Transformer Network)をジェネレータとして利用し、マルチレベル機能を効率的に抽出する。
ベイヒンゲンデータセットの広範囲な実験により、我々のアプローチの有効性を検証し、平均F1スコアは90.17%、総合精度は91.92%に達した。
論文 参考訳(メタデータ) (2023-10-02T15:46:59Z) - Edge-aware Feature Aggregation Network for Polyp Segmentation [40.3881565207086]
本研究では,ポリプセグメンテーションのためのエッジ対応特徴集約ネットワーク(EFA-Net)を提案する。
EFA-Netは、ポリプセグメンテーションの性能を高めるために、クロスレベルとマルチスケールの機能を完全に活用することができる。
広く採用されている5つの大腸内視鏡データセットの実験結果から,我々のEFA-Netは,一般化と有効性の観点から,最先端のポリプセグメンテーション法より優れていることが示された。
論文 参考訳(メタデータ) (2023-09-19T11:09:38Z) - GPViT: A High Resolution Non-Hierarchical Vision Transformer with Group
Propagation [25.689520892609213]
本稿では,高分解能特徴を持つ一般視覚認識のための新しい非階層型トランスフォーマーモデルを提案する。
画像分類,セマンティックセグメンテーション,オブジェクト検出,インスタンスセグメンテーションなど,さまざまな視覚的タスクにおけるGPViTの評価を行った。
論文 参考訳(メタデータ) (2022-12-13T18:26:00Z) - MALUNet: A Multi-Attention and Light-weight UNet for Skin Lesion
Segmentation [13.456935850832565]
そこで本研究では,皮膚病変のセグメンテーションにおいて,パラメータと計算複雑性の最小コストで競合性能を実現する軽量モデルを提案する。
我々は、4つのモジュールをU字型アーキテクチャと組み合わせ、MALUNetと呼ばれる軽量な医用画像分割モデルを得る。
UNetと比較して、我々のモデルはmIoUとDSCのメトリクスをそれぞれ2.39%、1.49%改善し、パラメータ数と計算複雑性の44倍と166倍削減した。
論文 参考訳(メタデータ) (2022-11-03T13:19:22Z) - GSTO: Gated Scale-Transfer Operation for Multi-Scale Feature Learning in
Pixel Labeling [92.90448357454274]
本稿では,空間教師付き機能を他のスケールに適切に移行するためのGated Scale-Transfer Operation (GSTO)を提案する。
GSTOをHRNetにプラグインすることで、ピクセルラベリングの強力なバックボーンが得られます。
実験の結果,GSTOはマルチスケール機能アグリゲーションモジュールの性能を大幅に向上させることができることがわかった。
論文 参考訳(メタデータ) (2020-05-27T13:46:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。