論文の概要: PMFSNet: Polarized Multi-scale Feature Self-attention Network For
Lightweight Medical Image Segmentation
- arxiv url: http://arxiv.org/abs/2401.07579v1
- Date: Mon, 15 Jan 2024 10:26:47 GMT
- ステータス: 処理完了
- システム内更新日: 2024-01-17 17:20:50.011400
- Title: PMFSNet: Polarized Multi-scale Feature Self-attention Network For
Lightweight Medical Image Segmentation
- Title(参考訳): PMFSNet:軽量医用画像分割のための多スケール機能自己注意ネットワーク
- Authors: Jiahui Zhong, Wenhong Tian, Yuanlun Xie, Zhijia Liu, Jie Ou, Taoran
Tian and Lei Zhang
- Abstract要約: 現在の最先端の医用画像分割法は精度を優先するが、計算要求の増大とより大きなモデルサイズを犠牲にすることも多い。
計算冗長性を避けつつグローバルな局所特徴処理のバランスをとる新しい医用画像分割モデルPMFSNetを提案する。
長期依存関係をキャプチャするために,アテンション機構に基づいたマルチスケール機能拡張モジュールであるPMFSブロックをプラグインとして組み込んでいる。
- 参考スコア(独自算出の注目度): 6.134314911212846
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Current state-of-the-art medical image segmentation methods prioritize
accuracy but often at the expense of increased computational demands and larger
model sizes. Applying these large-scale models to the relatively limited scale
of medical image datasets tends to induce redundant computation, complicating
the process without the necessary benefits. This approach not only adds
complexity but also presents challenges for the integration and deployment of
lightweight models on edge devices. For instance, recent transformer-based
models have excelled in 2D and 3D medical image segmentation due to their
extensive receptive fields and high parameter count. However, their
effectiveness comes with a risk of overfitting when applied to small datasets
and often neglects the vital inductive biases of Convolutional Neural Networks
(CNNs), essential for local feature representation. In this work, we propose
PMFSNet, a novel medical imaging segmentation model that effectively balances
global and local feature processing while avoiding the computational redundancy
typical in larger models. PMFSNet streamlines the UNet-based hierarchical
structure and simplifies the self-attention mechanism's computational
complexity, making it suitable for lightweight applications. It incorporates a
plug-and-play PMFS block, a multi-scale feature enhancement module based on
attention mechanisms, to capture long-term dependencies. Extensive
comprehensive results demonstrate that even with a model (less than 1 million
parameters), our method achieves superior performance in various segmentation
tasks across different data scales. It achieves (IoU) metrics of 84.68%,
82.02%, and 78.82% on public datasets of teeth CT (CBCT), ovarian tumors
ultrasound(MMOTU), and skin lesions dermoscopy images (ISIC 2018),
respectively. The source code is available at
https://github.com/yykzjh/PMFSNet.
- Abstract(参考訳): 現在の最先端の医用画像分割法は精度を優先するが、計算要求の増大とより大きなモデルサイズを犠牲にすることも多い。
これらの大規模モデルを比較的限られた医療画像データセットに適用すると、冗長な計算を誘導し、必要な利益なしにプロセスを複雑化する傾向がある。
このアプローチは複雑さを増すだけでなく、エッジデバイスへの軽量モデルの統合とデプロイにも課題をもたらす。
例えば、近年のトランスフォーマーベースモデルは、広範囲な受容場と高いパラメータ数のために、2次元および3次元の医用画像セグメンテーションに優れています。
しかし、その効果は小さなデータセットに適用した場合に過度に適合する危険性があり、しばしば局所的な特徴表現に不可欠な畳み込みニューラルネットワーク(CNN)の重要な帰納バイアスを無視する。
本研究では,大規模モデルに典型的な計算冗長性を回避しつつ,グローバルな特徴処理と局所的な特徴処理を効果的にバランスさせる新しい医用画像分割モデルPMFSNetを提案する。
PMFSNetはUNetベースの階層構造を合理化し、自己認識機構の計算複雑性を単純化し、軽量アプリケーションに適している。
長期依存関係をキャプチャするために,アテンション機構に基づいたマルチスケール機能拡張モジュールであるPMFSブロックをプラグインとして組み込んでいる。
広範囲にわたる結果から,モデル(100万パラメータ未満)であっても,様々なデータスケールのセグメンテーションタスクにおいて優れた性能が得られることが示された。
IoUは、歯科CT(CBCT)、卵巣腫瘍超音波(MMOTU)、皮膚病変の画像(ISIC 2018)の公的データセットの84.68%、82.02%、78.82%の計測値を達成している。
ソースコードはhttps://github.com/yykzjh/PMFSNetで入手できる。
関連論文リスト
- Masked LoGoNet: Fast and Accurate 3D Image Analysis for Medical Domain [48.440691680864745]
我々はLoGoNetと呼ばれる新しいニューラルネットワークアーキテクチャを導入する。
LoGoNetは、LKA(Large Kernel Attention)とデュアルエンコーディング戦略を利用して、U字型アーキテクチャに新しい特徴抽出器を統合する。
大規模ラベル付きデータセットの欠如を補うために,3次元画像に適した新しいSSL方式を提案する。
論文 参考訳(メタデータ) (2024-02-09T05:06:58Z) - Leveraging Frequency Domain Learning in 3D Vessel Segmentation [50.54833091336862]
本研究では,Fourier領域学習を3次元階層分割モデルにおけるマルチスケール畳み込みカーネルの代用として活用する。
管状血管分割作業において,新しいネットワークは顕著なサイス性能(ASACA500が84.37%,ImageCASが80.32%)を示した。
論文 参考訳(メタデータ) (2024-01-11T19:07:58Z) - Rotated Multi-Scale Interaction Network for Referring Remote Sensing
Image Segmentation [66.31941110777734]
Referring Remote Sensing Image (RRSIS)は、コンピュータビジョンと自然言語処理を組み合わせた新しい課題である。
従来の参照画像(RIS)アプローチは、空中画像に見られる複雑な空間スケールと向きによって妨げられている。
本稿ではRMSIN(Rotated Multi-Scale Interaction Network)を紹介する。
論文 参考訳(メタデータ) (2023-12-19T08:14:14Z) - Heterogenous Memory Augmented Neural Networks [84.29338268789684]
ニューラルネットワークのための新しいヘテロジニアスメモリ拡張手法を提案する。
学習可能なメモリトークンをアテンション機構付きで導入することにより、膨大な計算オーバーヘッドを伴わずに性能を効果的に向上させることができる。
In-distriion (ID) と Out-of-distriion (OOD) の両方の条件下での様々な画像およびグラフベースのタスクに対するアプローチを示す。
論文 参考訳(メタデータ) (2023-10-17T01:05:28Z) - SeUNet-Trans: A Simple yet Effective UNet-Transformer Model for Medical
Image Segmentation [0.0]
医用画像セグメンテーションのためのシンプルなUNet-Transformer(seUNet-Trans)モデルを提案する。
提案手法では,UNetモデルを特徴抽出器として設計し,入力画像から複数の特徴マップを生成する。
UNetアーキテクチャと自己認識機構を活用することで、我々のモデルはローカルとグローバルの両方のコンテキスト情報を保存するだけでなく、入力要素間の長距離依存関係をキャプチャできる。
論文 参考訳(メタデータ) (2023-10-16T01:13:38Z) - Self-Supervised Neuron Segmentation with Multi-Agent Reinforcement
Learning [53.00683059396803]
マスク画像モデル(MIM)は,マスク画像から元の情報を復元する簡便さと有効性から広く利用されている。
本稿では、強化学習(RL)を利用して最適な画像マスキング比とマスキング戦略を自動検索する決定に基づくMIMを提案する。
本手法は,ニューロン分節の課題において,代替自己監督法に対して有意な優位性を有する。
論文 参考訳(メタデータ) (2023-10-06T10:40:46Z) - 3D Medical Image Segmentation based on multi-scale MPU-Net [5.393743755706745]
本稿では,患者のCT画像に対する腫瘍分割モデルMPU-Netを提案する。
グローバルアテンション機構を備えたTransformerにインスパイアされている。
ベンチマークモデルであるU-Netと比較して、MPU-Netは優れたセグメンテーション結果を示す。
論文 参考訳(メタデータ) (2023-07-11T20:46:19Z) - MALUNet: A Multi-Attention and Light-weight UNet for Skin Lesion
Segmentation [13.456935850832565]
そこで本研究では,皮膚病変のセグメンテーションにおいて,パラメータと計算複雑性の最小コストで競合性能を実現する軽量モデルを提案する。
我々は、4つのモジュールをU字型アーキテクチャと組み合わせ、MALUNetと呼ばれる軽量な医用画像分割モデルを得る。
UNetと比較して、我々のモデルはmIoUとDSCのメトリクスをそれぞれ2.39%、1.49%改善し、パラメータ数と計算複雑性の44倍と166倍削減した。
論文 参考訳(メタデータ) (2022-11-03T13:19:22Z) - HiFuse: Hierarchical Multi-Scale Feature Fusion Network for Medical
Image Classification [16.455887856811465]
本稿では,医用画像分類のためのHiFuseと呼ばれる3分岐階層型マルチスケール機能融合ネットワーク構造を提案する。
提案したISICデータセットの精度はベースラインより7.6%高く、Covid-19データセットは21.5%、Kvasirデータセットは10.4%である。
論文 参考訳(メタデータ) (2022-09-21T09:30:20Z) - MISSU: 3D Medical Image Segmentation via Self-distilling TransUNet [55.16833099336073]
医用画像セグメンテーションのためのトランスフォーマーベースUNetを提案する。
グローバルな意味情報と局所的な空間的詳細特徴を同時に学習する。
MISSUは従来の最先端手法よりも優れた性能を発揮する。
論文 参考訳(メタデータ) (2022-06-02T07:38:53Z) - Realistic Adversarial Data Augmentation for MR Image Segmentation [17.951034264146138]
医用画像セグメンテーションのためのニューラルネットワークのトレーニングのための逆データ拡張手法を提案する。
このモデルでは,MR画像における共通の種類のアーチファクトによって生じる強度不均一性,すなわちバイアス場をモデル化する。
このような手法により,モデルの一般化と堅牢性の向上が図られ,低データシナリオにおける大幅な改善が期待できる。
論文 参考訳(メタデータ) (2020-06-23T20:43:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。