論文の概要: PMFSNet: Polarized Multi-scale Feature Self-attention Network For
Lightweight Medical Image Segmentation
- arxiv url: http://arxiv.org/abs/2401.07579v1
- Date: Mon, 15 Jan 2024 10:26:47 GMT
- ステータス: 処理完了
- システム内更新日: 2024-01-17 17:20:50.011400
- Title: PMFSNet: Polarized Multi-scale Feature Self-attention Network For
Lightweight Medical Image Segmentation
- Title(参考訳): PMFSNet:軽量医用画像分割のための多スケール機能自己注意ネットワーク
- Authors: Jiahui Zhong, Wenhong Tian, Yuanlun Xie, Zhijia Liu, Jie Ou, Taoran
Tian and Lei Zhang
- Abstract要約: 現在の最先端の医用画像分割法は精度を優先するが、計算要求の増大とより大きなモデルサイズを犠牲にすることも多い。
計算冗長性を避けつつグローバルな局所特徴処理のバランスをとる新しい医用画像分割モデルPMFSNetを提案する。
長期依存関係をキャプチャするために,アテンション機構に基づいたマルチスケール機能拡張モジュールであるPMFSブロックをプラグインとして組み込んでいる。
- 参考スコア(独自算出の注目度): 6.134314911212846
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Current state-of-the-art medical image segmentation methods prioritize
accuracy but often at the expense of increased computational demands and larger
model sizes. Applying these large-scale models to the relatively limited scale
of medical image datasets tends to induce redundant computation, complicating
the process without the necessary benefits. This approach not only adds
complexity but also presents challenges for the integration and deployment of
lightweight models on edge devices. For instance, recent transformer-based
models have excelled in 2D and 3D medical image segmentation due to their
extensive receptive fields and high parameter count. However, their
effectiveness comes with a risk of overfitting when applied to small datasets
and often neglects the vital inductive biases of Convolutional Neural Networks
(CNNs), essential for local feature representation. In this work, we propose
PMFSNet, a novel medical imaging segmentation model that effectively balances
global and local feature processing while avoiding the computational redundancy
typical in larger models. PMFSNet streamlines the UNet-based hierarchical
structure and simplifies the self-attention mechanism's computational
complexity, making it suitable for lightweight applications. It incorporates a
plug-and-play PMFS block, a multi-scale feature enhancement module based on
attention mechanisms, to capture long-term dependencies. Extensive
comprehensive results demonstrate that even with a model (less than 1 million
parameters), our method achieves superior performance in various segmentation
tasks across different data scales. It achieves (IoU) metrics of 84.68%,
82.02%, and 78.82% on public datasets of teeth CT (CBCT), ovarian tumors
ultrasound(MMOTU), and skin lesions dermoscopy images (ISIC 2018),
respectively. The source code is available at
https://github.com/yykzjh/PMFSNet.
- Abstract(参考訳): 現在の最先端の医用画像分割法は精度を優先するが、計算要求の増大とより大きなモデルサイズを犠牲にすることも多い。
これらの大規模モデルを比較的限られた医療画像データセットに適用すると、冗長な計算を誘導し、必要な利益なしにプロセスを複雑化する傾向がある。
このアプローチは複雑さを増すだけでなく、エッジデバイスへの軽量モデルの統合とデプロイにも課題をもたらす。
例えば、近年のトランスフォーマーベースモデルは、広範囲な受容場と高いパラメータ数のために、2次元および3次元の医用画像セグメンテーションに優れています。
しかし、その効果は小さなデータセットに適用した場合に過度に適合する危険性があり、しばしば局所的な特徴表現に不可欠な畳み込みニューラルネットワーク(CNN)の重要な帰納バイアスを無視する。
本研究では,大規模モデルに典型的な計算冗長性を回避しつつ,グローバルな特徴処理と局所的な特徴処理を効果的にバランスさせる新しい医用画像分割モデルPMFSNetを提案する。
PMFSNetはUNetベースの階層構造を合理化し、自己認識機構の計算複雑性を単純化し、軽量アプリケーションに適している。
長期依存関係をキャプチャするために,アテンション機構に基づいたマルチスケール機能拡張モジュールであるPMFSブロックをプラグインとして組み込んでいる。
広範囲にわたる結果から,モデル(100万パラメータ未満)であっても,様々なデータスケールのセグメンテーションタスクにおいて優れた性能が得られることが示された。
IoUは、歯科CT(CBCT)、卵巣腫瘍超音波(MMOTU)、皮膚病変の画像(ISIC 2018)の公的データセットの84.68%、82.02%、78.82%の計測値を達成している。
ソースコードはhttps://github.com/yykzjh/PMFSNetで入手できる。
関連論文リスト
- Prompting Segment Anything Model with Domain-Adaptive Prototype for Generalizable Medical Image Segmentation [49.5901368256326]
医用画像のセグメンテーションにおけるセグメンテーションモデル(DAPSAM)の微調整のための新しいドメイン適応型プロンプトフレームワークを提案する。
DAPSAMは,2つの医療画像分割タスクにおいて,異なるモダリティで最先端のパフォーマンスを実現する。
論文 参考訳(メタデータ) (2024-09-19T07:28:33Z) - MSVM-UNet: Multi-Scale Vision Mamba UNet for Medical Image Segmentation [3.64388407705261]
医用画像分割のためのマルチスケールビジョンマンバUNetモデルMSVM-UNetを提案する。
具体的には、VSSブロックにマルチスケールの畳み込みを導入することで、VMambaエンコーダの階層的特徴から、より効果的にマルチスケールの特徴表現をキャプチャし、集約することができる。
論文 参考訳(メタデータ) (2024-08-25T06:20:28Z) - GCtx-UNet: Efficient Network for Medical Image Segmentation [0.2353157426758003]
GCtx-UNetは軽量なセグメンテーションアーキテクチャで、最先端のアプローチよりも正確さでグローバルおよびローカルの画像特徴をキャプチャできる。
GCtx-UNetは、Synapseの多臓器腹部CTデータセット、ACDCの心臓MRIデータセット、およびいくつかのポリープセグメンテーションデータセットで評価される。
論文 参考訳(メタデータ) (2024-06-09T19:17:14Z) - Modality-agnostic Domain Generalizable Medical Image Segmentation by Multi-Frequency in Multi-Scale Attention [1.1155836879100416]
医用画像セグメンテーションのためのModality-Agnostic Domain Generalizable Network (MADGNet)を提案する。
MFMSAブロックは空間的特徴抽出の過程を洗練させる。
E-SDMは、深い監督を伴うマルチタスク学習における情報損失を軽減する。
論文 参考訳(メタデータ) (2024-05-10T07:34:36Z) - LiteNeXt: A Novel Lightweight ConvMixer-based Model with Self-embedding Representation Parallel for Medical Image Segmentation [2.0901574458380403]
医用画像分割のための軽量だが効率的な新しいモデル LiteNeXt を提案する。
LiteNeXtは、少量のパラメータ (0.71M) とギガ浮動小数点演算 (0.42) でスクラッチから訓練されている。
論文 参考訳(メタデータ) (2024-04-04T01:59:19Z) - Masked LoGoNet: Fast and Accurate 3D Image Analysis for Medical Domain [48.440691680864745]
我々はLoGoNetと呼ばれる新しいニューラルネットワークアーキテクチャを導入する。
LoGoNetは、LKA(Large Kernel Attention)とデュアルエンコーディング戦略を利用して、U字型アーキテクチャに新しい特徴抽出器を統合する。
大規模ラベル付きデータセットの欠如を補うために,3次元画像に適した新しいSSL方式を提案する。
論文 参考訳(メタデータ) (2024-02-09T05:06:58Z) - Rotated Multi-Scale Interaction Network for Referring Remote Sensing Image Segmentation [63.15257949821558]
Referring Remote Sensing Image (RRSIS)は、コンピュータビジョンと自然言語処理を組み合わせた新しい課題である。
従来の参照画像(RIS)アプローチは、空中画像に見られる複雑な空間スケールと向きによって妨げられている。
本稿ではRMSIN(Rotated Multi-Scale Interaction Network)を紹介する。
論文 参考訳(メタデータ) (2023-12-19T08:14:14Z) - Heterogenous Memory Augmented Neural Networks [84.29338268789684]
ニューラルネットワークのための新しいヘテロジニアスメモリ拡張手法を提案する。
学習可能なメモリトークンをアテンション機構付きで導入することにより、膨大な計算オーバーヘッドを伴わずに性能を効果的に向上させることができる。
In-distriion (ID) と Out-of-distriion (OOD) の両方の条件下での様々な画像およびグラフベースのタスクに対するアプローチを示す。
論文 参考訳(メタデータ) (2023-10-17T01:05:28Z) - Self-Supervised Neuron Segmentation with Multi-Agent Reinforcement
Learning [53.00683059396803]
マスク画像モデル(MIM)は,マスク画像から元の情報を復元する簡便さと有効性から広く利用されている。
本稿では、強化学習(RL)を利用して最適な画像マスキング比とマスキング戦略を自動検索する決定に基づくMIMを提案する。
本手法は,ニューロン分節の課題において,代替自己監督法に対して有意な優位性を有する。
論文 参考訳(メタデータ) (2023-10-06T10:40:46Z) - 3D Medical Image Segmentation based on multi-scale MPU-Net [5.393743755706745]
本稿では,患者のCT画像に対する腫瘍分割モデルMPU-Netを提案する。
グローバルアテンション機構を備えたTransformerにインスパイアされている。
ベンチマークモデルであるU-Netと比較して、MPU-Netは優れたセグメンテーション結果を示す。
論文 参考訳(メタデータ) (2023-07-11T20:46:19Z) - MISSU: 3D Medical Image Segmentation via Self-distilling TransUNet [55.16833099336073]
医用画像セグメンテーションのためのトランスフォーマーベースUNetを提案する。
グローバルな意味情報と局所的な空間的詳細特徴を同時に学習する。
MISSUは従来の最先端手法よりも優れた性能を発揮する。
論文 参考訳(メタデータ) (2022-06-02T07:38:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。