論文の概要: MCANet: Medical Image Segmentation with Multi-Scale Cross-Axis Attention
- arxiv url: http://arxiv.org/abs/2312.08866v1
- Date: Thu, 14 Dec 2023 12:41:08 GMT
- ステータス: 処理完了
- システム内更新日: 2023-12-15 22:37:17.936242
- Title: MCANet: Medical Image Segmentation with Multi-Scale Cross-Axis Attention
- Title(参考訳): MCANet:マルチスケールクロス軸注意による医用画像セグメンテーション
- Authors: Hao Shao, Quansheng Zeng, Qibin Hou, Jufeng Yang
- Abstract要約: 本稿では,効率的な軸方向注意に基づく課題を解決するために,マルチスケールクロス軸注意(MCA)を提案する。
我々は MSCAN のバックボーン上に MCA を構築し,そのネットワークを MCANet と呼ぶ。
MCANetは4M以上のパラメータしか持たないので、従来の重いバックボーンを使った作業よりもパフォーマンスが良くなります。
- 参考スコア(独自算出の注目度): 42.50656131761277
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Efficiently capturing multi-scale information and building long-range
dependencies among pixels are essential for medical image segmentation because
of the various sizes and shapes of the lesion regions or organs. In this paper,
we present Multi-scale Cross-axis Attention (MCA) to solve the above
challenging issues based on the efficient axial attention. Instead of simply
connecting axial attention along the horizontal and vertical directions
sequentially, we propose to calculate dual cross attentions between two
parallel axial attentions to capture global information better. To process the
significant variations of lesion regions or organs in individual sizes and
shapes, we also use multiple convolutions of strip-shape kernels with different
kernel sizes in each axial attention path to improve the efficiency of the
proposed MCA in encoding spatial information. We build the proposed MCA upon
the MSCAN backbone, yielding our network, termed MCANet. Our MCANet with only
4M+ parameters performs even better than most previous works with heavy
backbones (e.g., Swin Transformer) on four challenging tasks, including skin
lesion segmentation, nuclei segmentation, abdominal multi-organ segmentation,
and polyp segmentation. Code is available at https:// github.com/ haoshao-nku/
medical seg.git.
- Abstract(参考訳): 病変領域や臓器の大きさや形状が異なるため,多次元情報を効率的に捉え,画素間の長距離依存性を構築することは医用画像分割に不可欠である。
本稿では,効率的な軸方向注意に基づく課題を解決するために,MCA(Multi-scale Cross-axis Attention)を提案する。
水平方向と垂直方向に沿って軸方向の注意を逐次接続する代わりに、2つの平行軸方向の注意間の二重交差を計算し、グローバル情報をよりよく捉えることを提案する。
個々の大きさや形状の病変領域や臓器の顕著な変化を処理するために,各軸方向の注意経路に異なるカーネルサイズを持つストリップ形状のカーネルの複数コンボリューションを用いて空間情報の符号化におけるMCAの効率を向上させる。
我々は MSCAN のバックボーン上に MCA を構築し,そのネットワークを MCANet と呼ぶ。
4M以上のパラメータしか持たないMCANetは、皮膚病変のセグメンテーション、核のセグメンテーション、腹腔多臓器のセグメンテーション、ポリープセグメンテーションを含む4つの課題において、より重いバックボーン(例えば、Swin Transformer)を使用する場合よりも、さらに優れている。
コードはhttps:// github.com/haoshao-nku/ medical seg.gitで入手できる。
関連論文リスト
- MSA$^2$Net: Multi-scale Adaptive Attention-guided Network for Medical Image Segmentation [8.404273502720136]
MSA$2$Netは、スキップ接続を適切に設計した新しいディープセグメンテーションフレームワークである。
本稿では,空間的特徴を選択的に強調するために,MASAG(Multi-Scale Adaptive Space Attention Gate)を提案する。
MSA$2$Netは、最先端のSOTA(State-of-the-art)よりも優れています。
論文 参考訳(メタデータ) (2024-07-31T14:41:10Z) - BEFUnet: A Hybrid CNN-Transformer Architecture for Precise Medical Image
Segmentation [0.0]
本稿では,医療画像の正確な分割のために,身体情報とエッジ情報の融合を強化するBEFUnetという,革新的なU字型ネットワークを提案する。
BEFUnetは、新しいローカル・クロス・アテンション・フィーチャー(LCAF)融合モジュール、新しいダブル・レベル・フュージョン(DLF)モジュール、デュアルブランチ・エンコーダの3つの主要モジュールから構成されている。
LCAFモジュールは、2つのモダリティの間に空間的に近接する特徴に対して、局所的な相互注意を選択的に行うことにより、エッジとボディの特徴を効率よく融合させる。
論文 参考訳(メタデータ) (2024-02-13T21:03:36Z) - BRAU-Net++: U-Shaped Hybrid CNN-Transformer Network for Medical Image Segmentation [11.986549780782724]
医用画像の正確な分割作業のために,BRAU-Net++ というハイブリッドで効果的な CNN-Transformer ネットワークを提案する。
具体的には、BRAU-Net++は、U字型エンコーダデコーダ構造を設計するために、コアビルディングブロックとしてバイレベルルーティングアテンションを使用する。
提案手法は,そのベースラインであるBRAU-Netを含む,最先端の手法を超越した手法である。
論文 参考訳(メタデータ) (2024-01-01T10:49:09Z) - Dual-scale Enhanced and Cross-generative Consistency Learning for Semi-supervised Medical Image Segmentation [49.57907601086494]
医用画像のセグメンテーションはコンピュータ支援診断において重要な役割を担っている。
半教師型医用画像(DEC-Seg)のための新しいDual-scale Enhanced and Cross-generative consistency learning frameworkを提案する。
論文 参考訳(メタデータ) (2023-12-26T12:56:31Z) - Scale-aware Super-resolution Network with Dual Affinity Learning for
Lesion Segmentation from Medical Images [50.76668288066681]
低解像度医用画像から様々な大きさの病変を適応的に分割する,スケールアウェアな超解像ネットワークを提案する。
提案するネットワークは,他の最先端手法と比較して一貫した改善を実現した。
論文 参考訳(メタデータ) (2023-05-30T14:25:55Z) - M$^{2}$SNet: Multi-scale in Multi-scale Subtraction Network for Medical
Image Segmentation [73.10707675345253]
医用画像から多様なセグメンテーションを仕上げるマルチスケールサブトラクションネットワーク(M$2$SNet)を提案する。
本手法は,4つの異なる医用画像セグメンテーションタスクの11つのデータセットに対して,異なる評価基準の下で,ほとんどの最先端手法に対して好意的に機能する。
論文 参考訳(メタデータ) (2023-03-20T06:26:49Z) - Self-Supervised Correction Learning for Semi-Supervised Biomedical Image
Segmentation [84.58210297703714]
半教師付きバイオメディカルイメージセグメンテーションのための自己教師付き補正学習パラダイムを提案する。
共有エンコーダと2つの独立デコーダを含むデュアルタスクネットワークを設計する。
異なるタスクのための3つの医用画像分割データセットの実験により,本手法の優れた性能が示された。
論文 参考訳(メタデータ) (2023-01-12T08:19:46Z) - Crosslink-Net: Double-branch Encoder Segmentation Network via Fusing
Vertical and Horizontal Convolutions [58.71117402626524]
医用画像分割のための新しいダブルブランチエンコーダアーキテクチャを提案する。
1)正方形畳み込みカーネルによる特徴の識別をさらに改善する必要があるため,非正方形および水平畳み込みカーネルの利用を提案する。
実験では,4つのデータセット上でのモデルの有効性を検証した。
論文 参考訳(メタデータ) (2021-07-24T02:58:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。