論文の概要: ESDMR-Net: A Lightweight Network With Expand-Squeeze and Dual Multiscale
Residual Connections for Medical Image Segmentation
- arxiv url: http://arxiv.org/abs/2312.10585v1
- Date: Sun, 17 Dec 2023 02:15:49 GMT
- ステータス: 処理完了
- システム内更新日: 2023-12-19 15:43:51.891287
- Title: ESDMR-Net: A Lightweight Network With Expand-Squeeze and Dual Multiscale
Residual Connections for Medical Image Segmentation
- Title(参考訳): ESDMR-Net:医療画像セグメンテーションのための拡張スクイーズとデュアルマルチスケール残差接続による軽量ネットワーク
- Authors: Tariq M Khan, Syed S. Naqvi, Erik Meijering
- Abstract要約: 本稿では,拡張型マルチスケール残差ネットワーク(ESDMR-Net)を提案する。
完全な畳み込みネットワークであり、モバイルデバイスのようなリソースに制約のあるコンピューティングハードウェアに適している。
5つの異なる応用例から7つのデータセットについて実験を行った。
- 参考スコア(独自算出の注目度): 7.921517156237902
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Segmentation is an important task in a wide range of computer vision
applications, including medical image analysis. Recent years have seen an
increase in the complexity of medical image segmentation approaches based on
sophisticated convolutional neural network architectures. This progress has led
to incremental enhancements in performance on widely recognised benchmark
datasets. However, most of the existing approaches are computationally
demanding, which limits their practical applicability. This paper presents an
expand-squeeze dual multiscale residual network (ESDMR-Net), which is a fully
convolutional network that is particularly well-suited for resource-constrained
computing hardware such as mobile devices. ESDMR-Net focuses on extracting
multiscale features, enabling the learning of contextual dependencies among
semantically distinct features. The ESDMR-Net architecture allows dual-stream
information flow within encoder-decoder pairs. The expansion operation
(depthwise separable convolution) makes all of the rich features with
multiscale information available to the squeeze operation (bottleneck layer),
which then extracts the necessary information for the segmentation task. The
Expand-Squeeze (ES) block helps the network pay more attention to
under-represented classes, which contributes to improved segmentation accuracy.
To enhance the flow of information across multiple resolutions or scales, we
integrated dual multiscale residual (DMR) blocks into the skip connection. This
integration enables the decoder to access features from various levels of
abstraction, ultimately resulting in more comprehensive feature
representations. We present experiments on seven datasets from five distinct
examples of applications. Our model achieved the best results despite having
significantly fewer trainable parameters, with a reduction of two or even three
orders of magnitude.
- Abstract(参考訳): セグメンテーションは、医療画像分析を含む幅広いコンピュータビジョンアプリケーションにおいて重要なタスクである。
近年、複雑な畳み込みニューラルネットワークアーキテクチャに基づく医用画像分割アプローチの複雑さが増大している。
この進歩は、広く認識されたベンチマークデータセットのパフォーマンスの段階的な向上につながった。
しかし、既存のアプローチのほとんどは計算上必要であり、実用的適用性は制限されている。
本稿では,モバイル機器などのリソース制約のある計算ハードウェアに適した,完全畳み込み型ネットワークである拡張スケーズデュアルマルチスケール残差ネットワーク(esdmr-net)を提案する。
ESDMR-Netは、意味的に異なる特徴間のコンテキスト依存の学習を可能にする、マルチスケール機能の抽出に焦点を当てている。
ESDMR-Netアーキテクチャはエンコーダとデコーダのペア内でのデュアルストリーム情報フローを可能にする。
拡張操作(奥行き分離可能な畳み込み)は、スクイーズ操作(ボトルネック層)に利用可能なマルチスケール情報を備えたリッチな機能をすべて提供し、セグメンテーションタスクに必要な情報を抽出する。
Expand-Squeeze(ES)ブロックは、表現不足のクラスにネットワークがより多くの注意を払うのに役立つ。
複数の解像度やスケールにまたがる情報の流れを改善するために,2つのマルチスケール残差ブロック(DMR)をスキップ接続に統合した。
この統合により、デコーダは様々なレベルの抽象化から機能にアクセスでき、最終的にはより包括的な機能表現をもたらす。
5つの異なる応用例から7つのデータセットについて実験を行った。
私たちのモデルは、トレーニング可能なパラメータがかなり少なく、マグニチュードが2~3桁減ったにもかかわらず、最高の結果を得ました。
関連論文リスト
- Remote Sensing Image Segmentation Using Vision Mamba and Multi-Scale Multi-Frequency Feature Fusion [9.098711843118629]
本稿では、状態空間モデル(SSM)を導入し、視覚マンバ(CVMH-UNet)に基づく新しいハイブリッドセマンティックセマンティックネットワークを提案する。
本手法は、クロス2Dスキャン(CS2D)を用いて、複数の方向からグローバル情報をフルにキャプチャする、クロス走査型視覚状態空間ブロック(CVSSBlock)を設計する。
ローカル情報取得におけるビジョン・マンバ(VMamba)の制約を克服するために畳み込みニューラルネットワークのブランチを組み込むことにより、このアプローチはグローバル機能とローカル機能の両方の包括的な分析を促進する。
論文 参考訳(メタデータ) (2024-10-08T02:17:38Z) - MSVM-UNet: Multi-Scale Vision Mamba UNet for Medical Image Segmentation [3.64388407705261]
医用画像分割のためのマルチスケールビジョンマンバUNetモデルMSVM-UNetを提案する。
具体的には、VSSブロックにマルチスケールの畳み込みを導入することで、VMambaエンコーダの階層的特徴から、より効果的にマルチスケールの特徴表現をキャプチャし、集約することができる。
論文 参考訳(メタデータ) (2024-08-25T06:20:28Z) - Modality-agnostic Domain Generalizable Medical Image Segmentation by Multi-Frequency in Multi-Scale Attention [1.1155836879100416]
医用画像セグメンテーションのためのModality-Agnostic Domain Generalizable Network (MADGNet)を提案する。
MFMSAブロックは空間的特徴抽出の過程を洗練させる。
E-SDMは、深い監督を伴うマルチタスク学習における情報損失を軽減する。
論文 参考訳(メタデータ) (2024-05-10T07:34:36Z) - General-Purpose Multimodal Transformer meets Remote Sensing Semantic
Segmentation [35.100738362291416]
マルチモーダルAIは、特にセマンティックセグメンテーションのような複雑なタスクのために、補完的なデータソースを活用する。
汎用マルチモーダルネットワークの最近のトレンドは、最先端の性能を達成する大きな可能性を示している。
本稿では,3次元畳み込みを利用して重要なローカル情報をエンコードし,同時にモーダルな特徴を学習するUNet型モジュールを提案する。
論文 参考訳(メタデータ) (2023-07-07T04:58:34Z) - M$^{2}$SNet: Multi-scale in Multi-scale Subtraction Network for Medical
Image Segmentation [73.10707675345253]
医用画像から多様なセグメンテーションを仕上げるマルチスケールサブトラクションネットワーク(M$2$SNet)を提案する。
本手法は,4つの異なる医用画像セグメンテーションタスクの11つのデータセットに対して,異なる評価基準の下で,ほとんどの最先端手法に対して好意的に機能する。
論文 参考訳(メタデータ) (2023-03-20T06:26:49Z) - Learning Enriched Features for Fast Image Restoration and Enhancement [166.17296369600774]
本稿では,ネットワーク全体を通して空間的精度の高い高解像度表現を維持することを目的とする。
我々は、高解像度の空間的詳細を同時に保存しながら、複数のスケールからの文脈情報を組み合わせた豊富な特徴集合を学習する。
提案手法は,デフォーカス・デブロアリング,画像デノイング,超解像,画像強調など,さまざまな画像処理タスクに対して,最先端の処理結果を実現する。
論文 参考訳(メタデータ) (2022-04-19T17:59:45Z) - Multi-scale and Cross-scale Contrastive Learning for Semantic
Segmentation [5.281694565226513]
セグメンテーションネットワークによって抽出されたマルチスケール特徴の識別能力を高めるために,コントラスト学習を適用した。
まず、エンコーダのマルチスケール表現を共通の特徴空間にマッピングすることにより、教師付き局所言語制約の新しい形式をインスタンス化する。
論文 参考訳(メタデータ) (2022-03-25T01:24:24Z) - Specificity-preserving RGB-D Saliency Detection [103.3722116992476]
本稿では,RGB-Dサリエンシ検出のための特異性保存ネットワーク(SP-Net)を提案する。
2つのモダリティ特化ネットワークと共有学習ネットワークを採用し、個別および共有唾液マップを生成する。
6つのベンチマークデータセットの実験では、SP-Netは他の最先端の手法よりも優れています。
論文 参考訳(メタデータ) (2021-08-18T14:14:22Z) - A Holistically-Guided Decoder for Deep Representation Learning with
Applications to Semantic Segmentation and Object Detection [74.88284082187462]
一般的な戦略の1つは、バックボーンネットワークに拡張畳み込みを採用し、高解像度のフィーチャーマップを抽出することです。
本稿では,高分解能なセマンティクスリッチな特徴マップを得るために紹介される,新たなホリスティック誘導デコーダを提案する。
論文 参考訳(メタデータ) (2020-12-18T10:51:49Z) - Sequential Hierarchical Learning with Distribution Transformation for
Image Super-Resolution [83.70890515772456]
画像SRのための逐次階層学習型超解像ネットワーク(SHSR)を構築した。
特徴のスケール間相関を考察し、階層的情報を段階的に探索するシーケンシャルなマルチスケールブロック(SMB)を考案する。
実験結果から,SHSRは最先端手法に優れた定量的性能と視覚的品質が得られることが示された。
論文 参考訳(メタデータ) (2020-07-19T01:35:53Z) - Learning Enriched Features for Real Image Restoration and Enhancement [166.17296369600774]
畳み込みニューラルネットワーク(CNN)は、画像復元作業における従来のアプローチよりも劇的に改善されている。
ネットワーク全体を通して空間的精度の高い高解像度表現を維持することを目的とした,新しいアーキテクチャを提案する。
提案手法は,高解像度の空間的詳細を同時に保存しながら,複数のスケールからの文脈情報を組み合わせた豊富な特徴集合を学習する。
論文 参考訳(メタデータ) (2020-03-15T11:04:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。