論文の概要: Narrowing the semantic gaps in U-Net with learnable skip connections:
The case of medical image segmentation
- arxiv url: http://arxiv.org/abs/2312.15182v1
- Date: Sat, 23 Dec 2023 07:39:42 GMT
- ステータス: 処理完了
- システム内更新日: 2023-12-27 19:26:24.542804
- Title: Narrowing the semantic gaps in U-Net with learnable skip connections:
The case of medical image segmentation
- Title(参考訳): 学習可能なスキップ接続によるU-Netの意味的ギャップを狭める:医用画像分割の場合
- Authors: Haonan Wang, Peng Cao, Xiaoli Liu, Jinzhu Yang, Osmar Zaiane
- Abstract要約: U-Netにおける3つのセグメンテーションギャップを解決するためにUDTransNetという新しいセグメンテーションフレームワークを提案する。
具体的には、チャネル関係と空間関係を捕捉するデュアルアテンショントランスフォーマー(DAT)モジュールと、DATトークンとデコーダ機能を効果的に接続するデコーダ誘導リカバリアアテンション(DRA)モジュールを提案する。
我々のUDTransNetは、異なる公開データセット上の最先端セグメンテーション手法よりも比較的少ないパラメータで、より高い評価スコアとより細かいセグメンテーション結果を生成する。
- 参考スコア(独自算出の注目度): 12.812992773512871
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Most state-of-the-art methods for medical image segmentation adopt the
encoder-decoder architecture. However, this U-shaped framework still has
limitations in capturing the non-local multi-scale information with a simple
skip connection. To solve the problem, we firstly explore the potential
weakness of skip connections in U-Net on multiple segmentation tasks, and find
that i) not all skip connections are useful, each skip connection has different
contribution; ii) the optimal combinations of skip connections are different,
relying on the specific datasets. Based on our findings, we propose a new
segmentation framework, named UDTransNet, to solve three semantic gaps in
U-Net. Specifically, we propose a Dual Attention Transformer (DAT) module for
capturing the channel- and spatial-wise relationships to better fuse the
encoder features, and a Decoder-guided Recalibration Attention (DRA) module for
effectively connecting the DAT tokens and the decoder features to eliminate the
inconsistency. Hence, both modules establish a learnable connection to solve
the semantic gaps between the encoder and the decoder, which leads to a
high-performance segmentation model for medical images. Comprehensive
experimental results indicate that our UDTransNet produces higher evaluation
scores and finer segmentation results with relatively fewer parameters over the
state-of-the-art segmentation methods on different public datasets. Code:
https://github.com/McGregorWwww/UDTransNet.
- Abstract(参考訳): 医療画像セグメンテーションの最先端手法の多くはエンコーダ・デコーダアーキテクチャを採用している。
しかし、このU字型フレームワークは、単純なスキップ接続で非ローカルなマルチスケール情報をキャプチャする際の制限がある。
この問題を解決するために、まずU-Netにおける複数のセグメント化タスクにおけるスキップ接続の潜在的な弱点を探索し、それを見つける。
i) すべてのスキップ接続が有用であるとは限らない。各スキップ接続は,異なるコントリビューションを有する。
二 特定のデータセットに依存して、スキップ接続の最適な組み合わせが異なること。
本稿では,U-Netにおける3つの意味的ギャップを解決するためにUDTransNetという新たなセグメンテーションフレームワークを提案する。
具体的には、チャネルと空間の関係を捉えてエンコーダ特徴を融合させるDATモジュールと、DATトークンとデコーダ特徴を効果的に接続して不整合を解消するDecoder-Guided Recalibration Attention (DRA)モジュールを提案する。
したがって、両モジュールは、エンコーダとデコーダのセマンティックギャップを解決するために学習可能な接続を確立し、医療画像の高性能セグメンテーションモデルをもたらす。
包括的実験の結果から,udtransnetは評価スコアが高く,パブリックデータセットの分類方法よりも比較的少ないパラメータで,より詳細なセグメンテーション結果が得られることがわかった。
コード:https://github.com/McGregorWwww/UDTransNet
関連論文リスト
- FusionU-Net: U-Net with Enhanced Skip Connection for Pathology Image
Segmentation [9.70345458475663]
FusionU-NetはU-Net構造に基づいており、異なるスキップ接続間で情報を交換するためのフュージョンモジュールを備えている。
その結果,FusionU-Netは競合する他の手法よりも優れた性能が得られることがわかった。
論文 参考訳(メタデータ) (2023-10-17T02:56:10Z) - SegNetr: Rethinking the local-global interactions and skip connections
in U-shaped networks [1.121518046252855]
U字型ネットワークは、シンプルで調整が容易な構造のため、医療画像セグメンテーションの分野を支配してきた。
我々は任意の段階で動的に局所的・局所的相互作用を行なえる新しいSegNetrブロックを導入する。
59%と76%のパラメータとGFLOPがバニラU-Netより少ない4つの主流医療画像セグメンテーションデータセットに対するSegNetrの有効性を検証した。
論文 参考訳(メタデータ) (2023-07-06T12:39:06Z) - Towards Diverse Binary Segmentation via A Simple yet General Gated Network [71.19503376629083]
本稿では,バイナリセグメンテーションタスクに対処するシンプルな汎用ネットワーク(GateNet)を提案する。
多段ゲートユニットの助けを借りて、エンコーダからの貴重なコンテキスト情報をデコーダに選択的に送信することができる。
我々は,アトーラスの畳み込みを改善し,新規な折り畳み畳み畳み畳み畳み込みを形成する「Fold」操作を導入した。
論文 参考訳(メタデータ) (2023-03-18T11:26:36Z) - DSNet: a simple yet efficient network with dual-stream attention for
lesion segmentation [0.0]
本稿では, 簡易かつ効率的なネットワークDSNetを提案する。
本手法は,モデル複雑性とメモリ消費の低い平均Dice係数(mDice)と平均MIoU(mIoU)のSOTA性能を実現する。
論文 参考訳(メタデータ) (2022-11-30T12:48:17Z) - Adjacent Context Coordination Network for Salient Object Detection in
Optical Remote Sensing Images [102.75699068451166]
本稿では,光RSI-SODのためのエンコーダ・デコーダアーキテクチャにおいて,隣接した特徴のコーディネートを探索するための新しいアジャセントコンテキストコーディネートネットワーク(ACCoNet)を提案する。
提案されたACCoNetは、9つの評価基準の下で22の最先端メソッドを上回り、1つのNVIDIA Titan X GPU上で81fpsで動作する。
論文 参考訳(メタデータ) (2022-03-25T14:14:55Z) - UCTransNet: Rethinking the Skip Connections in U-Net from a Channel-wise
Perspective with Transformer [12.680709604300038]
本稿では,注意機構を備えたチャネルの観点から,UCTransNetという新たなセグメンテーションフレームワークを提案する。
CCTとCCAからなる提案された接続は、元のスキップ接続を置き換えて、正確な医用画像分割のためのセマンティックギャップを解決することができる。
論文 参考訳(メタデータ) (2021-09-09T15:18:20Z) - Specificity-preserving RGB-D Saliency Detection [103.3722116992476]
本稿では,RGB-Dサリエンシ検出のための特異性保存ネットワーク(SP-Net)を提案する。
2つのモダリティ特化ネットワークと共有学習ネットワークを採用し、個別および共有唾液マップを生成する。
6つのベンチマークデータセットの実験では、SP-Netは他の最先端の手法よりも優れています。
論文 参考訳(メタデータ) (2021-08-18T14:14:22Z) - Encoder Fusion Network with Co-Attention Embedding for Referring Image
Segmentation [87.01669173673288]
本稿では,視覚的エンコーダをマルチモーダルな特徴学習ネットワークに変換するエンコーダ融合ネットワーク(EFN)を提案する。
EFNには、マルチモーダル機能の並列更新を実現するコアテンションメカニズムが組み込まれている。
4つのベンチマークデータセットによる実験結果から,提案手法がポストプロセッシングを伴わずに最先端の性能を実現することを示す。
論文 参考訳(メタデータ) (2021-05-05T02:27:25Z) - Beyond Single Stage Encoder-Decoder Networks: Deep Decoders for Semantic
Image Segmentation [56.44853893149365]
セマンティックセグメンテーションのための単一エンコーダ-デコーダ手法は、セマンティックセグメンテーションの品質とレイヤー数あたりの効率の観点からピークに達している。
そこで本研究では,より多くの情報コンテンツを取得するために,浅層ネットワークの集合を用いたデコーダに基づく新しいアーキテクチャを提案する。
アーキテクチャをさらに改善するために,ネットワークの注目度を高めるために,クラスの再バランスを目的とした重み関数を導入する。
論文 参考訳(メタデータ) (2020-07-19T18:44:34Z) - Suppress and Balance: A Simple Gated Network for Salient Object
Detection [89.88222217065858]
両問題を同時に解くための単純なゲートネットワーク(GateNet)を提案する。
多レベルゲートユニットの助けを借りて、エンコーダからの貴重なコンテキスト情報をデコーダに最適に送信することができる。
さらに,提案したFold-ASPP操作(Fold-ASPP)に基づくアトラス空間ピラミッドプーリングを用いて,様々なスケールのサリアンオブジェクトを正確に位置決めする。
論文 参考訳(メタデータ) (2020-07-16T02:00:53Z) - Multi-level Context Gating of Embedded Collective Knowledge for Medical
Image Segmentation [32.96604621259756]
医用画像分割のためのU-Netの拡張を提案する。
U-Net, Squeeze and Excitation (SE) block, bi-directional ConvLSTM (BConvLSTM), and the mechanism of dense convolutions。
提案モデルは6つのデータセットで評価される。
論文 参考訳(メタデータ) (2020-03-10T12:29:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。