論文の概要: TransAttUnet: Multi-level Attention-guided U-Net with Transformer for
Medical Image Segmentation
- arxiv url: http://arxiv.org/abs/2107.05274v1
- Date: Mon, 12 Jul 2021 09:17:06 GMT
- ステータス: 処理完了
- システム内更新日: 2021-07-13 15:46:30.854446
- Title: TransAttUnet: Multi-level Attention-guided U-Net with Transformer for
Medical Image Segmentation
- Title(参考訳): TransAttUnet:医療画像分割用トランスフォーマ付きマルチレベル注意誘導U-Net
- Authors: Bingzhi Chen, Yishu Liu, Zheng Zhang, Guangming Lu, David Zhang
- Abstract要約: 本稿では,TransAttUnetと呼ばれるトランスフォーマーベースの医用画像セマンティックセマンティック・セマンティック・フレームワークを提案する。
特に,デコーダブロック間の複数スケールのスキップ接続を確立することで,セマンティック・スケールのアップサンプリング機能を集約する。
我々の手法は一貫して最先端のベースラインを上回っている。
- 参考スコア(独自算出の注目度): 33.45471457058221
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: With the development of deep encoder-decoder architectures and large-scale
annotated medical datasets, great progress has been achieved in the development
of automatic medical image segmentation. Due to the stacking of convolution
layers and the consecutive sampling operations, existing standard models
inevitably encounter the information recession problem of feature
representations, which fails to fully model the global contextual feature
dependencies. To overcome the above challenges, this paper proposes a novel
Transformer based medical image semantic segmentation framework called
TransAttUnet, in which the multi-level guided attention and multi-scale skip
connection are jointly designed to effectively enhance the functionality and
flexibility of traditional U-shaped architecture. Inspired by Transformer, a
novel self-aware attention (SAA) module with both Transformer Self Attention
(TSA) and Global Spatial Attention (GSA) is incorporated into TransAttUnet to
effectively learn the non-local interactions between encoder features. In
particular, we also establish additional multi-scale skip connections between
decoder blocks to aggregate the different semantic-scale upsampling features.
In this way, the representation ability of multi-scale context information is
strengthened to generate discriminative features. Benefitting from these
complementary components, the proposed TransAttUnet can effectively alleviate
the loss of fine details caused by the information recession problem, improving
the diagnostic sensitivity and segmentation quality of medical image analysis.
Extensive experiments on multiple medical image segmentation datasets of
different imaging demonstrate that our method consistently outperforms the
state-of-the-art baselines.
- Abstract(参考訳): ディープエンコーダデコーダアーキテクチャと大規模アノテートされた医療データセットの開発により、自動医用画像セグメンテーションの開発において大きな進歩を遂げた。
畳み込み層の積み重ねと連続的なサンプリング操作により、既存の標準モデルは必然的に機能表現の情報不況問題に遭遇する。
そこで本稿では,従来のu字型アーキテクチャの機能と柔軟性を効果的に高めるために,マルチレベルガイドアテンションとマルチスケールスキップ接続を共同で設計したtransattunetという,トランスフォーマティブな医用画像セマンティクスセグメンテーションフレームワークを提案する。
TransformerにインスパイアされたTransformerは、Transformer Self Attention(TSA)とGlobal Spatial Attention(GSA)の2つのモジュールをTransAttUnetに統合し、エンコーダの特徴間の非局所的な相互作用を効果的に学習する。
特に,デコーダブロック間のマルチスケールスキップ接続を新たに構築し,セマンティックスケールのアップサンプリング機能を集約する。
このようにして、マルチスケールコンテキスト情報の表現能力を強化し、識別的特徴を生成する。
これら相補的成分の恩恵を受けることにより,情報不況問題による詳細情報の損失を効果的に軽減し,医用画像解析の診断感度と分割品質を向上させることができる。
複数の医用画像セグメンテーションデータセットに対する広範囲な実験により,本手法が最先端のベースラインを一貫して上回っていることを証明した。
関連論文リスト
- TransResNet: Integrating the Strengths of ViTs and CNNs for High Resolution Medical Image Segmentation via Feature Grafting [6.987177704136503]
医用画像領域で高解像度画像が好ましいのは、基礎となる方法の診断能力を大幅に向上させるためである。
医用画像セグメンテーションのための既存のディープラーニング技術のほとんどは、空間次元が小さい入力画像に最適化されており、高解像度画像では不十分である。
我々はTransResNetという並列処理アーキテクチャを提案し、TransformerとCNNを並列的に組み合わせ、マルチ解像度画像から特徴を独立して抽出する。
論文 参考訳(メタデータ) (2024-10-01T18:22:34Z) - BEFUnet: A Hybrid CNN-Transformer Architecture for Precise Medical Image
Segmentation [0.0]
本稿では,医療画像の正確な分割のために,身体情報とエッジ情報の融合を強化するBEFUnetという,革新的なU字型ネットワークを提案する。
BEFUnetは、新しいローカル・クロス・アテンション・フィーチャー(LCAF)融合モジュール、新しいダブル・レベル・フュージョン(DLF)モジュール、デュアルブランチ・エンコーダの3つの主要モジュールから構成されている。
LCAFモジュールは、2つのモダリティの間に空間的に近接する特徴に対して、局所的な相互注意を選択的に行うことにより、エッジとボディの特徴を効率よく融合させる。
論文 参考訳(メタデータ) (2024-02-13T21:03:36Z) - Dual-scale Enhanced and Cross-generative Consistency Learning for Semi-supervised Medical Image Segmentation [49.57907601086494]
医用画像のセグメンテーションはコンピュータ支援診断において重要な役割を担っている。
半教師型医用画像(DEC-Seg)のための新しいDual-scale Enhanced and Cross-generative consistency learning frameworkを提案する。
論文 参考訳(メタデータ) (2023-12-26T12:56:31Z) - DA-TransUNet: Integrating Spatial and Channel Dual Attention with
Transformer U-Net for Medical Image Segmentation [5.5582646801199225]
本研究では,DA-TransUNetと呼ばれる新しい深層画像分割フレームワークを提案する。
トランスフォーマーとデュアルアテンションブロック(DA-Block)を従来のU字型アーキテクチャに統合することを目的としている。
以前のトランスフォーマーベースのU-netモデルとは異なり、DA-TransUNetはトランスフォーマーとDA-Blockを使用してグローバルな特徴とローカルな特徴だけでなく、画像固有の位置とチャネルの特徴を統合する。
論文 参考訳(メタデータ) (2023-10-19T08:25:03Z) - M$^{2}$SNet: Multi-scale in Multi-scale Subtraction Network for Medical
Image Segmentation [73.10707675345253]
医用画像から多様なセグメンテーションを仕上げるマルチスケールサブトラクションネットワーク(M$2$SNet)を提案する。
本手法は,4つの異なる医用画像セグメンテーションタスクの11つのデータセットに対して,異なる評価基準の下で,ほとんどの最先端手法に対して好意的に機能する。
論文 参考訳(メタデータ) (2023-03-20T06:26:49Z) - Reliable Joint Segmentation of Retinal Edema Lesions in OCT Images [55.83984261827332]
本稿では,信頼性の高いマルチスケールウェーブレットエンハンストランスネットワークを提案する。
本研究では,ウェーブレット型特徴抽出器ネットワークとマルチスケール変圧器モジュールを統合したセグメンテーションバックボーンを開発した。
提案手法は,他の最先端セグメンテーション手法と比較して信頼性の高いセグメンテーション精度を実現する。
論文 参考訳(メタデータ) (2022-12-01T07:32:56Z) - MISSU: 3D Medical Image Segmentation via Self-distilling TransUNet [55.16833099336073]
医用画像セグメンテーションのためのトランスフォーマーベースUNetを提案する。
グローバルな意味情報と局所的な空間的詳細特徴を同時に学習する。
MISSUは従来の最先端手法よりも優れた性能を発揮する。
論文 参考訳(メタデータ) (2022-06-02T07:38:53Z) - TransFusion: Multi-view Divergent Fusion for Medical Image Segmentation
with Transformers [8.139069987207494]
コンボリューション層と強力なアテンション機構を用いた多視点画像情報をマージするトランスフォーマーベースのアーキテクチャであるTransFusionを提案する。
特に、ディバージェント・フュージョン・アテンション(DiFA)モジュールは、リッチ・クロスビュー・コンテキスト・モデリングとセマンティック・インテリジェンス・マイニングのために提案されている。
論文 参考訳(メタデータ) (2022-03-21T04:02:54Z) - Medical Transformer: Gated Axial-Attention for Medical Image
Segmentation [73.98974074534497]
医用画像分割タスクにおけるトランスフォーマティブネットワークアーキテクチャの利用可能性について検討する。
セルフアテンションモジュールに追加の制御機構を導入することで,既存のアーキテクチャを拡張するGated Axial-Attentionモデルを提案する。
医療画像上で効果的にモデルを訓練するために,さらにパフォーマンスを向上させる局所的グローバルトレーニング戦略 (logo) を提案する。
論文 参考訳(メタデータ) (2021-02-21T18:35:14Z) - TransUNet: Transformers Make Strong Encoders for Medical Image
Segmentation [78.01570371790669]
医用画像のセグメンテーションは医療システムの開発に必須の前提条件である。
様々な医療画像セグメンテーションタスクにおいて、U-Netとして知られるu字型アーキテクチャがデファクトスタンダードとなっている。
医用画像セグメンテーションの強力な代替手段として,トランスフォーマーとU-Netの両方を有効活用するTransUNetを提案する。
論文 参考訳(メタデータ) (2021-02-08T16:10:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。