論文の概要: TransBTSV2: Wider Instead of Deeper Transformer for Medical Image
Segmentation
- arxiv url: http://arxiv.org/abs/2201.12785v1
- Date: Sun, 30 Jan 2022 11:00:34 GMT
- ステータス: 処理完了
- システム内更新日: 2022-02-01 18:00:37.231499
- Title: TransBTSV2: Wider Instead of Deeper Transformer for Medical Image
Segmentation
- Title(参考訳): TransBTSV2:医療画像セグメンテーションのためのより深いトランスフォーマー
- Authors: Jiangyun Li, Wenxuan Wang, Chen Chen, Tianxiang Zhang, Sen Zha, Hong
Yu, Jing Wang
- Abstract要約: 医用3次元画像分割のための3次元CNNのトランスフォーマーを利用する。
本稿では, Encoder-decoder 構造に基づく TransBTSV2 という新しいネットワークを提案する。
ハイブリッドCNN-Transformerアーキテクチャとして、TransBTSV2は、事前トレーニングなしで正確な医療画像のセグメンテーションを実現することができる。
- 参考スコア(独自算出の注目度): 12.85662034471981
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Transformer, benefiting from global (long-range) information modeling using
self-attention mechanism, has been successful in natural language processing
and computer vision recently. Convolutional Neural Networks, capable of
capturing local features, are unable to model explicit long-distance
dependencies from global feature space. However, both local and global features
are crucial for dense prediction tasks, especially for 3D medical image
segmentation. In this paper, we exploit Transformer in 3D CNN for 3D medical
image volumetric segmentation and propose a novel network named TransBTSV2
based on the encoder-decoder structure. Different from our original TransBTS,
the proposed TransBTSV2 is not limited to brain tumor segmentation (BTS) but
focuses on general medical image segmentation, providing a strong and efficient
3D baseline for volumetric segmentation of medical images. As a hybrid
CNN-Transformer architecture, TransBTSV2 can achieve accurate segmentation of
medical images without any pre-training. With the proposed insight to redesign
the internal structure of Transformer and the introduced Deformable Bottleneck
Module, a highly efficient architecture is achieved with superior performance.
Extensive experimental results on four medical image datasets (BraTS 2019,
BraTS 2020, LiTS 2017 and KiTS 2019) demonstrate that TransBTSV2 achieves
comparable or better results as compared to the state-of-the-art methods for
the segmentation of brain tumor, liver tumor as well as kidney tumor. Code is
available at https://github.com/Wenxuan-1119/TransBTS.
- Abstract(参考訳): 自己認識機構を用いたグローバル(長距離)情報モデリングの恩恵を受けるTransformerは,近年,自然言語処理やコンピュータビジョンにおいて成功を収めている。
局所的な特徴をキャプチャ可能な畳み込みニューラルネットワークは、グローバルな特徴空間から明示的な長距離依存性をモデル化できない。
しかし,特に3次元医用画像セグメンテーションでは,局所的特徴とグローバル特徴の両方が重要となる。
本稿では,3次元医用画像ボリュームセグメンテーションのための3次元CNNのトランスフォーマーを利用し,エンコーダ・デコーダ構造に基づくトランスBTSV2という新しいネットワークを提案する。
提案する TransBTSV2 は脳腫瘍セグメンテーション(BTS)に限らず,一般的な医用画像セグメンテーションに特化しており,医用画像の容積セグメンテーションのための強力で効率的な3Dベースラインを提供する。
ハイブリッドCNN-Transformerアーキテクチャとして、TransBTSV2は事前トレーニングなしで正確な医療画像のセグメンテーションを実現することができる。
Transformerの内部構造と導入したDeformable Bottleneck Moduleを再設計するための洞察によって、高性能なアーキテクチャを実現することができる。
4つの医療画像データセット(BraTS 2019、BraTS 2020、LiTS 2017、KiTS 2019)の大規模な実験結果から、TransBTSV2は、脳腫瘍、肝腫瘍、および腎臓腫瘍の分節に関する最先端の手法と比較して、同等またはより良い結果が得られることが示された。
コードはhttps://github.com/Wenxuan-1119/TransBTSで入手できる。
関連論文リスト
- 3D TransUNet: Advancing Medical Image Segmentation through Vision
Transformers [40.21263511313524]
医療画像のセグメンテーションは、疾患診断と治療計画のための医療システムの発展に重要な役割を担っている。
U-Netとして知られるU字型アーキテクチャは、様々な医療画像セグメンテーションタスクで高い成功を収めている。
これらの制限に対処するため、研究者たちはトランスフォーマー(Transformer)に転換した。
論文 参考訳(メタデータ) (2023-10-11T18:07:19Z) - 3DSAM-adapter: Holistic adaptation of SAM from 2D to 3D for promptable tumor segmentation [52.699139151447945]
医用画像の領域分割を行うために, SAMを2次元から3次元に変換する新しい適応法を提案する。
本モデルでは, 腎腫瘍, 膵腫瘍, 大腸癌の3つのタスクのうち8.25%, 29.87%, 10.11%の3つのタスクにおいて, ドメイン・オブ・ザ・アーティヴ・メディカル・イメージ・セグメンテーション・モデルより優れ, 肝腫瘍セグメンテーションでも同様の性能が得られる。
論文 参考訳(メタデータ) (2023-06-23T12:09:52Z) - MISSU: 3D Medical Image Segmentation via Self-distilling TransUNet [55.16833099336073]
医用画像セグメンテーションのためのトランスフォーマーベースUNetを提案する。
グローバルな意味情報と局所的な空間的詳細特徴を同時に学習する。
MISSUは従来の最先端手法よりも優れた性能を発揮する。
論文 参考訳(メタデータ) (2022-06-02T07:38:53Z) - PHTrans: Parallelly Aggregating Global and Local Representations for
Medical Image Segmentation [7.140322699310487]
我々はPHTransと呼ばれる医用画像分割のための新しいハイブリッドアーキテクチャを提案する。
PHTransはTransformerとCNNを並列にハイブリッド化し、グローバルな特徴とローカルな特徴から階層的な表現を生成する。
論文 参考訳(メタデータ) (2022-03-09T08:06:56Z) - Swin-Unet: Unet-like Pure Transformer for Medical Image Segmentation [63.46694853953092]
Swin-Unetは、医用画像セグメンテーション用のUnetライクなトランスフォーマーである。
トークン化されたイメージパッチは、TransformerベースのU字型デコーダデコーダアーキテクチャに供給される。
論文 参考訳(メタデータ) (2021-05-12T09:30:26Z) - TransBTS: Multimodal Brain Tumor Segmentation Using Transformer [9.296315610803985]
エンコーダデコーダ構造に基づくTransBTSという新しいネットワークを提案する。
ローカルな3Dコンテキスト情報をキャプチャするために、エンコーダはまず3D CNNを使用してボリューム特徴マップを抽出する。
一方、機能マップは、グローバル機能モデリングのためにTransformerに供給されるトークンのために精巧に再構成されます。
論文 参考訳(メタデータ) (2021-03-07T19:12:14Z) - CoTr: Efficiently Bridging CNN and Transformer for 3D Medical Image
Segmentation [95.51455777713092]
畳み込みニューラルネットワーク(CNN)は、現代の3D医療画像セグメンテーションのデファクトスタンダードとなっている。
本稿では,bf畳み込みニューラルネットワークとbfトランスbf(cotr)を効率良く橋渡しし,正確な3次元医用画像分割を実現する新しい枠組みを提案する。
論文 参考訳(メタデータ) (2021-03-04T13:34:22Z) - Medical Transformer: Gated Axial-Attention for Medical Image
Segmentation [73.98974074534497]
医用画像分割タスクにおけるトランスフォーマティブネットワークアーキテクチャの利用可能性について検討する。
セルフアテンションモジュールに追加の制御機構を導入することで,既存のアーキテクチャを拡張するGated Axial-Attentionモデルを提案する。
医療画像上で効果的にモデルを訓練するために,さらにパフォーマンスを向上させる局所的グローバルトレーニング戦略 (logo) を提案する。
論文 参考訳(メタデータ) (2021-02-21T18:35:14Z) - TransUNet: Transformers Make Strong Encoders for Medical Image
Segmentation [78.01570371790669]
医用画像のセグメンテーションは医療システムの開発に必須の前提条件である。
様々な医療画像セグメンテーションタスクにおいて、U-Netとして知られるu字型アーキテクチャがデファクトスタンダードとなっている。
医用画像セグメンテーションの強力な代替手段として,トランスフォーマーとU-Netの両方を有効活用するTransUNetを提案する。
論文 参考訳(メタデータ) (2021-02-08T16:10:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。