論文の概要: ParaTransCNN: Parallelized TransCNN Encoder for Medical Image
Segmentation
- arxiv url: http://arxiv.org/abs/2401.15307v1
- Date: Sat, 27 Jan 2024 05:58:36 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-01-30 18:48:12.287967
- Title: ParaTransCNN: Parallelized TransCNN Encoder for Medical Image
Segmentation
- Title(参考訳): ParaTransCNN: 医療画像セグメンテーションのための並列トランスCNNエンコーダ
- Authors: Hongkun Sun, Jing Xu, and Yuping Duan
- Abstract要約: 本稿では,畳み込みニューラルネットワークとトランスフォーマーアーキテクチャを組み合わせた2次元特徴抽出手法を提案する。
特に小臓器では, セグメンテーションの精度が向上した。
- 参考スコア(独自算出の注目度): 7.955518153976858
- License: http://creativecommons.org/publicdomain/zero/1.0/
- Abstract: The convolutional neural network-based methods have become more and more
popular for medical image segmentation due to their outstanding performance.
However, they struggle with capturing long-range dependencies, which are
essential for accurately modeling global contextual correlations. Thanks to the
ability to model long-range dependencies by expanding the receptive field, the
transformer-based methods have gained prominence. Inspired by this, we propose
an advanced 2D feature extraction method by combining the convolutional neural
network and Transformer architectures. More specifically, we introduce a
parallelized encoder structure, where one branch uses ResNet to extract local
information from images, while the other branch uses Transformer to extract
global information. Furthermore, we integrate pyramid structures into the
Transformer to extract global information at varying resolutions, especially in
intensive prediction tasks. To efficiently utilize the different information in
the parallelized encoder at the decoder stage, we use a channel attention
module to merge the features of the encoder and propagate them through skip
connections and bottlenecks. Intensive numerical experiments are performed on
both aortic vessel tree, cardiac, and multi-organ datasets. By comparing with
state-of-the-art medical image segmentation methods, our method is shown with
better segmentation accuracy, especially on small organs. The code is publicly
available on https://github.com/HongkunSun/ParaTransCNN.
- Abstract(参考訳): 畳み込みニューラルネットワークに基づく手法は、その優れた性能により、医用画像セグメンテーションにおいてますます普及している。
しかし、グローバルな文脈相関を正確にモデル化するためには、長距離依存関係の取得に苦労する。
受容場を拡張して長距離依存性をモデル化する能力により、トランスフォーマティブベースの手法が普及した。
そこで本研究では,畳み込みニューラルネットワークとトランスフォーマーアーキテクチャを組み合わせた2次元特徴抽出手法を提案する。
具体的には、並列化エンコーダ構造を導入し、一方のブランチはResNetを使って画像からローカル情報を抽出し、他方のブランチはTransformerを使ってグローバル情報を抽出する。
さらに,ピラミッド構造を変圧器に統合することで,特に集中的な予測タスクにおいて,様々な解像度でグローバル情報を抽出する。
並列化エンコーダにおける異なる情報をデコーダ段階で効率的に活用するために,チャネルアテンションモジュールを用いてエンコーダの特徴をマージし,スキップ接続やボトルネックを通じて伝搬する。
大動脈血管, 心臓, および多臓器データセットについて, 集中的な数値実験を行った。
最先端の医用画像分割法との比較により,特に小器官における画像分割精度が向上した。
コードはhttps://github.com/HongkunSun/ParaTransCNNで公開されている。
関連論文リスト
- ConvTransSeg: A Multi-resolution Convolution-Transformer Network for
Medical Image Segmentation [14.485482467748113]
ハイブリッドエンコーダ/デコーダセグメンテーションモデル(ConvTransSeg)を提案する。
特徴学習用エンコーダとして多層CNNと,セグメンテーション予測用デコーダとして対応する多層トランスフォーマーから構成される。
本手法は,モデル複雑度とメモリ消費率の低いDice係数と平均対称表面距離の測定値で最高の性能を実現する。
論文 参考訳(メタデータ) (2022-10-13T14:59:23Z) - HiFormer: Hierarchical Multi-scale Representations Using Transformers
for Medical Image Segmentation [3.478921293603811]
HiFormerは、医用画像セグメンテーションのためのCNNとトランスフォーマーを効率的にブリッジする新しい方法である。
グローバルな特徴とローカルな特徴の微細融合を確保するため,エンコーダ・デコーダ構造のスキップ接続におけるDouble-Level Fusion (DLF)モジュールを提案する。
論文 参考訳(メタデータ) (2022-07-18T11:30:06Z) - MISSU: 3D Medical Image Segmentation via Self-distilling TransUNet [55.16833099336073]
医用画像セグメンテーションのためのトランスフォーマーベースUNetを提案する。
グローバルな意味情報と局所的な空間的詳細特徴を同時に学習する。
MISSUは従来の最先端手法よりも優れた性能を発揮する。
論文 参考訳(メタデータ) (2022-06-02T07:38:53Z) - Error Correction Code Transformer [92.10654749898927]
本稿では,トランスフォーマーアーキテクチャを任意のブロック長で線形符号のソフトデコードに拡張することを提案する。
我々は,各チャネルの出力次元を高次元に符号化し,個別に処理すべきビット情報のより良い表現を行う。
提案手法は、トランスフォーマーの極端なパワーと柔軟性を示し、既存の最先端のニューラルデコーダを、その時間的複雑さのごく一部で大きなマージンで上回る。
論文 参考訳(メタデータ) (2022-03-27T15:25:58Z) - A Volumetric Transformer for Accurate 3D Tumor Segmentation [25.961484035609672]
本稿では,医療画像セグメンテーションのためのトランスフォーマーアーキテクチャを提案する。
TransformerはU字型のボリュームエンコーダデコーダ設計で、入力ボクセル全体を処理している。
モデルがデータセット間でより良い表現を転送し、データの破損に対して堅牢であることを示します。
論文 参考訳(メタデータ) (2021-11-26T02:49:51Z) - Swin-Unet: Unet-like Pure Transformer for Medical Image Segmentation [63.46694853953092]
Swin-Unetは、医用画像セグメンテーション用のUnetライクなトランスフォーマーである。
トークン化されたイメージパッチは、TransformerベースのU字型デコーダデコーダアーキテクチャに供給される。
論文 参考訳(メタデータ) (2021-05-12T09:30:26Z) - Deep ensembles based on Stochastic Activation Selection for Polyp
Segmentation [82.61182037130406]
本研究は,大腸内視鏡検査における画像分割,特に正確なポリープ検出とセグメンテーションを扱う。
イメージセグメンテーションの基本アーキテクチャはエンコーダとデコーダで構成されている。
我々はデコーダのバックボーンを変更することで得られるDeepLabアーキテクチャのバリエーションを比較した。
論文 参考訳(メタデータ) (2021-04-02T02:07:37Z) - UNETR: Transformers for 3D Medical Image Segmentation [8.59571749685388]
UNEt TRansformers(UNETR)と呼ばれる新しいアーキテクチャを導入し、純粋なトランスフォーマーをエンコーダとして入力ボリュームのシーケンス表現を学習します。
提案モデルの性能を様々なイメージング手法で広く検証しています。
論文 参考訳(メタデータ) (2021-03-18T20:17:15Z) - CoTr: Efficiently Bridging CNN and Transformer for 3D Medical Image
Segmentation [95.51455777713092]
畳み込みニューラルネットワーク(CNN)は、現代の3D医療画像セグメンテーションのデファクトスタンダードとなっている。
本稿では,bf畳み込みニューラルネットワークとbfトランスbf(cotr)を効率良く橋渡しし,正確な3次元医用画像分割を実現する新しい枠組みを提案する。
論文 参考訳(メタデータ) (2021-03-04T13:34:22Z) - TransUNet: Transformers Make Strong Encoders for Medical Image
Segmentation [78.01570371790669]
医用画像のセグメンテーションは医療システムの開発に必須の前提条件である。
様々な医療画像セグメンテーションタスクにおいて、U-Netとして知られるu字型アーキテクチャがデファクトスタンダードとなっている。
医用画像セグメンテーションの強力な代替手段として,トランスフォーマーとU-Netの両方を有効活用するTransUNetを提案する。
論文 参考訳(メタデータ) (2021-02-08T16:10:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。