論文の概要: Pyramid Medical Transformer for Medical Image Segmentation
- arxiv url: http://arxiv.org/abs/2104.14702v1
- Date: Thu, 29 Apr 2021 23:57:20 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-03 13:42:24.875311
- Title: Pyramid Medical Transformer for Medical Image Segmentation
- Title(参考訳): 医用画像分割用ピラミッド型医用トランス
- Authors: Zhuangzhuang Zhang, Baozhou Sun, Weixiong Zhang
- Abstract要約: ピラミッド型ネットワークアーキテクチャ(PMTrans)を用いたマルチスケールアテンションとCNN特徴抽出を統合した新しい手法を開発した。
2つの医用画像データセット(腺セグメンテーションとMoNuSegデータセット)の実験結果によると、PMTransは最新のCNNベースおよびトランスフォーマーベースの医療用画像セグメンテーションモデルよりも優れていた。
- 参考スコア(独自算出の注目度): 8.157373686645318
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Deep neural networks have been a prevailing technique in the field of medical
image processing. However, the most popular convolutional neural networks
(CNNs) based methods for medical image segmentation are imperfect because they
cannot adequately model long-range pixel relations. Transformers and the
self-attention mechanism are recently proposed to effectively learn long-range
dependencies by modeling all pairs of word-to-word attention regardless of
their positions. The idea has also been extended to the computer vision field
by creating and treating image patches as embeddings. Considering the
computation complexity for whole image self-attention, current
transformer-based models settle for a rigid partitioning scheme that would
potentially lose informative relations. Besides, current medical transformers
model global context on full resolution images, leading to unnecessary
computation costs. To address these issues, we developed a novel method to
integrate multi-scale attention and CNN feature extraction using a pyramidal
network architecture, namely Pyramid Medical Transformer (PMTrans). The PMTrans
captured multi-range relations by working on multi-resolution images. An
adaptive partitioning scheme was implemented to retain informative relations
and to access different receptive fields efficiently. Experimental results on
two medical image datasets, gland segmentation and MoNuSeg datasets, showed
that PMTrans outperformed the latest CNN-based and transformer-based models for
medical image segmentation.
- Abstract(参考訳): 深層ニューラルネットワークは、医療画像処理の分野で広く使われている技術である。
しかし、最も一般的な畳み込みニューラルネットワーク(cnns)ベースの医療画像分割法は、長距離画素関係を適切にモデル化できないため不完全である。
近年, トランスフォーマーと自己着脱機構が提案されているが, その位置に関わらず, 単語間注意のすべてのペアをモデル化することにより, 長距離依存を効果的に学習できる。
このアイデアは、イメージパッチを埋め込みとして作成し、扱い、コンピュータビジョン分野にも拡張された。
画像全体の自己アテンションの計算複雑性を考慮すると、現在のトランスフォーマーベースのモデルは、情報的関係を失う可能性のある厳密な分割スキームに着目する。
さらに、現在の医療トランスフォーマーは全解像度画像のグローバルコンテキストをモデル化し、不要な計算コストにつながる。
これらの問題に対処するため,我々はピラミッド型ネットワークアーキテクチャであるピラミッド型医療トランスフォーマ(pmtrans)を用いて,マルチスケール注意とcnn特徴抽出を統合する新しい手法を開発した。
pmtransはマルチレゾリューション画像を用いてマルチレンジ関係を捉えた。
情報的関係を保ち、異なる受容場に効率的にアクセスするために適応的な分割方式が実装された。
2つの医用画像データセット(腺セグメンテーションとMoNuSegデータセット)の実験結果は、PMTransが最新のCNNベースおよびトランスフォーマーベースの医療用画像セグメンテーションモデルより優れていることを示した。
関連論文リスト
- SeUNet-Trans: A Simple yet Effective UNet-Transformer Model for Medical
Image Segmentation [0.0]
医用画像セグメンテーションのためのシンプルなUNet-Transformer(seUNet-Trans)モデルを提案する。
提案手法では,UNetモデルを特徴抽出器として設計し,入力画像から複数の特徴マップを生成する。
UNetアーキテクチャと自己認識機構を活用することで、我々のモデルはローカルとグローバルの両方のコンテキスト情報を保存するだけでなく、入力要素間の長距離依存関係をキャプチャできる。
論文 参考訳(メタデータ) (2023-10-16T01:13:38Z) - MedSegDiff-V2: Diffusion based Medical Image Segmentation with
Transformer [53.575573940055335]
我々は、MedSegDiff-V2と呼ばれるトランスフォーマーベースの拡散フレームワークを提案する。
画像の異なる20種類の画像分割作業において,その有効性を検証する。
論文 参考訳(メタデータ) (2023-01-19T03:42:36Z) - Optimizing Vision Transformers for Medical Image Segmentation and
Few-Shot Domain Adaptation [11.690799827071606]
我々はCS-Unet(Convolutional Swin-Unet)トランスフォーマーブロックを提案し、パッチ埋め込み、プロジェクション、フィードフォワードネットワーク、サンプリングおよびスキップ接続に関連する設定を最適化する。
CS-Unetはゼロからトレーニングすることができ、各機能プロセスフェーズにおける畳み込みの優位性を継承する。
実験によると、CS-Unetは事前トレーニングなしで、パラメータが少ない2つの医療用CTおよびMRIデータセットに対して、最先端の他のデータセットを大きなマージンで上回っている。
論文 参考訳(メタデータ) (2022-10-14T19:18:52Z) - MISSU: 3D Medical Image Segmentation via Self-distilling TransUNet [55.16833099336073]
医用画像セグメンテーションのためのトランスフォーマーベースUNetを提案する。
グローバルな意味情報と局所的な空間的詳細特徴を同時に学習する。
MISSUは従来の最先端手法よりも優れた性能を発揮する。
論文 参考訳(メタデータ) (2022-06-02T07:38:53Z) - D-Former: A U-shaped Dilated Transformer for 3D Medical Image
Segmentation [7.635663740358682]
そこで我々はDilated Transformerと呼ばれる新しい手法を提案し、ローカルとグローバルの領域で交互にキャプチャされたペアワイドパッチ関係に対して自己アテンションを行う。
拡張畳み込みカーネルにインスパイアされた我々は、グローバルな自己意識を拡張的に実行し、関連するパッチを増やさずに受容領域を拡大し、計算コストを削減した。
論文 参考訳(メタデータ) (2022-01-03T03:20:35Z) - Swin-Unet: Unet-like Pure Transformer for Medical Image Segmentation [63.46694853953092]
Swin-Unetは、医用画像セグメンテーション用のUnetライクなトランスフォーマーである。
トークン化されたイメージパッチは、TransformerベースのU字型デコーダデコーダアーキテクチャに供給される。
論文 参考訳(メタデータ) (2021-05-12T09:30:26Z) - TransMed: Transformers Advance Multi-modal Medical Image Classification [4.500880052705654]
畳み込みニューラルネットワーク(CNN)は、医療画像解析タスクで非常に競争力のあるパフォーマンスを示しています。
トランスフォーマーはコンピュータビジョンに適用され、大規模なデータセットで顕著な成功を収めた。
TransMedはCNNとトランスフォーマーの利点を組み合わせて、画像の低レベル特徴を効率的に抽出する。
論文 参考訳(メタデータ) (2021-03-10T08:57:53Z) - CoTr: Efficiently Bridging CNN and Transformer for 3D Medical Image
Segmentation [95.51455777713092]
畳み込みニューラルネットワーク(CNN)は、現代の3D医療画像セグメンテーションのデファクトスタンダードとなっている。
本稿では,bf畳み込みニューラルネットワークとbfトランスbf(cotr)を効率良く橋渡しし,正確な3次元医用画像分割を実現する新しい枠組みを提案する。
論文 参考訳(メタデータ) (2021-03-04T13:34:22Z) - Medical Transformer: Gated Axial-Attention for Medical Image
Segmentation [73.98974074534497]
医用画像分割タスクにおけるトランスフォーマティブネットワークアーキテクチャの利用可能性について検討する。
セルフアテンションモジュールに追加の制御機構を導入することで,既存のアーキテクチャを拡張するGated Axial-Attentionモデルを提案する。
医療画像上で効果的にモデルを訓練するために,さらにパフォーマンスを向上させる局所的グローバルトレーニング戦略 (logo) を提案する。
論文 参考訳(メタデータ) (2021-02-21T18:35:14Z) - TransUNet: Transformers Make Strong Encoders for Medical Image
Segmentation [78.01570371790669]
医用画像のセグメンテーションは医療システムの開発に必須の前提条件である。
様々な医療画像セグメンテーションタスクにおいて、U-Netとして知られるu字型アーキテクチャがデファクトスタンダードとなっている。
医用画像セグメンテーションの強力な代替手段として,トランスフォーマーとU-Netの両方を有効活用するTransUNetを提案する。
論文 参考訳(メタデータ) (2021-02-08T16:10:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。