論文の概要: SegTransVAE: Hybrid CNN -- Transformer with Regularization for medical
image segmentation
- arxiv url: http://arxiv.org/abs/2201.08582v4
- Date: Sat, 30 Sep 2023 07:01:56 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-03 21:38:09.114139
- Title: SegTransVAE: Hybrid CNN -- Transformer with Regularization for medical
image segmentation
- Title(参考訳): SegTransVAE:ハイブリッドCNN -- 医療画像分割のための正規化トランスフォーマー
- Authors: Quan-Dung Pham (1), Hai Nguyen-Truong (1, 2 and 3), Nam Nguyen Phuong
(1) and Khoa N. A. Nguyen (1, 2 and 3) ((1) VinBrain JSC., Vietnam, (2)
University of Science, Ho Chi Minh City, Vietnam, (3) Vietnam National
University, Ho Chi Minh City, Vietnam)
- Abstract要約: 本稿では,SegTransVAEという新しいネットワークを提案する。
SegTransVAEはエンコーダ-デコーダアーキテクチャに基づいて構築されており、ネットワークへの可変オートエンコーダ(VAE)ブランチでトランスフォーマーを利用する。
最近導入されたデータセットの評価によると、SegTransVAEはDice Scoreと95%$-Haudorff Distanceで過去の手法より優れている。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Current research on deep learning for medical image segmentation exposes
their limitations in learning either global semantic information or local
contextual information. To tackle these issues, a novel network named
SegTransVAE is proposed in this paper. SegTransVAE is built upon
encoder-decoder architecture, exploiting transformer with the variational
autoencoder (VAE) branch to the network to reconstruct the input images jointly
with segmentation. To the best of our knowledge, this is the first method
combining the success of CNN, transformer, and VAE. Evaluation on various
recently introduced datasets shows that SegTransVAE outperforms previous
methods in Dice Score and $95\%$-Haudorff Distance while having comparable
inference time to a simple CNN-based architecture network. The source code is
available at: https://github.com/itruonghai/SegTransVAE.
- Abstract(参考訳): 医用画像セグメンテーションのためのディープラーニングに関する研究は、グローバルな意味情報や局所的な文脈情報を学ぶ際の限界を明らかにする。
これらの課題に対処するために,SegTransVAEという新しいネットワークを提案する。
SegTransVAEはエンコーダ-デコーダアーキテクチャに基づいて構築されており、ネットワークへの可変オートエンコーダ(VAE)ブランチによるトランスフォーマーを利用して、セグメント化とともに入力イメージを再構築する。
私たちの知る限りでは、これはCNN、トランスフォーマー、VAEの成功を組み合わせた最初の方法です。
最近導入されたさまざまなデータセットの評価によると、SegTransVAEはDice Scoreの以前のメソッドと9,5\%$-Haudorff Distanceを上回り、単純なCNNベースのアーキテクチャネットワークに匹敵する推論時間を持つ。
ソースコードはhttps://github.com/itruonghai/segtransvae。
関連論文リスト
- ParaTransCNN: Parallelized TransCNN Encoder for Medical Image
Segmentation [7.955518153976858]
本稿では,畳み込みニューラルネットワークとトランスフォーマーアーキテクチャを組み合わせた2次元特徴抽出手法を提案する。
特に小臓器では, セグメンテーションの精度が向上した。
論文 参考訳(メタデータ) (2024-01-27T05:58:36Z) - CATS v2: Hybrid encoders for robust medical segmentation [12.194439938007672]
畳み込みニューラルネットワーク(CNN)は、医用画像分割タスクにおいて強力な性能を示した。
しかし、畳み込みカーネルの視野が限られているため、CNNがグローバル情報を完全に表現することは困難である。
ローカル情報とグローバル情報の両方を活用するハイブリッドエンコーダを用いたCATS v2を提案する。
論文 参考訳(メタデータ) (2023-08-11T20:21:54Z) - MISSU: 3D Medical Image Segmentation via Self-distilling TransUNet [55.16833099336073]
医用画像セグメンテーションのためのトランスフォーマーベースUNetを提案する。
グローバルな意味情報と局所的な空間的詳細特徴を同時に学習する。
MISSUは従来の最先端手法よりも優れた性能を発揮する。
論文 参考訳(メタデータ) (2022-06-02T07:38:53Z) - ViTBIS: Vision Transformer for Biomedical Image Segmentation [0.0]
バイオメディカルイメージのためのビジョントランスフォーマー(ViTBIS)という新しいネットワークを提案する。
当社のネットワークでは,入力機能マップを3つのパートに分割して,エンコーダとデコーダの両方で1時間1ドル,3時間3ドル,5ドル5セントの畳み込みを行う。
論文 参考訳(メタデータ) (2022-01-15T20:44:45Z) - Semi-Supervised Medical Image Segmentation via Cross Teaching between
CNN and Transformer [11.381487613753004]
本稿では,CNN と Transformer の相互教育を導入することで,半教師付き医用画像セグメンテーションの枠組みを提案する。
特に、この研究は、CNNとトランスフォーマーを組み合わせて半教師付き医療画像セグメンテーションを行い、公的なベンチマークで有望な結果を得る最初の試みかもしれない。
論文 参考訳(メタデータ) (2021-12-09T13:22:38Z) - HAT: Hierarchical Aggregation Transformers for Person Re-identification [87.02828084991062]
我々は,CNNとトランスフォーマーの両方の利点を,高性能な画像ベース人物Re-IDに適用する。
作業は、画像ベースのRe-IDのためのCNNとTransformerの両方の利点を初めて活用する。
論文 参考訳(メタデータ) (2021-07-13T09:34:54Z) - Swin-Unet: Unet-like Pure Transformer for Medical Image Segmentation [63.46694853953092]
Swin-Unetは、医用画像セグメンテーション用のUnetライクなトランスフォーマーである。
トークン化されたイメージパッチは、TransformerベースのU字型デコーダデコーダアーキテクチャに供給される。
論文 参考訳(メタデータ) (2021-05-12T09:30:26Z) - CoTr: Efficiently Bridging CNN and Transformer for 3D Medical Image
Segmentation [95.51455777713092]
畳み込みニューラルネットワーク(CNN)は、現代の3D医療画像セグメンテーションのデファクトスタンダードとなっている。
本稿では,bf畳み込みニューラルネットワークとbfトランスbf(cotr)を効率良く橋渡しし,正確な3次元医用画像分割を実現する新しい枠組みを提案する。
論文 参考訳(メタデータ) (2021-03-04T13:34:22Z) - TransUNet: Transformers Make Strong Encoders for Medical Image
Segmentation [78.01570371790669]
医用画像のセグメンテーションは医療システムの開発に必須の前提条件である。
様々な医療画像セグメンテーションタスクにおいて、U-Netとして知られるu字型アーキテクチャがデファクトスタンダードとなっている。
医用画像セグメンテーションの強力な代替手段として,トランスフォーマーとU-Netの両方を有効活用するTransUNetを提案する。
論文 参考訳(メタデータ) (2021-02-08T16:10:50Z) - Rethinking Semantic Segmentation from a Sequence-to-Sequence Perspective
with Transformers [149.78470371525754]
セマンティックセグメンテーションをシーケンスからシーケンスへの予測タスクとして扱う。
具体的には、イメージをパッチのシーケンスとしてエンコードするために純粋なトランスをデプロイします。
トランスのすべての層でモデル化されたグローバルコンテキストにより、このエンコーダは、SETR(SEgmentation TRansformer)と呼ばれる強力なセグメンテーションモデルを提供するための単純なデコーダと組み合わせることができる。
SETRはADE20K(50.28% mIoU)、Pascal Context(55.83% mIoU)、およびCityscapesの競争力のある結果に関する最新技術を達成している。
論文 参考訳(メタデータ) (2020-12-31T18:55:57Z) - Test-Time Adaptable Neural Networks for Robust Medical Image
Segmentation [9.372152932156293]
畳み込みニューラルネットワーク(CNN)は、教師付き学習問題に対して非常にうまく機能する。
医用画像のセグメンテーションにおいて、この前提は、取得の詳細の観点から、トレーニング画像とテスト画像のミスマッチがある場合に違反する。
比較的浅い画像正規化CNNと、正規化画像を分割する深いCNNの2つのサブネットワークの結合としてセグメンテーションCNNを設計する。
論文 参考訳(メタデータ) (2020-04-09T16:57:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。