論文の概要: EViT-Unet: U-Net Like Efficient Vision Transformer for Medical Image Segmentation on Mobile and Edge Devices
- arxiv url: http://arxiv.org/abs/2410.15036v1
- Date: Sat, 19 Oct 2024 08:42:53 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-10-22 13:16:58.839105
- Title: EViT-Unet: U-Net Like Efficient Vision Transformer for Medical Image Segmentation on Mobile and Edge Devices
- Title(参考訳): EViT-Unet:モバイルおよびエッジデバイス上での医用画像セグメンテーションのためのU-Netライクな視覚変換器
- Authors: Xin Li, Wenhui Zhu, Xuanzhao Dong, Oana M. Dumitrascu, Yalin Wang,
- Abstract要約: 精度を維持しながら計算複雑性を低減できる,効率的なViTベースのセグメンテーションネットワークであるEViT-UNetを提案する。
EViT-UNetは、エンコーダ、デコーダ、ボトルネック層、スキップ接続からなるU字型アーキテクチャ上に構築されている。
実験の結果、EViT-UNetは、計算複雑性を著しく低減しつつ、医用画像のセグメンテーションにおいて高い精度を達成することが示された。
- 参考スコア(独自算出の注目度): 5.307205032859535
- License:
- Abstract: With the rapid development of deep learning, CNN-based U-shaped networks have succeeded in medical image segmentation and are widely applied for various tasks. However, their limitations in capturing global features hinder their performance in complex segmentation tasks. The rise of Vision Transformer (ViT) has effectively compensated for this deficiency of CNNs and promoted the application of ViT-based U-networks in medical image segmentation. However, the high computational demands of ViT make it unsuitable for many medical devices and mobile platforms with limited resources, restricting its deployment on resource-constrained and edge devices. To address this, we propose EViT-UNet, an efficient ViT-based segmentation network that reduces computational complexity while maintaining accuracy, making it ideal for resource-constrained medical devices. EViT-UNet is built on a U-shaped architecture, comprising an encoder, decoder, bottleneck layer, and skip connections, combining convolutional operations with self-attention mechanisms to optimize efficiency. Experimental results demonstrate that EViT-UNet achieves high accuracy in medical image segmentation while significantly reducing computational complexity.
- Abstract(参考訳): ディープラーニングの急速な発展に伴い、CNNベースのU字型ネットワークは医療画像のセグメンテーションに成功し、様々なタスクに広く応用されている。
しかし、グローバル機能をキャプチャする際の制限は、複雑なセグメンテーションタスクのパフォーマンスを妨げている。
ビジョントランスフォーマー(ViT)の台頭は、このCNNの欠如を効果的に補い、医用画像セグメンテーションにおけるViTベースのU-networksの適用を促進した。
しかし、ViTの高い計算要求により、リソースが限られている多くの医療機器やモバイルプラットフォームには適さないため、リソース制約やエッジデバイスへのデプロイメントが制限される。
そこで本稿では,精度を維持しながら計算複雑性を低減し,資源制約のある医療機器に最適である,効率的なViTベースのセグメンテーションネットワークであるEViT-UNetを提案する。
EViT-UNetは、エンコーダ、デコーダ、ボトルネック層、スキップ接続で構成されるU字型アーキテクチャ上に構築されており、畳み込み操作と自己保持機構を組み合わせて効率を最適化している。
実験の結果、EViT-UNetは、計算複雑性を著しく低減しつつ、医用画像のセグメンテーションにおいて高い精度を達成することが示された。
関連論文リスト
- CSWin-UNet: Transformer UNet with Cross-Shaped Windows for Medical Image Segmentation [22.645013853519]
CSWin-UNetは,CSWinの自己保持機構をUNetに組み込んだ,U字型のセグメンテーション手法である。
シナプス多臓器CT, 心臓MRI, 皮膚病変など多種多様なデータセットに対する経験的評価は, CSWin-UNetは高いセグメンテーション精度を達成しつつ, 低モデルの複雑さを維持していることを示している。
論文 参考訳(メタデータ) (2024-07-25T14:25:17Z) - CMUNeXt: An Efficient Medical Image Segmentation Network based on Large
Kernel and Skip Fusion [11.434576556863934]
CMUNeXtは、効率的な完全畳み込み軽量医療画像セグメンテーションネットワークである。
実際のシーンシナリオにおいて、迅速かつ正確な補助診断を可能にする。
論文 参考訳(メタデータ) (2023-08-02T15:54:00Z) - MISSU: 3D Medical Image Segmentation via Self-distilling TransUNet [55.16833099336073]
医用画像セグメンテーションのためのトランスフォーマーベースUNetを提案する。
グローバルな意味情報と局所的な空間的詳細特徴を同時に学習する。
MISSUは従来の最先端手法よりも優れた性能を発揮する。
論文 参考訳(メタデータ) (2022-06-02T07:38:53Z) - A Simple Single-Scale Vision Transformer for Object Localization and
Instance Segmentation [79.265315267391]
We propose a simple and compact ViT architecture called Universal Vision Transformer (UViT)。
UViTは、オブジェクト検出とインスタンスセグメンテーションタスクで強力なパフォーマンスを達成する。
論文 参考訳(メタデータ) (2021-12-17T20:11:56Z) - LeViT-UNet: Make Faster Encoders with Transformer for Medical Image
Segmentation [6.2059756782278965]
本稿では,LeViT TransformerモジュールをU-Netアーキテクチャに統合したLeViT-UNetを提案する。
具体的には、LeViT-UNetのエンコーダとしてLeViTを使用し、Transformerブロックの精度と効率をよりよくトレードオフする。
論文 参考訳(メタデータ) (2021-07-19T05:48:51Z) - UTNet: A Hybrid Transformer Architecture for Medical Image Segmentation [6.646135062704341]
トランスフォーマーアーキテクチャは多くの自然言語処理タスクで成功している。
医用画像セグメンテーションを強化するために,自己意識を畳み込みニューラルネットワークに統合する強力なハイブリッドトランスフォーマーアーキテクチャUTNetを提案する。
論文 参考訳(メタデータ) (2021-07-02T00:56:27Z) - Multi-Exit Semantic Segmentation Networks [78.44441236864057]
本稿では,最先端セグメンテーションモデルをMESSネットワークに変換するフレームワークを提案する。
パラメトリド早期出口を用いた特別訓練されたCNNは、より簡単なサンプルの推測時に、その深さに沿って保存する。
接続されたセグメンテーションヘッドの数、配置、アーキテクチャとエグジットポリシーを併用して、デバイス機能とアプリケーション固有の要件に適応する。
論文 参考訳(メタデータ) (2021-06-07T11:37:03Z) - CoTr: Efficiently Bridging CNN and Transformer for 3D Medical Image
Segmentation [95.51455777713092]
畳み込みニューラルネットワーク(CNN)は、現代の3D医療画像セグメンテーションのデファクトスタンダードとなっている。
本稿では,bf畳み込みニューラルネットワークとbfトランスbf(cotr)を効率良く橋渡しし,正確な3次元医用画像分割を実現する新しい枠組みを提案する。
論文 参考訳(メタデータ) (2021-03-04T13:34:22Z) - Medical Transformer: Gated Axial-Attention for Medical Image
Segmentation [73.98974074534497]
医用画像分割タスクにおけるトランスフォーマティブネットワークアーキテクチャの利用可能性について検討する。
セルフアテンションモジュールに追加の制御機構を導入することで,既存のアーキテクチャを拡張するGated Axial-Attentionモデルを提案する。
医療画像上で効果的にモデルを訓練するために,さらにパフォーマンスを向上させる局所的グローバルトレーニング戦略 (logo) を提案する。
論文 参考訳(メタデータ) (2021-02-21T18:35:14Z) - TransUNet: Transformers Make Strong Encoders for Medical Image
Segmentation [78.01570371790669]
医用画像のセグメンテーションは医療システムの開発に必須の前提条件である。
様々な医療画像セグメンテーションタスクにおいて、U-Netとして知られるu字型アーキテクチャがデファクトスタンダードとなっている。
医用画像セグメンテーションの強力な代替手段として,トランスフォーマーとU-Netの両方を有効活用するTransUNetを提案する。
論文 参考訳(メタデータ) (2021-02-08T16:10:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。