論文の概要: A Recent Survey of Vision Transformers for Medical Image Segmentation
- arxiv url: http://arxiv.org/abs/2312.00634v2
- Date: Tue, 19 Dec 2023 03:49:48 GMT
- ステータス: 処理完了
- システム内更新日: 2023-12-20 22:00:57.921686
- Title: A Recent Survey of Vision Transformers for Medical Image Segmentation
- Title(参考訳): 医用画像分割用視覚変換器に関する最近の調査
- Authors: Asifullah Khan, Zunaira Rauf, Abdul Rehman Khan, Saima Rathore, Saddam
Hussain Khan, Najmus Saher Shah, Umair Farooq, Hifsa Asif, Aqsa Asif, Umme
Zahoora, Rafi Ullah Khalil, Suleman Qamar, Umme Hani Asif, Faiza Babar Khan,
Abdul Majid and Jeonghwan Gwak
- Abstract要約: ヴィジュアルトランスフォーマー(ViT)は、医用画像セグメンテーションの課題に対処するための有望な技術として登場した。
マルチスケールアテンション機構により、遠方構造間の長距離依存を効果的にモデル化することができる。
近年、研究者らは、ハイブリッドビジョントランスフォーマー(HVT)として知られるアーキテクチャにCNNを組み込む様々なViTベースのアプローチを考案した。
- 参考スコア(独自算出の注目度): 2.4895533667182703
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Medical image segmentation plays a crucial role in various healthcare
applications, enabling accurate diagnosis, treatment planning, and disease
monitoring. Traditionally, convolutional neural networks (CNNs) dominated this
domain, excelling at local feature extraction. However, their limitations in
capturing long-range dependencies across image regions pose challenges for
segmenting complex, interconnected structures often encountered in medical
data. In recent years, Vision Transformers (ViTs) have emerged as a promising
technique for addressing the challenges in medical image segmentation. Their
multi-scale attention mechanism enables effective modeling of long-range
dependencies between distant structures, crucial for segmenting organs or
lesions spanning the image. Additionally, ViTs' ability to discern subtle
pattern heterogeneity allows for the precise delineation of intricate
boundaries and edges, a critical aspect of accurate medical image segmentation.
However, they do lack image-related inductive bias and translational
invariance, potentially impacting their performance. Recently, researchers have
come up with various ViT-based approaches that incorporate CNNs in their
architectures, known as Hybrid Vision Transformers (HVTs) to capture local
correlation in addition to the global information in the images. This survey
paper provides a detailed review of the recent advancements in ViTs and HVTs
for medical image segmentation. Along with the categorization of ViT and
HVT-based medical image segmentation approaches, we also present a detailed
overview of their real-time applications in several medical image modalities.
This survey may serve as a valuable resource for researchers, healthcare
practitioners, and students in understanding the state-of-the-art approaches
for ViT-based medical image segmentation.
- Abstract(参考訳): 医療画像分割は、診断、治療計画、疾患のモニタリングを可能にする様々な医療アプリケーションにおいて重要な役割を果たす。
伝統的に畳み込みニューラルネットワーク(cnns)がこの領域を支配し、局所的な特徴抽出に優れていた。
しかし、画像領域にまたがる長距離依存関係をキャプチャする際の制限は、医療データでしばしば発生する複雑な相互接続構造をセグメント化するための課題を引き起こす。
近年,ビジョントランスフォーマー (ViT) は医用画像セグメンテーションの課題に対処するための有望な手法として登場している。
マルチスケールの注意機構により、画像にまたがる臓器や病変の分断に不可欠な、遠方構造間の長距離依存関係の効果的なモデリングが可能になる。
さらに、微妙なパターンの不均一性を識別するViTsの能力は、正確な医用画像セグメンテーションの重要な側面である、複雑な境界と縁の正確な明細化を可能にする。
しかし、画像に関連した帰納バイアスや翻訳的不変性が欠如しており、性能に影響を及ぼす可能性がある。
近年、研究者らはCNNをアーキテクチャに組み込んだ様々なViTベースのアプローチ、HVT(Hybrid Vision Transformers)を考案し、画像のグローバル情報に加えて局所的相関を捉えている。
本研究は, 医用画像セグメンテーションにおけるViTsおよびHVTsの最近の進歩について, 概説する。
ViTとHVTをベースとした医用画像分割手法の分類とともに,複数の医用画像モダリティにおけるリアルタイム応用の概要を述べる。
この調査は、ViTベースの医療画像セグメンテーションの最先端のアプローチを理解する上で、研究者、医療実践者、学生にとって貴重なリソースとなる可能性がある。
関連論文リスト
- Med-TTT: Vision Test-Time Training model for Medical Image Segmentation [5.318153305245246]
We propose Med-TTT, a visual backbone network with Test-Time Training layer。
このモデルは精度、感度、Dice係数の点で先行的な性能を達成する。
論文 参考訳(メタデータ) (2024-10-03T14:29:46Z) - Scribble-Based Interactive Segmentation of Medical Hyperspectral Images [4.675955891956077]
本研究は、医用ハイパースペクトル画像のためのスクリブルベースのインタラクティブセグメンテーションフレームワークを導入する。
提案手法は,特徴抽出のための深層学習と,ユーザが提供するスクリブルから生成された測地距離マップを利用する。
論文 参考訳(メタデータ) (2024-08-05T12:33:07Z) - Advancing Medical Image Segmentation: Morphology-Driven Learning with Diffusion Transformer [4.672688418357066]
本稿では,雑音の存在下での頑健なセグメンテーションのためのトランスフォーマー拡散(DTS)モデルを提案する。
画像の形態的表現を解析する本モデルでは, 種々の医用画像モダリティにおいて, 従来のモデルよりも良好な結果が得られた。
論文 参考訳(メタデータ) (2024-08-01T07:35:54Z) - From CNN to Transformer: A Review of Medical Image Segmentation Models [7.3150850275578145]
医用画像セグメンテーションのための深層学習が主流となっている。
本稿では,近年最も代表的な4つの医用画像セグメンテーションモデルについて調査する。
理論的にこれらのモデルの特徴を解析し、2つのベンチマークデータセット上でそれらの性能を定量的に評価する。
論文 参考訳(メタデータ) (2023-08-10T02:48:57Z) - A hybrid approach for improving U-Net variants in medical image
segmentation [0.0]
医学的イメージを様々なセグメントや興味のある領域に分割する技術は、医学的イメージセグメンテーションとして知られている。
生成されたセグメント画像は、診断、手術計画、治療評価など、さまざまな用途に利用することができる。
本研究の目的は,深層的に分離可能な畳み込みを用いたネットワークパラメータ要求の低減である。
論文 参考訳(メタデータ) (2023-07-31T07:43:45Z) - Data-Efficient Vision Transformers for Multi-Label Disease
Classification on Chest Radiographs [55.78588835407174]
視覚変換器(ViT)は一般的な画像の分類性能が高いにもかかわらず、このタスクには適用されていない。
ViTは、畳み込みではなくパッチベースの自己アテンションに依存しており、CNNとは対照的に、ローカル接続に関する事前の知識は存在しない。
以上の結果から,ViTとCNNのパフォーマンスはViTの利点に匹敵するものの,DeiTsはトレーニング用に適度に大規模なデータセットが利用可能であれば,前者よりも優れることがわかった。
論文 参考訳(メタデータ) (2022-08-17T09:07:45Z) - AlignTransformer: Hierarchical Alignment of Visual Regions and Disease
Tags for Medical Report Generation [50.21065317817769]
本稿では,Align Hierarchical Attention (AHA)とMulti-Grained Transformer (MGT)モジュールを含むAlign Transformerフレームワークを提案する。
パブリックなIU-XrayとMIMIC-CXRデータセットの実験は、AlignTransformerが2つのデータセットの最先端メソッドと競合する結果が得られることを示している。
論文 参考訳(メタデータ) (2022-03-18T13:43:53Z) - Transformers in Medical Imaging: A Survey [88.03790310594533]
トランスフォーマーはいくつかのコンピュータビジョン問題に適用され、最先端の結果が得られた。
医療画像はまた、局所受容野を持つCNNと比較して、グローバルな文脈を捉えられるトランスフォーマーへの関心が高まっている。
本稿では,最近提案された建築設計から未解決問題に至るまで,医療画像におけるトランスフォーマーの応用について概説する。
論文 参考訳(メタデータ) (2022-01-24T18:50:18Z) - Medical Transformer: Gated Axial-Attention for Medical Image
Segmentation [73.98974074534497]
医用画像分割タスクにおけるトランスフォーマティブネットワークアーキテクチャの利用可能性について検討する。
セルフアテンションモジュールに追加の制御機構を導入することで,既存のアーキテクチャを拡張するGated Axial-Attentionモデルを提案する。
医療画像上で効果的にモデルを訓練するために,さらにパフォーマンスを向上させる局所的グローバルトレーニング戦略 (logo) を提案する。
論文 参考訳(メタデータ) (2021-02-21T18:35:14Z) - Few-shot Medical Image Segmentation using a Global Correlation Network
with Discriminative Embedding [60.89561661441736]
医療画像分割のための新しい手法を提案する。
深層畳み込みネットワークを用いた数ショット画像セグメンタを構築します。
深層埋め込みの識別性を高め,同一クラスの特徴領域のクラスタリングを促進する。
論文 参考訳(メタデータ) (2020-12-10T04:01:07Z) - Pathological Retinal Region Segmentation From OCT Images Using Geometric
Relation Based Augmentation [84.7571086566595]
本稿では,幾何学と形状の内在的関係を共同で符号化することで,従来のGANベースの医用画像合成法よりも優れた手法を提案する。
提案手法は,取得手順の異なる画像を有する公開RETOUCHデータセット上で,最先端のセグメンテーション手法より優れている。
論文 参考訳(メタデータ) (2020-03-31T11:50:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。