Fugu-MT 論文翻訳(概要): A Recent Survey of Vision Transformers for Medical Image Segmentation

論文の概要: A Recent Survey of Vision Transformers for Medical Image Segmentation

arxiv url: http://arxiv.org/abs/2312.00634v1
Date: Fri, 1 Dec 2023 14:54:44 GMT
ステータス: 翻訳完了
システム内更新日: 2023-12-04 14:07:30.764131
Title: A Recent Survey of Vision Transformers for Medical Image Segmentation
Title（参考訳）: 医用画像分割用視覚変換器に関する最近の調査
Authors: Asifullah Khan, Zunaira Rauf, Abdul Rehman Khan, Saima Rathore, Saddam Hussain Khan, Sahar Shah, Umair Farooq, Hifsa Asif, Aqsa Asif, Umme Zahoora, Rafi Ullah Khalil, Suleman Qamar, Umme Hani Asif, Faiza Babar Khan, Abdul Majid and Jeonghwan Gwak
Abstract要約: ヴィジュアルトランスフォーマー(ViT)は、医用画像セグメンテーションの課題に対処するための有望な技術として登場した。近年、研究者らは、ハイブリッドビジョントランスフォーマー(HVT)として知られるアーキテクチャにCNNを組み込む様々なViTベースのアプローチを考案した。
参考スコア（独自算出の注目度）: 2.4895533667182703
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Medical image segmentation plays a crucial role in various healthcare applications, enabling accurate diagnosis, treatment planning, and disease monitoring. In recent years, Vision Transformers (ViTs) have emerged as a promising technique for addressing the challenges in medical image segmentation. In medical images, structures are usually highly interconnected and globally distributed. ViTs utilize their multi-scale attention mechanism to model the long-range relationships in the images. However, they do lack image-related inductive bias and translational invariance, potentially impacting their performance. Recently, researchers have come up with various ViT-based approaches that incorporate CNNs in their architectures, known as Hybrid Vision Transformers (HVTs) to capture local correlation in addition to the global information in the images. This survey paper provides a detailed review of the recent advancements in ViTs and HVTs for medical image segmentation. Along with the categorization of ViT and HVT-based medical image segmentation approaches we also present a detailed overview of their real-time applications in several medical image modalities. This survey may serve as a valuable resource for researchers, healthcare practitioners, and students in understanding the state-of-the-art approaches for ViT-based medical image segmentation.
Abstract（参考訳）: 医療画像分割は、診断、治療計画、疾患のモニタリングを可能にする様々な医療アプリケーションにおいて重要な役割を果たす。近年,ビジョントランスフォーマー (ViT) は医用画像セグメンテーションの課題に対処するための有望な手法として登場している。医療画像では、構造は通常高度に相互接続され、グローバルに分布する。 ViTは、画像内の長距離関係をモデル化するために、そのマルチスケールアテンションメカニズムを利用する。しかし、画像に関連した帰納バイアスや翻訳的不変性が欠如しており、性能に影響を及ぼす可能性がある。近年、研究者らはCNNをアーキテクチャに組み込んだ様々なViTベースのアプローチ、HVT(Hybrid Vision Transformers)を考案し、画像のグローバル情報に加えて局所的相関を捉えている。本研究は, 医用画像セグメンテーションにおけるViTsおよびHVTsの最近の進歩について, 概説する。 ViTおよびHVTに基づく医用画像分割手法の分類とともに、複数の医用画像モダリティにおけるリアルタイム応用の概要を詳述する。この調査は、ViTベースの医療画像セグメンテーションの最先端のアプローチを理解する上で、研究者、医療実践者、学生にとって貴重なリソースとなる可能性がある。

関連論文リスト

Multimodal Causal-Driven Representation Learning for Generalizable Medical Image Segmentation [56.52520416420957]
医用画像セグメンテーションにおける領域一般化に取り組むために, MCDRL(Multimodal Causal-Driven Representation Learning)を提案する。 MCDRLは競合する手法より一貫して優れ、セグメンテーション精度が優れ、堅牢な一般化性を示す。
論文参考訳（メタデータ） (2025-08-07T03:41:41Z)
Evaluating Visual Explanations of Attention Maps for Transformer-based Medical Imaging [2.6505619784178047]
注意マップの視覚的説明と,他の医用画像診断法との比較を行った。注意マップは一定の条件下での有望性を示し,説明可能性においてGradCAMを上回っていることがわかった。本研究は, 認識可能性の方法としての注意マップの有効性が文脈依存的であり, 医用意思決定に必要となる総合的な洞察を常に提供していないため, 限定的である可能性が示唆された。
論文参考訳（メタデータ） (2025-03-12T16:52:52Z)
U-Net in Medical Image Segmentation: A Review of Its Applications Across Modalities [0.0]
人工知能(AI)と深層学習(DL)の進歩は医療画像セグメンテーション(MIS)に変化をもたらしたこれらのモデルは、様々な画像モダリティにまたがる効率的で正確な画素単位の分類を可能にする。本稿では,様々な医用画像技術について検討し,U-Netアーキテクチャとその適応について検討し,その応用方法について考察する。
論文参考訳（メタデータ） (2024-12-03T08:11:06Z)
Med-TTT: Vision Test-Time Training model for Medical Image Segmentation [5.318153305245246]
We propose Med-TTT, a visual backbone network with Test-Time Training layer。このモデルは精度、感度、Dice係数の点で先行的な性能を達成する。
論文参考訳（メタデータ） (2024-10-03T14:29:46Z)
Scribble-Based Interactive Segmentation of Medical Hyperspectral Images [4.675955891956077]
本研究は、医用ハイパースペクトル画像のためのスクリブルベースのインタラクティブセグメンテーションフレームワークを導入する。提案手法は,特徴抽出のための深層学習と,ユーザが提供するスクリブルから生成された測地距離マップを利用する。
論文参考訳（メタデータ） (2024-08-05T12:33:07Z)
Advancing Medical Image Segmentation: Morphology-Driven Learning with Diffusion Transformer [4.672688418357066]
本稿では,雑音の存在下での頑健なセグメンテーションのためのトランスフォーマー拡散(DTS)モデルを提案する。画像の形態的表現を解析する本モデルでは, 種々の医用画像モダリティにおいて, 従来のモデルよりも良好な結果が得られた。
論文参考訳（メタデータ） (2024-08-01T07:35:54Z)
From CNN to Transformer: A Review of Medical Image Segmentation Models [7.3150850275578145]
医用画像セグメンテーションのための深層学習が主流となっている。本稿では,近年最も代表的な4つの医用画像セグメンテーションモデルについて調査する。理論的にこれらのモデルの特徴を解析し、2つのベンチマークデータセット上でそれらの性能を定量的に評価する。
論文参考訳（メタデータ） (2023-08-10T02:48:57Z)
A hybrid approach for improving U-Net variants in medical image segmentation [0.0]
医学的イメージを様々なセグメントや興味のある領域に分割する技術は、医学的イメージセグメンテーションとして知られている。生成されたセグメント画像は、診断、手術計画、治療評価など、さまざまな用途に利用することができる。本研究の目的は,深層的に分離可能な畳み込みを用いたネットワークパラメータ要求の低減である。
論文参考訳（メタデータ） (2023-07-31T07:43:45Z)
Data-Efficient Vision Transformers for Multi-Label Disease Classification on Chest Radiographs [55.78588835407174]
視覚変換器(ViT)は一般的な画像の分類性能が高いにもかかわらず、このタスクには適用されていない。 ViTは、畳み込みではなくパッチベースの自己アテンションに依存しており、CNNとは対照的に、ローカル接続に関する事前の知識は存在しない。以上の結果から,ViTとCNNのパフォーマンスはViTの利点に匹敵するものの,DeiTsはトレーニング用に適度に大規模なデータセットが利用可能であれば,前者よりも優れることがわかった。
論文参考訳（メタデータ） (2022-08-17T09:07:45Z)
AlignTransformer: Hierarchical Alignment of Visual Regions and Disease Tags for Medical Report Generation [50.21065317817769]
本稿では,Align Hierarchical Attention (AHA)とMulti-Grained Transformer (MGT)モジュールを含むAlign Transformerフレームワークを提案する。パブリックなIU-XrayとMIMIC-CXRデータセットの実験は、AlignTransformerが2つのデータセットの最先端メソッドと競合する結果が得られることを示している。
論文参考訳（メタデータ） (2022-03-18T13:43:53Z)
Transformers in Medical Imaging: A Survey [88.03790310594533]
トランスフォーマーはいくつかのコンピュータビジョン問題に適用され、最先端の結果が得られた。医療画像はまた、局所受容野を持つCNNと比較して、グローバルな文脈を捉えられるトランスフォーマーへの関心が高まっている。本稿では,最近提案された建築設計から未解決問題に至るまで,医療画像におけるトランスフォーマーの応用について概説する。
論文参考訳（メタデータ） (2022-01-24T18:50:18Z)
Medical Transformer: Gated Axial-Attention for Medical Image Segmentation [73.98974074534497]
医用画像分割タスクにおけるトランスフォーマティブネットワークアーキテクチャの利用可能性について検討する。セルフアテンションモジュールに追加の制御機構を導入することで,既存のアーキテクチャを拡張するGated Axial-Attentionモデルを提案する。医療画像上で効果的にモデルを訓練するために,さらにパフォーマンスを向上させる局所的グローバルトレーニング戦略 (logo) を提案する。
論文参考訳（メタデータ） (2021-02-21T18:35:14Z)
Few-shot Medical Image Segmentation using a Global Correlation Network with Discriminative Embedding [60.89561661441736]
医療画像分割のための新しい手法を提案する。深層畳み込みネットワークを用いた数ショット画像セグメンタを構築します。深層埋め込みの識別性を高め,同一クラスの特徴領域のクラスタリングを促進する。
論文参考訳（メタデータ） (2020-12-10T04:01:07Z)
Pathological Retinal Region Segmentation From OCT Images Using Geometric Relation Based Augmentation [84.7571086566595]
本稿では,幾何学と形状の内在的関係を共同で符号化することで,従来のGANベースの医用画像合成法よりも優れた手法を提案する。提案手法は,取得手順の異なる画像を有する公開RETOUCHデータセット上で,最先端のセグメンテーション手法より優れている。
論文参考訳（メタデータ） (2020-03-31T11:50:43Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。