論文の概要: Medical Image Segmentation Using Directional Window Attention
- arxiv url: http://arxiv.org/abs/2406.17471v1
- Date: Tue, 25 Jun 2024 11:15:56 GMT
- ステータス: 処理完了
- システム内更新日: 2024-06-26 14:32:18.419025
- Title: Medical Image Segmentation Using Directional Window Attention
- Title(参考訳): 指向性ウィンドウアテンションを用いた医用画像のセグメンテーション
- Authors: Daniya Najiha Abdul Kareem, Mustansar Fiaz, Noa Novershtern, Hisham Cholakkal,
- Abstract要約: 医用画像セグメンテーションのための階層型エンコーダデコーダアーキテクチャであるDwinFormerを紹介する。
DwinFormerは、入力特徴マップの水平方向、垂直方向、深度方向に沿って、ローカルおよびグローバルな情報をキャプチャする。
挑戦的な3DMulti-organデータセットとCell HMSデータセットに関する実験は、DwinFormerのメリットを実証しています。
- 参考スコア(独自算出の注目度): 15.108458363491412
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Accurate segmentation of medical images is crucial for diagnostic purposes, including cell segmentation, tumor identification, and organ localization. Traditional convolutional neural network (CNN)-based approaches struggled to achieve precise segmentation results due to their limited receptive fields, particularly in cases involving multi-organ segmentation with varying shapes and sizes. The transformer-based approaches address this limitation by leveraging the global receptive field, but they often face challenges in capturing local information required for pixel-precise segmentation. In this work, we introduce DwinFormer, a hierarchical encoder-decoder architecture for medical image segmentation comprising a directional window (Dwin) attention and global self-attention (GSA) for feature encoding. The focus of our design is the introduction of Dwin block within DwinFormer that effectively captures local and global information along the horizontal, vertical, and depthwise directions of the input feature map by separately performing attention in each of these directional volumes. To this end, our Dwin block introduces a nested Dwin attention (NDA) that progressively increases the receptive field in horizontal, vertical, and depthwise directions and a convolutional Dwin attention (CDA) that captures local contextual information for the attention computation. While the proposed Dwin block captures local and global dependencies at the first two high-resolution stages of DwinFormer, the GSA block encodes global dependencies at the last two lower-resolution stages. Experiments over the challenging 3D Synapse Multi-organ dataset and Cell HMS dataset demonstrate the benefits of our DwinFormer over the state-of-the-art approaches. Our source code will be publicly available at \url{https://github.com/Daniyanaj/DWINFORMER}.
- Abstract(参考訳): 正確な医用画像のセグメンテーションは、細胞セグメンテーション、腫瘍の同定、臓器の局在などの診断目的に不可欠である。
従来の畳み込みニューラルネットワーク(CNN)ベースのアプローチは、受容領域が限られているため、正確なセグメンテーション結果を達成するのに苦労した。
トランスフォーマーベースのアプローチは、グローバルな受容場を活用することで、この制限に対処するが、ピクセル精度のセグメンテーションに必要なローカル情報をキャプチャする上で、しばしば課題に直面している。
本稿では,DwinFormerについて紹介する。DwinFormerは,指向性ウィンドウ(Dwin)と機能符号化のためのグローバル自己注意(GSA)からなる,医用画像セグメンテーションのための階層型エンコーダデコーダアーキテクチャである。
本設計の焦点はDwinFormer内におけるDwinブロックの導入であり,各方向のボリュームに注意を集中させることで,入力特徴マップの水平方向,垂直方向,深度方向の局所的および大域的情報を効果的にキャプチャする。
この目的のために、我々のドウィンブロックは、水平、垂直、深度方向の受容場を徐々に増加させるネストドウィンアテンション(NDA)と、アテンション計算のための局所的なコンテキスト情報をキャプチャする畳み込みドウィンアテンション(CDA)を導入している。
提案されたDwinブロックは、DwinFormerの最初の2つの高解像度ステージでローカルおよびグローバルな依存関係をキャプチャするが、GSAブロックは、最後の2つの低解像度ステージでグローバルな依存関係をエンコードする。
挑戦的な3D Synapse Multi-organデータセットとCell HMSデータセットに関する実験は、最先端アプローチに対するDwinFormerのメリットを実証しています。
ソースコードは \url{https://github.com/Daniyanaj/DWINFORMER} で公開されます。
関連論文リスト
- Perspective+ Unet: Enhancing Segmentation with Bi-Path Fusion and Efficient Non-Local Attention for Superior Receptive Fields [19.71033340093199]
本稿では,医療画像のセグメンテーションの限界を克服する新しいアーキテクチャであるspective+Unetを提案する。
このフレームワークは ENLTB という名前の効率的な非局所トランスフォーマーブロックを組み込んでおり、これはカーネル関数近似を利用して、効率的な長距離依存性キャプチャを行う。
ACDCとデータセットに関する実験結果から,提案したパースペクティブ+Unetの有効性が示された。
論文 参考訳(メタデータ) (2024-06-20T07:17:39Z) - BEFUnet: A Hybrid CNN-Transformer Architecture for Precise Medical Image
Segmentation [0.0]
本稿では,医療画像の正確な分割のために,身体情報とエッジ情報の融合を強化するBEFUnetという,革新的なU字型ネットワークを提案する。
BEFUnetは、新しいローカル・クロス・アテンション・フィーチャー(LCAF)融合モジュール、新しいダブル・レベル・フュージョン(DLF)モジュール、デュアルブランチ・エンコーダの3つの主要モジュールから構成されている。
LCAFモジュールは、2つのモダリティの間に空間的に近接する特徴に対して、局所的な相互注意を選択的に行うことにより、エッジとボディの特徴を効率よく融合させる。
論文 参考訳(メタデータ) (2024-02-13T21:03:36Z) - Dual-scale Enhanced and Cross-generative Consistency Learning for Semi-supervised Medical Image Segmentation [49.57907601086494]
医用画像のセグメンテーションはコンピュータ支援診断において重要な役割を担っている。
半教師型医用画像(DEC-Seg)のための新しいDual-scale Enhanced and Cross-generative consistency learning frameworkを提案する。
論文 参考訳(メタデータ) (2023-12-26T12:56:31Z) - Source-Free Domain Adaptation for Medical Image Segmentation via
Prototype-Anchored Feature Alignment and Contrastive Learning [57.43322536718131]
医用画像セグメンテーションのための2段階のソースフリードメイン適応(SFDA)フレームワークを提案する。
プロトタイプアンコールされた特徴アライメントの段階では,まず,事前学習した画素ワイド分類器の重みを原プロトタイプとして利用する。
そこで,本研究では,目標となる特徴とクラスプロトタイプとの整合性を期待するコストを最小化し,双方向輸送を導入する。
論文 参考訳(メタデータ) (2023-07-19T06:07:12Z) - DwinFormer: Dual Window Transformers for End-to-End Monocular Depth
Estimation [0.5482532589225552]
局所的特徴と大域的特徴の両方を終端単眼深度推定に用いたデュアルウインドウトランスフォーマーネットワークを提案する。
DwinFormerはデュアルウィンドウ自己アテンションとクロスアテンショントランスフォーマー、Dwin-SATとDwin-CATで構成されている。
NYU-Depth-V2データセットとKITTIデータセットの広範な実験により得られた実証的な証拠は、提案手法の優位性を示している。
論文 参考訳(メタデータ) (2023-03-06T08:53:22Z) - Self-Supervised Correction Learning for Semi-Supervised Biomedical Image
Segmentation [84.58210297703714]
半教師付きバイオメディカルイメージセグメンテーションのための自己教師付き補正学習パラダイムを提案する。
共有エンコーダと2つの独立デコーダを含むデュアルタスクネットワークを設計する。
異なるタスクのための3つの医用画像分割データセットの実験により,本手法の優れた性能が示された。
論文 参考訳(メタデータ) (2023-01-12T08:19:46Z) - Two-Stream Graph Convolutional Network for Intra-oral Scanner Image
Segmentation [133.02190910009384]
本稿では,2ストリームグラフ畳み込みネットワーク(TSGCN)を提案する。
TSGCNは3次元歯(表面)セグメンテーションにおいて最先端の方法よりも優れています。
論文 参考訳(メタデータ) (2022-04-19T10:41:09Z) - Target and Task specific Source-Free Domain Adaptive Image Segmentation [73.78898054277538]
ソースフリー領域適応画像分割のための2段階のアプローチを提案する。
我々は,高エントロピー領域を抑えつつ,ターゲット固有の擬似ラベルを生成することに注力する。
第2段階では、タスク固有の表現にネットワークを適用することに重点を置いている。
論文 参考訳(メタデータ) (2022-03-29T17:50:22Z) - TC-Net: Triple Context Network for Automated Stroke Lesion Segmentation [0.5482532589225552]
本稿では,空間的コンテキスト情報を中心として,新たなネットワークである Triple Context Network (TC-Net) を提案する。
我々のネットワークはオープンデータセットATLASで評価され、最高スコアは0.594、ハウスドルフ距離は27.005mm、平均対称性表面距離は7.137mmである。
論文 参考訳(メタデータ) (2022-02-28T11:12:16Z) - Cross-Modality Brain Tumor Segmentation via Bidirectional
Global-to-Local Unsupervised Domain Adaptation [61.01704175938995]
本論文では,UDAスキームに基づくBiGL(Bidirectional Global-to-Local)適応フレームワークを提案する。
具体的には、脳腫瘍をセグメント化するために、双方向画像合成およびセグメンテーションモジュールを提案する。
提案手法は, 最先端の非教師なし領域適応法を大きなマージンで上回っている。
論文 参考訳(メタデータ) (2021-05-17T10:11:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。