論文の概要: HST-MRF: Heterogeneous Swin Transformer with Multi-Receptive Field for
Medical Image Segmentation
- arxiv url: http://arxiv.org/abs/2304.04614v1
- Date: Mon, 10 Apr 2023 14:30:03 GMT
- ステータス: 処理完了
- システム内更新日: 2023-04-11 14:40:15.552585
- Title: HST-MRF: Heterogeneous Swin Transformer with Multi-Receptive Field for
Medical Image Segmentation
- Title(参考訳): hst-mrf : 医用画像セグメンテーションのためのマルチ受容場を有する異種スウィントランス
- Authors: Xiaofei Huang, Hongfang Gong, Jin Zhang
- Abstract要約: 医用画像セグメンテーションのためのHST-MRFモデルを提案する。
主な目的は、トランスを用いたパッチセグメンテーションによる構造情報の損失を解決することである。
実験の結果,提案手法は最先端モデルよりも優れ,優れた性能が得られることがわかった。
- 参考スコア(独自算出の注目度): 5.51045524851432
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The Transformer has been successfully used in medical image segmentation due
to its excellent long-range modeling capabilities. However, patch segmentation
is necessary when building a Transformer class model. This process may disrupt
the tissue structure in medical images, resulting in the loss of relevant
information. In this study, we proposed a Heterogeneous Swin Transformer with
Multi-Receptive Field (HST-MRF) model based on U-shaped networks for medical
image segmentation. The main purpose is to solve the problem of loss of
structural information caused by patch segmentation using transformer by fusing
patch information under different receptive fields. The heterogeneous Swin
Transformer (HST) is the core module, which achieves the interaction of
multi-receptive field patch information through heterogeneous attention and
passes it to the next stage for progressive learning. We also designed a
two-stage fusion module, multimodal bilinear pooling (MBP), to assist HST in
further fusing multi-receptive field information and combining low-level and
high-level semantic information for accurate localization of lesion regions. In
addition, we developed adaptive patch embedding (APE) and soft channel
attention (SCA) modules to retain more valuable information when acquiring
patch embedding and filtering channel features, respectively, thereby improving
model segmentation quality. We evaluated HST-MRF on multiple datasets for polyp
and skin lesion segmentation tasks. Experimental results show that our proposed
method outperforms state-of-the-art models and can achieve superior
performance. Furthermore, we verified the effectiveness of each module and the
benefits of multi-receptive field segmentation in reducing the loss of
structural information through ablation experiments.
- Abstract(参考訳): Transformerは、優れた長距離モデリング機能のために、医用画像セグメンテーションに成功している。
しかし、パッチセグメンテーションはトランスフォーマークラスモデルを構築する際に必要である。
このプロセスは医療画像の組織構造を乱し、関連する情報が失われる可能性がある。
本研究では, 医用画像分割のためのu字型ネットワークを用いたマルチレセプティブ・フィールド(hst-mrf)モデルを用いた異種スウィントランスを提案する。
主な目的は、異なる受容場下でパッチ情報を融合することにより、トランスフォーマを用いたパッチセグメンテーションによる構造情報の損失を解決することである。
ヘテロジニアススイム変換器(HST)はコアモジュールであり、不均一な注意を通して多受容フィールドパッチ情報の相互作用を達成し、プログレッシブラーニングの次の段階に渡す。
また,2段階融合モジュールであるMBP(Multimodal bilinear pooling)を設計し,HSTの多受容野情報の融合を支援するとともに,低レベルおよび高レベルの意味情報を組み合わせて病変領域の正確な位置推定を行った。
さらに,アダプティブパッチ埋め込み (APE) とソフトチャネルアテンション (SCA) モジュールを開発した。
ポリプおよび皮膚病変のセグメンテーションタスクのための複数のデータセット上でHST-MRFを評価した。
実験の結果,提案手法は最先端モデルよりも優れ,優れた性能が得られることがわかった。
さらに,各モジュールの有効性とマルチレセプティブ・フィールドセグメンテーションの利点を検証し,アブレーション実験により構造情報の損失を低減した。
関連論文リスト
- ASPS: Augmented Segment Anything Model for Polyp Segmentation [77.25557224490075]
SAM(Segment Anything Model)は、ポリープセグメンテーションに先例のないポテンシャルを導入している。
SAMのTransformerベースの構造は、グローバルおよび低周波情報を優先する。
CFAはトレーニング可能なCNNエンコーダブランチと凍結したViTエンコーダを統合し、ドメイン固有の知識の統合を可能にする。
論文 参考訳(メタデータ) (2024-06-30T14:55:32Z) - Improved EATFormer: A Vision Transformer for Medical Image Classification [0.0]
本稿では,ビジョントランスフォーマを用いた医用画像分類のための改良されたアルゴリズムベースのトランスフォーマアーキテクチャを提案する。
提案したEATFormerアーキテクチャは、畳み込みニューラルネットワークとビジョントランスフォーマーの長所を組み合わせたものだ。
Chest X-rayデータセットとKvasirデータセットの実験結果から,提案したEATFormerはベースラインモデルと比較して予測速度と精度を大幅に向上することが示された。
論文 参考訳(メタデータ) (2024-03-19T21:40:20Z) - Dual-scale Enhanced and Cross-generative Consistency Learning for Semi-supervised Medical Image Segmentation [49.57907601086494]
医用画像のセグメンテーションはコンピュータ支援診断において重要な役割を担っている。
半教師型医用画像(DEC-Seg)のための新しいDual-scale Enhanced and Cross-generative consistency learning frameworkを提案する。
論文 参考訳(メタデータ) (2023-12-26T12:56:31Z) - PMP-Swin: Multi-Scale Patch Message Passing Swin Transformer for Retinal
Disease Classification [9.651435376561741]
マルチスケール・パッチ・メッセージ・パッシング・スウィン・トランスフォーマ (Multi-Scale Patch Message Passing Swin Transformer) という新しいフレームワークを提案する。
具体的には,Patch Message Passing(PMP)モジュールをMessage Passing機構に基づいて設計し,病的意味的特徴のグローバルな相互作用を確立する。
論文 参考訳(メタデータ) (2023-11-20T11:09:09Z) - Affine-Consistent Transformer for Multi-Class Cell Nuclei Detection [76.11864242047074]
本稿では, 原子核位置を直接生成する新しいアフィン一貫性変換器 (AC-Former) を提案する。
本稿では,AAT (Adaptive Affine Transformer) モジュールを導入し,ローカルネットワークトレーニングのためのオリジナル画像をワープするための重要な空間変換を自動学習する。
実験結果から,提案手法は様々なベンチマークにおいて既存の最先端アルゴリズムを著しく上回ることがわかった。
論文 参考訳(メタデータ) (2023-10-22T02:27:02Z) - Curriculum-Based Augmented Fourier Domain Adaptation for Robust Medical
Image Segmentation [18.830738606514736]
本研究は、堅牢な医用画像分割のためのカリキュラムベースの拡張フーリエドメイン適応(Curri-AFDA)を提案する。
特に、カリキュラム学習戦略は、異なるレベルのデータシフトの下でのモデルの因果関係に基づいている。
複数のサイトやスキャナーから収集した網膜と核の2つのセグメンテーションタスクの実験から,提案手法が優れた適応と一般化性能をもたらすことが示唆された。
論文 参考訳(メタデータ) (2023-06-06T08:56:58Z) - Self-Supervised Correction Learning for Semi-Supervised Biomedical Image
Segmentation [84.58210297703714]
半教師付きバイオメディカルイメージセグメンテーションのための自己教師付き補正学習パラダイムを提案する。
共有エンコーダと2つの独立デコーダを含むデュアルタスクネットワークを設計する。
異なるタスクのための3つの医用画像分割データセットの実験により,本手法の優れた性能が示された。
論文 参考訳(メタデータ) (2023-01-12T08:19:46Z) - Reliable Joint Segmentation of Retinal Edema Lesions in OCT Images [55.83984261827332]
本稿では,信頼性の高いマルチスケールウェーブレットエンハンストランスネットワークを提案する。
本研究では,ウェーブレット型特徴抽出器ネットワークとマルチスケール変圧器モジュールを統合したセグメンテーションバックボーンを開発した。
提案手法は,他の最先端セグメンテーション手法と比較して信頼性の高いセグメンテーション精度を実現する。
論文 参考訳(メタデータ) (2022-12-01T07:32:56Z) - Class-Aware Generative Adversarial Transformers for Medical Image
Segmentation [39.14169989603906]
医用画像セグメンテーションのための新規な生成逆変換器CA-GANformerを提案する。
まず、ピラミッド構造を利用してマルチスケール表現を構築し、マルチスケールのバリエーションを扱う。
次に、意味構造を持つオブジェクトの識別領域をよりよく学習するために、新しいクラス対応トランスフォーマーモジュールを設計する。
論文 参考訳(メタデータ) (2022-01-26T03:50:02Z) - TransAttUnet: Multi-level Attention-guided U-Net with Transformer for
Medical Image Segmentation [33.45471457058221]
本稿では,TransAttUnetと呼ばれるトランスフォーマーベースの医用画像セマンティックセマンティック・セマンティック・フレームワークを提案する。
特に,デコーダブロック間の複数スケールのスキップ接続を確立することで,セマンティック・スケールのアップサンプリング機能を集約する。
我々の手法は一貫して最先端のベースラインを上回っている。
論文 参考訳(メタデータ) (2021-07-12T09:17:06Z) - Cross-Modality Brain Tumor Segmentation via Bidirectional
Global-to-Local Unsupervised Domain Adaptation [61.01704175938995]
本論文では,UDAスキームに基づくBiGL(Bidirectional Global-to-Local)適応フレームワークを提案する。
具体的には、脳腫瘍をセグメント化するために、双方向画像合成およびセグメンテーションモジュールを提案する。
提案手法は, 最先端の非教師なし領域適応法を大きなマージンで上回っている。
論文 参考訳(メタデータ) (2021-05-17T10:11:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。