論文の概要: MOSformer: Momentum encoder-based inter-slice fusion transformer for
medical image segmentation
- arxiv url: http://arxiv.org/abs/2401.11856v1
- Date: Mon, 22 Jan 2024 11:25:59 GMT
- ステータス: 処理完了
- システム内更新日: 2024-01-23 14:22:32.873643
- Title: MOSformer: Momentum encoder-based inter-slice fusion transformer for
medical image segmentation
- Title(参考訳): MOSformer:医療画像分割のためのMomentum Encoder-based Inter-Slice fusion Transformer
- Authors: De-Xing Huang and Xiao-Hu Zhou and Xiao-Liang Xie and Shi-Qi Liu and
Zhen-Qiu Feng and Mei-Jiang Gui and Hao Li and Tian-Yu Xiang and Xiu-Ling Liu
and Zeng-Guang Hou
- Abstract要約: 2.5Dベースのセグメンテーションモデルは、しばしば各スライスを等しく扱い、スライス間の情報を効果的に学習し活用することができない。
この問題を解決するために,新しいMomentumエンコーダを用いたスライス間核融合トランス (MOSformer) を提案する。
MOSformerは3つのベンチマークデータセット(Synapse、ACDC、AMOS)で評価され、それぞれ85.63%、92.19%、85.43%の新たな最先端技術を確立する。
- 参考スコア(独自算出の注目度): 15.94370954641629
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Medical image segmentation takes an important position in various clinical
applications. Deep learning has emerged as the predominant solution for
automated segmentation of volumetric medical images. 2.5D-based segmentation
models bridge computational efficiency of 2D-based models and spatial
perception capabilities of 3D-based models. However, prevailing 2.5D-based
models often treat each slice equally, failing to effectively learn and exploit
inter-slice information, resulting in suboptimal segmentation performances. In
this paper, a novel Momentum encoder-based inter-slice fusion transformer
(MOSformer) is proposed to overcome this issue by leveraging inter-slice
information at multi-scale feature maps extracted by different encoders.
Specifically, dual encoders are employed to enhance feature distinguishability
among different slices. One of the encoders is moving-averaged to maintain the
consistency of slice representations. Moreover, an IF-Swin transformer module
is developed to fuse inter-slice multi-scale features. The MOSformer is
evaluated on three benchmark datasets (Synapse, ACDC, and AMOS), establishing a
new state-of-the-art with 85.63%, 92.19%, and 85.43% of DSC, respectively.
These promising results indicate its competitiveness in medical image
segmentation. Codes and models of MOSformer will be made publicly available
upon acceptance.
- Abstract(参考訳): 医用画像分割は様々な臨床応用において重要な位置を占める。
深層学習は、ボリューム医療画像の自動セグメンテーションの主流のソリューションとして登場した。
2.5Dベースのセグメンテーションモデルは、2Dベースのモデルの計算効率と3Dベースのモデルの空間知覚能力を橋渡しする。
しかし、一般的な2.5Dモデルでは、各スライスを等しく扱い、スライス間の情報を効果的に学習して活用することができず、結果として準最適セグメンテーション性能が得られる。
本稿では, 異なるエンコーダによって抽出されたマルチスケール特徴マップにおいて, 新たなモメンタエンコーダ型スライス間融合トランス(mosformer)を提案する。
具体的には、異なるスライス間での特徴識別性を高めるためにデュアルエンコーダを用いる。
エンコーダの1つは、スライス表現の一貫性を維持するために平均される。
さらに,IF-Swinトランスモジュールを開発し,マルチスケール機能を融合する。
MOSformerは3つのベンチマークデータセット(Synapse、ACDC、AMOS)で評価され、それぞれ85.63%、92.19%、85.43%の新たな最先端技術を確立する。
これらの有望な結果は、医療画像分割における競争力を示している。
mosformerのコードとモデルは、受け入れ次第、公開される予定だ。
関連論文リスト
- Prototype Learning Guided Hybrid Network for Breast Tumor Segmentation in DCE-MRI [58.809276442508256]
本稿では,畳み込みニューラルネットワーク(CNN)とトランスフォーマー層を組み合わせたハイブリッドネットワークを提案する。
プライベートおよびパブリックなDCE-MRIデータセットの実験結果から,提案したハイブリッドネットワークは最先端の手法よりも優れた性能を示した。
論文 参考訳(メタデータ) (2024-08-11T15:46:00Z) - SDR-Former: A Siamese Dual-Resolution Transformer for Liver Lesion
Classification Using 3D Multi-Phase Imaging [59.78761085714715]
本研究は肝病変分類のための新しいSDR-Formerフレームワークを提案する。
提案フレームワークは2つの臨床データセットに関する総合的な実験を通じて検証された。
科学コミュニティを支援するため,肝病変解析のための多段階MRデータセットを公開しています。
論文 参考訳(メタデータ) (2024-02-27T06:32:56Z) - Dual-scale Enhanced and Cross-generative Consistency Learning for Semi-supervised Medical Image Segmentation [49.57907601086494]
医用画像のセグメンテーションはコンピュータ支援診断において重要な役割を担っている。
半教師型医用画像(DEC-Seg)のための新しいDual-scale Enhanced and Cross-generative consistency learning frameworkを提案する。
論文 参考訳(メタデータ) (2023-12-26T12:56:31Z) - SeUNet-Trans: A Simple yet Effective UNet-Transformer Model for Medical
Image Segmentation [0.0]
医用画像セグメンテーションのためのシンプルなUNet-Transformer(seUNet-Trans)モデルを提案する。
提案手法では,UNetモデルを特徴抽出器として設計し,入力画像から複数の特徴マップを生成する。
UNetアーキテクチャと自己認識機構を活用することで、我々のモデルはローカルとグローバルの両方のコンテキスト情報を保存するだけでなく、入力要素間の長距離依存関係をキャプチャできる。
論文 参考訳(メタデータ) (2023-10-16T01:13:38Z) - Multi-dimension unified Swin Transformer for 3D Lesion Segmentation in
Multiple Anatomical Locations [1.7413461132662074]
3次元病変分割のためのMDU-ST(multi-dimension unified Swin transformer)と呼ばれる新しいモデルを提案する。
ネットワークの性能はDice similarity coefficient(DSC)とHausdorff distance(HD)で内部の3D病変データセットを用いて評価される。
提案手法は, 放射線学および腫瘍成長モデル研究を支援するために, 自動3次元病変セグメンテーションを行うために用いられる。
論文 参考訳(メタデータ) (2023-09-04T21:24:00Z) - 3DSAM-adapter: Holistic adaptation of SAM from 2D to 3D for promptable tumor segmentation [52.699139151447945]
医用画像の領域分割を行うために, SAMを2次元から3次元に変換する新しい適応法を提案する。
本モデルでは, 腎腫瘍, 膵腫瘍, 大腸癌の3つのタスクのうち8.25%, 29.87%, 10.11%の3つのタスクにおいて, ドメイン・オブ・ザ・アーティヴ・メディカル・イメージ・セグメンテーション・モデルより優れ, 肝腫瘍セグメンテーションでも同様の性能が得られる。
論文 参考訳(メタデータ) (2023-06-23T12:09:52Z) - MedSegDiff-V2: Diffusion based Medical Image Segmentation with
Transformer [53.575573940055335]
我々は、MedSegDiff-V2と呼ばれるトランスフォーマーベースの拡散フレームワークを提案する。
画像の異なる20種類の画像分割作業において,その有効性を検証する。
論文 参考訳(メタデータ) (2023-01-19T03:42:36Z) - MISSU: 3D Medical Image Segmentation via Self-distilling TransUNet [55.16833099336073]
医用画像セグメンテーションのためのトランスフォーマーベースUNetを提案する。
グローバルな意味情報と局所的な空間的詳細特徴を同時に学習する。
MISSUは従来の最先端手法よりも優れた性能を発揮する。
論文 参考訳(メタデータ) (2022-06-02T07:38:53Z) - Class-Aware Generative Adversarial Transformers for Medical Image
Segmentation [39.14169989603906]
医用画像セグメンテーションのための新規な生成逆変換器CA-GANformerを提案する。
まず、ピラミッド構造を利用してマルチスケール表現を構築し、マルチスケールのバリエーションを扱う。
次に、意味構造を持つオブジェクトの識別領域をよりよく学習するために、新しいクラス対応トランスフォーマーモジュールを設計する。
論文 参考訳(メタデータ) (2022-01-26T03:50:02Z) - Swin UNETR: Swin Transformers for Semantic Segmentation of Brain Tumors
in MRI Images [7.334185314342017]
我々はSwin UNEt TRansformers(Swin UNETR)と呼ばれる新しいセグメンテーションモデルを提案する。
このモデルは、シフトしたウィンドウを利用して、5つの異なる解像度で特徴を抽出し、自己注意を演算する。
我々は、BraTS 2021セグメンテーションチャレンジに参加し、提案したモデルは、検証フェーズにおける最も優れたアプローチの1つである。
論文 参考訳(メタデータ) (2022-01-04T18:01:34Z) - Atrous Residual Interconnected Encoder to Attention Decoder Framework
for Vertebrae Segmentation via 3D Volumetric CT Images [1.8146155083014204]
本稿では,3次元容積CT画像を用いた新しい椎骨分割法を提案する。
提案モデルは,ミニバッチトレーニング性能の最適化にレイヤ正規化を用いた,エンコーダからデコーダへの構造に基づく。
実験の結果,本モデルは他の医学的意味セグメンテーション法と比較して競争力が得られた。
論文 参考訳(メタデータ) (2021-04-08T12:09:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。