Fugu-MT 論文翻訳(概要): VM-DDPM: Vision Mamba Diffusion for Medical Image Synthesis

論文の概要: VM-DDPM: Vision Mamba Diffusion for Medical Image Synthesis

arxiv url: http://arxiv.org/abs/2405.05667v1
Date: Thu, 9 May 2024 10:41:18 GMT
ステータス: 翻訳完了
システム内更新日: 2024-05-10 13:42:37.615833
Title: VM-DDPM: Vision Mamba Diffusion for Medical Image Synthesis
Title（参考訳）: VM-DDPM:医療画像合成のためのビジョンマンバ拡散
Authors: Zhihan Ju, Wanting Zhou,
Abstract要約: 状態空間モデル(SSM)に基づくビジョンマンバDDPM(VM-DDPM)を提案する。我々の知る限り、これはSSM-CNNハイブリッドアーキテクチャに基づく最初の医用画像合成モデルである。 ACDC、BraTS2018、ChestXRayの3つの異なるスケールのデータセットに対する実験的な評価は、VM-DDPMが最先端のパフォーマンスを達成することを実証している。
参考スコア（独自算出の注目度）: 0.8111815974227898
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: In the realm of smart healthcare, researchers enhance the scale and diversity of medical datasets through medical image synthesis. However, existing methods are limited by CNN local perception and Transformer quadratic complexity, making it difficult to balance structural texture consistency. To this end, we propose the Vision Mamba DDPM (VM-DDPM) based on State Space Model (SSM), fully combining CNN local perception and SSM global modeling capabilities, while maintaining linear computational complexity. Specifically, we designed a multi-level feature extraction module called Multi-level State Space Block (MSSBlock), and a basic unit of encoder-decoder structure called State Space Layer (SSLayer) for medical pathological images. Besides, we designed a simple, Plug-and-Play, zero-parameter Sequence Regeneration strategy for the Cross-Scan Module (CSM), which enabled the S6 module to fully perceive the spatial features of the 2D image and stimulate the generalization potential of the model. To our best knowledge, this is the first medical image synthesis model based on the SSM-CNN hybrid architecture. Our experimental evaluation on three datasets of different scales, i.e., ACDC, BraTS2018, and ChestXRay, as well as qualitative evaluation by radiologists, demonstrate that VM-DDPM achieves state-of-the-art performance.
Abstract（参考訳）: スマートヘルスケアの領域では、研究者は医療画像合成を通じて医療データセットのスケールと多様性を高める。しかし、既存の手法はCNN局所認識とトランスフォーマー二次複雑性によって制限されており、構造的テクスチャの整合性のバランスが難しい。そこで我々は,線形計算複雑性を維持しつつ,CNN局所認識とSSMグローバルモデリング機能を完全に組み合わせた,状態空間モデルに基づくビジョンマンバDDPM(VM-DDPM)を提案する。具体的には、マルチレベルステートスペースブロック(MSSBlock)と呼ばれるマルチレベル特徴抽出モジュールと、医療病理学的画像のためのエンコーダ・デコーダ構造の基本ユニットであるステートスペース層(SSLayer)を設計した。さらに、S6モジュールが2次元画像の空間的特徴を完全に認識し、モデルの一般化ポテンシャルを刺激することのできる、シンプルな、プラグイン・アンド・プレイのゼロパラメータ・シーケンス・リジェネレーション戦略を設計した。我々の知る限り、これはSSM-CNNハイブリッドアーキテクチャに基づく最初の医用画像合成モデルである。 ACDC, BraTS2018, ChestXRay, および放射線学者による定性的評価の3つの尺度を用いた実験により, VM-DDPMが最先端の性能を達成することを示す。

関連論文リスト

DM-SegNet: Dual-Mamba Architecture for 3D Medical Image Segmentation with Global Context Modeling [0.0]
本稿では,Dual-MambaアーキテクチャであるDM-SegNetについて述べる。中心となるイノベーションは、解剖学的空間コヒーレンスを維持するために4方向の3Dスキャンを利用する4方向空間マンバモジュールである。 2つの臨床的に有意なベンチマークの大規模な評価は、DM-SegNetの有効性を示す。
論文参考訳（メタデータ） (2025-06-05T17:49:46Z)
DAMamba: Vision State Space Model with Dynamic Adaptive Scan [51.81060691414399]
状態空間モデル(SSM)は近年、コンピュータビジョンにおいて大きな注目を集めている。スキャン順序と領域を適応的に割り当てるデータ駆動型動的適応スキャン(DAS)を提案する。 DASをベースとしたビジョンバックボーンDAMambaの提案は,現在のビジョンタスクにおけるMambaモデルよりもはるかに優れている。
論文参考訳（メタデータ） (2025-02-18T08:12:47Z)
A Unified Model for Compressed Sensing MRI Across Undersampling Patterns [69.19631302047569]
ディープニューラルネットワークは、アンダーサンプル計測から高忠実度画像を再構成する大きな可能性を示している。我々のモデルは、離散化に依存しないアーキテクチャであるニューラル演算子に基づいている。我々の推論速度は拡散法よりも1,400倍速い。
論文参考訳（メタデータ） (2024-10-05T20:03:57Z)
HMT-UNet: A hybird Mamba-Transformer Vision UNet for Medical Image Segmentation [1.5574423250822542]
我々はHybird Transformer Vision Mamba UNet(HTM-UNet)という医療画像分割のためのU字型アーキテクチャーモデルを提案する。我々はISIC17、ISIC18、CVC-300、CVC-ClinicDB、Kvasir、CVC-ColonDB、ETIS-Larib PolypDBパブリックデータセット、ZD-LCI-GIMプライベートデータセットに関する包括的な実験を行う。
論文参考訳（メタデータ） (2024-08-21T02:25:14Z)
I2I-Mamba: Multi-modal medical image synthesis via selective state space modeling [8.48392350084504]
本稿では,医用画像合成のための新しい敵対モデルI2I-Mambaを提案する。 I2I-Mambaは、ターゲットモダリティ画像の合成における最先端CNNおよびトランスフォーマーベースの手法に対して優れた性能を提供する。
論文参考訳（メタデータ） (2024-05-22T21:55:58Z)
SDR-Former: A Siamese Dual-Resolution Transformer for Liver Lesion Classification Using 3D Multi-Phase Imaging [59.78761085714715]
本研究は肝病変分類のための新しいSDR-Formerフレームワークを提案する。提案フレームワークは2つの臨床データセットに関する総合的な実験を通じて検証された。科学コミュニティを支援するため,肝病変解析のための多段階MRデータセットを公開しています。
論文参考訳（メタデータ） (2024-02-27T06:32:56Z)
nnMamba: 3D Biomedical Image Segmentation, Classification and Landmark Detection with State Space Model [24.955052600683423]
本稿では、CNNの強みとステートスペースシーケンスモデル(SSM)の高度な長距離モデリング機能を統合する新しいアーキテクチャであるnnMambaを紹介する。 6つのデータセットの実験では、3D画像のセグメンテーション、分類、ランドマーク検出など、一連の困難なタスクにおいて、nnMambaが最先端のメソッドよりも優れていることが示されている。
論文参考訳（メタデータ） (2024-02-05T21:28:47Z)
VM-UNet: Vision Mamba UNet for Medical Image Segmentation [2.3876474175791302]
医用画像セグメンテーションのためのU字型アーキテクチャモデルVision Mamba UNet(VM-UNet)を提案する。我々はISIC17,ISIC18,Synapseデータセットの総合的な実験を行い,VM-UNetが医用画像分割タスクにおいて競争力を発揮することを示す。
論文参考訳（メタデータ） (2024-02-04T13:37:21Z)
BrainCLIP: Bridging Brain and Visual-Linguistic Representation Via CLIP for Generic Natural Visual Stimulus Decoding [51.911473457195555]
BrainCLIPはタスクに依存しないfMRIベースの脳復号モデルである。脳の活動、画像、およびテキストの間のモダリティギャップを埋める。 BrainCLIPは、高い意味的忠実度で視覚刺激を再構築することができる。
論文参考訳（メタデータ） (2023-02-25T03:28:54Z)
Attentive Symmetric Autoencoder for Brain MRI Segmentation [56.02577247523737]
視覚変換器(ViT)をベースとした3次元脳MRIセグメンテーションタスクのための新しいアテンテーティブシンメトリオートエンコーダを提案する。事前学習の段階では、提案するオートエンコーダがより注意を払って、勾配測定値に従って情報パッチを再構築する。実験の結果,提案手法は最先端の自己教師付き学習法や医用画像分割モデルよりも優れていた。
論文参考訳（メタデータ） (2022-09-19T09:43:19Z)
Fed-Sim: Federated Simulation for Medical Imaging [131.56325440976207]
本稿では、2つの学習可能なニューラルモジュールからなる物理駆動型生成手法を提案する。データ合成フレームワークは、複数のデータセットの下流セグメンテーション性能を改善する。
論文参考訳（メタデータ） (2020-09-01T19:17:46Z)
Hierarchical Amortized Training for Memory-efficient High Resolution 3D GAN [52.851990439671475]
本稿では,高解像度な3D画像を生成することができる新しいエンドツーエンドGANアーキテクチャを提案する。トレーニングと推論の異なる構成を使用することで、この目標を達成する。 3次元胸郭CTと脳MRIの実験により、我々のアプローチは画像生成における最先端技術より優れていることが示された。
論文参考訳（メタデータ） (2020-08-05T02:33:04Z)
Neural Architecture Search for Gliomas Segmentation on Multimodal Magnetic Resonance Imaging [2.66512000865131]
マルチモーダルMRIスキャンにおける脳腫瘍セグメント化課題に対するニューラルアーキテクチャサーチ(NAS)に基づくソリューションを提案する。開発されたソリューションは、また、脳MRI処理に適した正規化とパッチ戦略を統合する。
論文参考訳（メタデータ） (2020-05-13T14:32:00Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。