論文の概要: Flatten Wisely: How Patch Order Shapes Mamba-Powered Vision for MRI Segmentation
- arxiv url: http://arxiv.org/abs/2507.13384v1
- Date: Tue, 15 Jul 2025 21:37:37 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-21 20:43:26.058256
- Title: Flatten Wisely: How Patch Order Shapes Mamba-Powered Vision for MRI Segmentation
- Title(参考訳): フラット・ワイズリー:MRIのセグメンテーションにマンバ駆動の視覚をどう形作るか
- Authors: Osama Hardan, Omar Elshenhabi, Tamer Khattab, Mohamed Mabrok,
- Abstract要約: ビジョン・マンバモデルは線形計算コストで変圧器レベルの性能を約束する。
2D画像を1Dシーケンスにシリアライズすることへの依存は、重要なが見過ごされている設計選択、すなわちパッチスキャン順序をもたらす。
本稿では,MRIセグメントのスキャン順序がMRIセグメントに与える影響について,最初の系統的研究を行った。
- 参考スコア(独自算出の注目度): 4.9921974350575296
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Vision Mamba models promise transformer-level performance at linear computational cost, but their reliance on serializing 2D images into 1D sequences introduces a critical, yet overlooked, design choice: the patch scan order. In medical imaging, where modalities like brain MRI contain strong anatomical priors, this choice is non-trivial. This paper presents the first systematic study of how scan order impacts MRI segmentation. We introduce Multi-Scan 2D (MS2D), a parameter-free module for Mamba-based architectures that facilitates exploring diverse scan paths without additional computational cost. We conduct a large-scale benchmark of 21 scan strategies on three public datasets (BraTS 2020, ISLES 2022, LGG), covering over 70,000 slices. Our analysis shows conclusively that scan order is a statistically significant factor (Friedman test: $\chi^{2}_{20}=43.9, p=0.0016$), with performance varying by as much as 27 Dice points. Spatially contiguous paths -- simple horizontal and vertical rasters -- consistently outperform disjointed diagonal scans. We conclude that scan order is a powerful, cost-free hyperparameter, and provide an evidence-based shortlist of optimal paths to maximize the performance of Mamba models in medical imaging.
- Abstract(参考訳): Vision Mambaモデルは、線形計算コストでトランスフォーマーレベルのパフォーマンスを約束するが、2D画像を1Dシーケンスにシリアライズすることへの依存は、クリティカルで見過ごされ、設計上の選択肢であるパッチスキャン順序を導入する。
医学的イメージングでは、脳MRIのようなモダリティが強い解剖学的先行性を含む場合、この選択は自明ではない。
本稿では,MRIセグメントのスキャン順序がMRIセグメントに与える影響について,最初の系統的研究を行った。
マルチスキャン2D(Multi-Scan 2D, マルチスキャン2D)は,マンバをベースとしたアーキテクチャのためのパラメータフリーモジュールで, 余分な計算コストを伴わず, 多様なスキャンパスの探索を容易にする。
我々は、3つの公開データセット(BraTS 2020, ISLES 2022, LGG)上で、21のスキャン戦略の大規模なベンチマークを実施し、70,000スライス以上をカバーしています。
解析の結果,スキャン順序が統計的に有意な要因であることが判明した(Friedman test: $\chi^{2}_{20}=43.9, p=0.0016$)。
空間的に連続した経路 -- 単純な水平方向と垂直方向のラスタ -- は、相容れない対角線スキャンを一貫して上回っている。
医療画像におけるマンバモデルの性能を最大化するために,スキャンオーダーは強力で費用がかからないハイパーパラメータであり,最適経路のエビデンスベースのショートリストを提供する。
関連論文リスト
- Unified 3D MRI Representations via Sequence-Invariant Contrastive Learning [0.15749416770494706]
定量的MRI(qMRI)を利用したシーケンス不変な自己教師型フレームワークを提案する。
健常脳セグメンテーション(IXI)、脳梗塞セグメンテーション(ARC)、MRIによるデノイング実験は、ベースラインSSLアプローチよりも有意な増加を示した。
また,本モデルは,よりスケーラブルで臨床的に信頼性の高いボリューム分析の可能性を示した。
論文 参考訳(メタデータ) (2025-01-21T11:27:54Z) - 2DMamba: Efficient State Space Model for Image Representation with Applications on Giga-Pixel Whole Slide Image Classification [40.10133518650528]
画像の2次元空間構造を組み込んだ新しい2次元選択型SSMフレームワークである2DMambaを提案する。
WSI分類と生存分析のための10の公開データセットの実験では、2DMambaはAUCで2.48%、F1スコアで3.11%、精度で2.47%、Cインデックスで5.52%改善している。
論文 参考訳(メタデータ) (2024-12-01T05:42:58Z) - V2M: Visual 2-Dimensional Mamba for Image Representation Learning [68.51380287151927]
Mambaは、フレキシブルな設計と、1Dシーケンスを処理するための効率的なハードウェア性能のために、広く注目を集めている。
最近の研究では、マンバを2D画像をパッチに平らにすることで視覚領域に適用し、それらを1Dシークエンスとして扱うことが試みられている。
2次元空間における画像トークンを直接処理する完全解として,視覚的2次元マンバモデルを提案する。
論文 参考訳(メタデータ) (2024-10-14T11:11:06Z) - MambaCSR: Dual-Interleaved Scanning for Compressed Image Super-Resolution With SSMs [14.42424591513825]
MambaCSRは、圧縮画像超解像(CSR)タスクのためのMambaをベースにしたフレームワークである。
本稿では,2つの走査戦略からなるCSRのための効率的なデュアルインターリーブ走査パラダイム(DIS)を提案する。
複数のベンチマークの結果から,圧縮画像超解像タスクにおけるMambaCSRの優れた性能が示された。
論文 参考訳(メタデータ) (2024-08-21T16:30:45Z) - Towards a Benchmark for Colorectal Cancer Segmentation in Endorectal Ultrasound Videos: Dataset and Model Development [59.74920439478643]
本稿では,多様なERUSシナリオをカバーする最初のベンチマークデータセットを収集し,注釈付けする。
ERUS-10Kデータセットは77の動画と10,000の高解像度アノテートフレームで構成されています。
本稿では,ASTR (Adaptive Sparse-context TRansformer) という大腸癌セグメンテーションのベンチマークモデルを提案する。
論文 参考訳(メタデータ) (2024-08-19T15:04:42Z) - Slice-Consistent 3D Volumetric Brain CT-to-MRI Translation with 2D Brownian Bridge Diffusion Model [3.4248731707266264]
神経画像では、一般的に、脳のCTはMRIよりも費用効率が高く、アクセスしやすい。
医用画像・画像翻訳(I2I)は有望な解決策である。
本研究は,2次元 DM のみに基づく高品質な3次元医療用 I2I を実現する最初の試みである。
論文 参考訳(メタデータ) (2024-07-06T12:13:36Z) - MHS-VM: Multi-Head Scanning in Parallel Subspaces for Vision Mamba [0.43512163406552]
Mambaとのステートスペースモデル(SSM)は、線形複雑性を伴う長距離依存性モデリングを大いに約束している。
1次元選択的スキャンにより2次元画像空間内の視覚的特徴を効果的に整理・構築するために,新しいマルチヘッドスキャン(MHS)モジュールを提案する。
その結果、マルチヘッドスキャンプロセスから得られたサブ埋め込みは統合され、最終的に高次元空間に投影される。
論文 参考訳(メタデータ) (2024-06-10T03:24:43Z) - Gamba: Marry Gaussian Splatting with Mamba for single view 3D reconstruction [153.52406455209538]
Gambaは、単一のビューイメージからエンドツーエンドの3D再構成モデルである。
1つのNVIDIA A100 GPUで0.05秒以内に再構築が完了する。
論文 参考訳(メタデータ) (2024-03-27T17:40:14Z) - VMamba: Visual State Space Model [98.0517369083152]
状態空間言語モデルであるMambaを、線形時間複雑性を持つビジョンバックボーンであるVMambaに適合させる。
VMambaのコアには2D Selective Scan (SS2D)モジュールを備えたVisual State-Space (VSS)ブロックのスタックがある。
論文 参考訳(メタデータ) (2024-01-18T17:55:39Z) - MedMNIST v2: A Large-Scale Lightweight Benchmark for 2D and 3D
Biomedical Image Classification [59.10015984688104]
MedMNIST v2は、MNISTに似た大規模データセットコレクションである。
得られたデータセットは708,069個の2D画像と10,214個の3D画像で構成されている。
論文 参考訳(メタデータ) (2021-10-27T22:02:04Z) - Self-Supervised Multi-Modal Alignment for Whole Body Medical Imaging [70.52819168140113]
我々は、英国バイオバンクの2万名以上の被験者のデータセットを使用し、全体Dixon法磁気共鳴法(MR)スキャンとデュアルエネルギーX線吸収率法(DXA)スキャンを併用した。
マルチモーダル画像マッチングコントラストフレームワークを導入し、同一対象の異なるモダリティスキャンを高精度にマッチングすることができる。
適応がなければ、この対照的なトレーニングステップで学習した対応が、自動クロスモーダルスキャン登録の実行に利用できることを示す。
論文 参考訳(メタデータ) (2021-07-14T12:35:05Z) - DR-SPAAM: A Spatial-Attention and Auto-regressive Model for Person
Detection in 2D Range Data [81.06749792332641]
本研究では,異なるタイミングで得られたスキャンを組み合わせ,代替戦略を用いた人物検出ネットワークを提案する。
DR-SPAAMは、バックボーンネットワークから中間機能をテンプレートとして保持し、新しいスキャンが利用可能になったときにテンプレートをリカレントに更新する。
DROWデータセットでは,提案手法は既存の最先端技術よりも約4倍高速である。
論文 参考訳(メタデータ) (2020-04-29T11:01:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。