論文の概要: RobustMedSAM: Degradation-Resilient Medical Image Segmentation via Robust Foundation Model Adaptation
- arxiv url: http://arxiv.org/abs/2604.09814v1
- Date: Fri, 10 Apr 2026 18:45:20 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-14 20:13:15.688678
- Title: RobustMedSAM: Degradation-Resilient Medical Image Segmentation via Robust Foundation Model Adaptation
- Title(参考訳): RobustMedSAM: Robust Foundation Model Adaptationによる劣化回復型医用画像セグメンテーション
- Authors: Jieru Li, Matthew Chen, Micky C. Nnamdi, J. Ben Tamo, Benoit L. Marteau, May D. Wang,
- Abstract要約: 医用画像セグメンテーションモデルは、ノイズ、ぼかし、モーションアーティファクト、モダリティ固有の歪みなどの現実的な画像劣化の下で劣化することが多い。
既存のアプローチは医療領域の適応や腐敗に対処するが、どちらも共同ではない。
画像エンコーダをMedSAMから初期化し,マスクデコーダを共有ViT-BアーキテクチャでロバストSAMから初期化する。
- 参考スコア(独自算出の注目度): 1.5033787705636696
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Medical image segmentation models built on Segment Anything Model (SAM) achieve strong performance on clean benchmarks, yet their reliability often degrades under realistic image corruptions such as noise, blur, motion artifacts, and modality-specific distortions. Existing approaches address either medical-domain adaptation or corruption robustness, but not both jointly. In SAM, we find that these capabilities are concentrated in complementary modules: the image encoder preserves medical priors, while the mask decoder governs corruption robustness. Motivated by this observation, we propose RobustMedSAM, which adopts module-wise checkpoint fusion by initializing the image encoder from MedSAM and the mask decoder from RobustSAM under a shared ViT-B architecture. We then fine-tune only the mask decoder on 35 medical datasets from MedSegBench, spanning six imaging modalities and 12 corruption types, while freezing the remaining components to preserve pretrained medical representations. We additionally investigate an SVD-based parameter-efficient variant for limited encoder adaptation. Experiments on both in-distribution and out-of-distribution benchmarks show that RobustMedSAM improves degraded-image Dice from 0.613 to 0.719 (+0.106) over SAM, demonstrating that structured fusion of complementary pretrained models is an effective and practical approach for robust medical image segmentation.
- Abstract(参考訳): SAM(Segment Anything Model)上に構築された医用画像セグメンテーションモデルは、クリーンなベンチマークで高いパフォーマンスを達成するが、その信頼性は、ノイズ、ぼかし、モーションアーティファクト、モダリティ固有の歪みといった現実的な画像破損の下で低下することが多い。
既存のアプローチは、医療領域の適応または汚職の堅牢性に対処するが、どちらも共同ではない。
SAMでは、これらの機能は相補的なモジュールに集中しており、画像エンコーダは医学的先行性を保ち、マスクデコーダは腐敗の堅牢性を制御している。
本稿では,MedSAMのイメージエンコーダとRobostSAMのマスクデコーダを共通のViT-Bアーキテクチャで初期化することにより,モジュールワイドなチェックポイント融合を実現するRobostMedSAMを提案する。
次に、MedSegBenchから得られた35の医療データセットのマスクデコーダのみを微調整し、6つの画像モダリティと12の汚職タイプにまたがり、残りのコンポーネントを凍結して、トレーニング済みの医療表現を保存する。
また,限られたエンコーダ適応のためのSVDに基づくパラメータ効率変動についても検討する。
分布内および分布外ベンチマークの実験により、RobostMedSAMはSAM上の劣化画像Diceを0.613から0.719(+0.106)に改善し、相補的事前学習モデルの構造化融合が堅牢な医用画像セグメンテーションの効果的かつ実用的なアプローチであることを示した。
関連論文リスト
- VesSAM: Efficient Multi-Prompting for Segmenting Complex Vessel [68.24765319399286]
本稿では,2次元血管セグメンテーションに適した,強力で効率的なフレームワークであるVesSAMを提案する。
VesSAMは、(1)局所的なテクスチャ機能を強化する畳み込みアダプタ、(2)解剖学的プロンプトを融合するマルチプロンプトエンコーダ、(3)ジャグアーティファクトを減らす軽量マスクデコーダを統合する。
VesSAMは、最先端のPEFTベースのSAMを10%以上のDiceと13%のIoUで一貫して上回っている。
論文 参考訳(メタデータ) (2025-11-02T15:47:05Z) - BALR-SAM: Boundary-Aware Low-Rank Adaptation of SAM for Resource-Efficient Medical Image Segmentation [11.634558989215392]
Segment Anything Model (SAM)のようなビジョン基盤モデルは、ドメイン固有の適応が欠如しているため、しばしば医療画像のセグメンテーションに苦労する。
医療画像のSAMを強化する境界対応低ランク適応フレームワークであるBALR-SAMを提案する。
2) SAMのVision Transformerブロックに組み込まれた低ランクのアダプタは、医学的コンテキストにおける特徴表現と注意を最適化し、同時にパラメータ空間を著しく削減する。
論文 参考訳(メタデータ) (2025-09-29T02:36:09Z) - Self-Prompt SAM: Medical Image Segmentation via Automatic Prompt SAM Adaptation [14.821036063099458]
Segment Anything Model (SAM)は印象的なゼロショット性能を示した。
本稿では,医療画像セグメンテーションのための新しいセルフプロンプトSAM適応フレームワーク,Self-Prompt-SAMを提案する。
本手法は,AMOS2022ではnUNetが2.3%,ACDCでは1.6%,Synapseデータセットでは0.5%に向上する。
論文 参考訳(メタデータ) (2025-02-02T02:42:24Z) - Improved Baselines with Synchronized Encoding for Universal Medical Image Segmentation [34.08601740109437]
SyncSAMは、医用画像符号化を強化するために、畳み込みとトランスフォーマー機能を統合した同期デュアルブランチエンコーダを使用する。
SyncSAMはテストセットで最先端のパフォーマンスを実現し、目に見えないデータセットで強力なゼロショット機能を示す。
論文 参考訳(メタデータ) (2024-08-19T11:01:00Z) - MA-SAM: Modality-agnostic SAM Adaptation for 3D Medical Image
Segmentation [58.53672866662472]
我々はMA-SAMと命名されたモダリティに依存しないSAM適応フレームワークを提案する。
本手法は,重量増加のごく一部だけを更新するためのパラメータ効率の高い微調整戦略に根ざしている。
画像エンコーダのトランスバータブロックに一連の3Dアダプタを注入することにより,事前学習した2Dバックボーンが入力データから3次元情報を抽出することができる。
論文 参考訳(メタデータ) (2023-09-16T02:41:53Z) - Diffusion Models for Counterfactual Generation and Anomaly Detection in Brain Images [39.94162291765236]
病気の画像の健全なバージョンを生成し,それを用いて画素単位の異常マップを得るための弱教師付き手法を提案する。
健常者を対象にした拡散モデルを用いて, サンプリングプロセスの各ステップで拡散拡散確率モデル (DDPM) と拡散拡散確率モデル (DDIM) を組み合わせる。
論文 参考訳(メタデータ) (2023-08-03T21:56:50Z) - 3DSAM-adapter: Holistic adaptation of SAM from 2D to 3D for promptable tumor segmentation [52.699139151447945]
医用画像の領域分割を行うために, SAMを2次元から3次元に変換する新しい適応法を提案する。
本モデルでは, 腎腫瘍, 膵腫瘍, 大腸癌の3つのタスクのうち8.25%, 29.87%, 10.11%の3つのタスクにおいて, ドメイン・オブ・ザ・アーティヴ・メディカル・イメージ・セグメンテーション・モデルより優れ, 肝腫瘍セグメンテーションでも同様の性能が得られる。
論文 参考訳(メタデータ) (2023-06-23T12:09:52Z) - AutoSAM: Adapting SAM to Medical Images by Overloading the Prompt
Encoder [101.28268762305916]
この作業では、Segment Anything Modelを同じ入力イメージで動作するエンコーダに置き換える。
複数の医用画像とビデオのベンチマークで最先端の結果を得る。
内部の知識を検査し、軽量なセグメンテーションソリューションを提供するために、浅いデコンボリューションネットワークによってマスクに復号化することを学ぶ。
論文 参考訳(メタデータ) (2023-06-10T07:27:00Z) - MedSegDiff-V2: Diffusion based Medical Image Segmentation with
Transformer [53.575573940055335]
我々は、MedSegDiff-V2と呼ばれるトランスフォーマーベースの拡散フレームワークを提案する。
画像の異なる20種類の画像分割作業において,その有効性を検証する。
論文 参考訳(メタデータ) (2023-01-19T03:42:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。