論文の概要: Boundary-Aware Test-Time Adaptation for Zero-Shot Medical Image Segmentation
- arxiv url: http://arxiv.org/abs/2512.04520v1
- Date: Thu, 04 Dec 2025 07:08:21 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-05 21:11:46.035508
- Title: Boundary-Aware Test-Time Adaptation for Zero-Shot Medical Image Segmentation
- Title(参考訳): ゼロショット医用画像分割のための境界認識テスト時間適応
- Authors: Chenlin Xu, Lei Zhang, Lituan Wang, Xinyu Pu, Pengfei Ma, Guangwu Qian, Zizhou Wang, Yan Wang,
- Abstract要約: BA-TTA-SAMはテスト時間適応によるSAMのゼロショットセグメンテーション性能を向上させるテスト時間適応フレームワークである。
我々のフレームワークは、医用画像分割における最先端モデルよりも一貫して優れています。
- 参考スコア(独自算出の注目度): 12.159529070716824
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Due to the scarcity of annotated data and the substantial computational costs of model, conventional tuning methods in medical image segmentation face critical challenges. Current approaches to adapting pretrained models, including full-parameter and parameter-efficient fine-tuning, still rely heavily on task-specific training on downstream tasks. Therefore, zero-shot segmentation has gained increasing attention, especially with foundation models such as SAM demonstrating promising generalization capabilities. However, SAM still faces notable limitations on medical datasets due to domain shifts, making efficient zero-shot enhancement an urgent research goal. To address these challenges, we propose BA-TTA-SAM, a task-agnostic test-time adaptation framework that significantly enhances the zero-shot segmentation performance of SAM via test-time adaptation. This framework integrates two key mechanisms: (1) The encoder-level Gaussian prompt injection embeds Gaussian-based prompts directly into the image encoder, providing explicit guidance for initial representation learning. (2) The cross-layer boundary-aware attention alignment exploits the hierarchical feature interactions within the ViT backbone, aligning deep semantic responses with shallow boundary cues. Experiments on four datasets, including ISIC, Kvasir, BUSI, and REFUGE, show an average improvement of 12.4\% in the DICE score compared with SAM's zero-shot segmentation performance. The results demonstrate that our method consistently outperforms state-of-the-art models in medical image segmentation. Our framework significantly enhances the generalization ability of SAM, without requiring any source-domain training data. Extensive experiments on publicly available medical datasets strongly demonstrate the superiority of our framework. Our code is available at https://github.com/Emilychenlin/BA-TTA-SAM.
- Abstract(参考訳): 注釈付きデータの不足とモデルの相当な計算コストのため、医用画像分割における従来のチューニング手法は重要な課題に直面している。
フルパラメータやパラメータ効率のよい微調整を含む事前訓練モデルへの現在のアプローチは、下流タスクにおけるタスク固有のトレーニングに大きく依存している。
そのため、特にSAMのような基礎モデルが有望な一般化能力を示すなど、ゼロショットセグメンテーションが注目されている。
しかし、SAMはドメインシフトによる医学データセットの顕著な制限に直面しており、効率的なゼロショットの強化が緊急の研究目標となっている。
これらの課題に対処するため,テスト時間適応によるSAMのゼロショットセグメンテーション性能を大幅に向上させるタスク依存型テスト時間適応フレームワークBA-TTA-SAMを提案する。
1)エンコーダレベルのガウス的プロンプトインジェクションは,イメージエンコーダに直接ガウス的プロンプトを埋め込み,初期表現学習のための明確なガイダンスを提供する。
2) 層間境界認識アライメントは,ViTバックボーン内の階層的特徴相互作用を利用して,深いセマンティック応答と浅いバウンダリキューを整列させる。
ISIC、Kvasir、BUSI、REFUGEを含む4つのデータセットの実験では、SAMのゼロショットセグメンテーション性能と比較して、DICEスコアの平均12.4\%の改善が示されている。
その結果,本手法は医用画像セグメンテーションにおける最先端モデルよりも一貫して優れていた。
我々のフレームワークは、ソースドメインのトレーニングデータを必要とせずにSAMの一般化能力を大幅に向上させる。
利用可能な医療データセットに関する大規模な実験は、我々のフレームワークの優位性を強く示している。
私たちのコードはhttps://github.com/Emilychenlin/BA-TTA-SAMで利用可能です。
関連論文リスト
- VesSAM: Efficient Multi-Prompting for Segmenting Complex Vessel [68.24765319399286]
本稿では,2次元血管セグメンテーションに適した,強力で効率的なフレームワークであるVesSAMを提案する。
VesSAMは、(1)局所的なテクスチャ機能を強化する畳み込みアダプタ、(2)解剖学的プロンプトを融合するマルチプロンプトエンコーダ、(3)ジャグアーティファクトを減らす軽量マスクデコーダを統合する。
VesSAMは、最先端のPEFTベースのSAMを10%以上のDiceと13%のIoUで一貫して上回っている。
論文 参考訳(メタデータ) (2025-11-02T15:47:05Z) - MedSeqFT: Sequential Fine-tuning Foundation Models for 3D Medical Image Segmentation [55.37355146924576]
MedSeqFTは、医用画像解析のためのシーケンシャルな微調整フレームワークである。
事前訓練されたモデルを新しいタスクに適応させ、表現能力を改善する。
最先端の微調整戦略を一貫して上回ります。
論文 参考訳(メタデータ) (2025-09-07T15:22:53Z) - ConformalSAM: Unlocking the Potential of Foundational Segmentation Models in Semi-Supervised Semantic Segmentation with Conformal Prediction [57.930531826380836]
本研究は,未ラベル画像のアノテータとして画素レベルの視覚課題におけるラベル不足に,基礎的セグメンテーションモデルが対処できるかどうかを考察する。
ConformalSAMは,まず対象ドメインのラベル付きデータを用いて基礎モデルを校正し,ラベルなしデータの信頼できないピクセルラベルをフィルタリングする新しいSSSSフレームワークである。
論文 参考訳(メタデータ) (2025-07-21T17:02:57Z) - Efficient Knowledge Distillation of SAM for Medical Image Segmentation [0.04672991859386895]
Segment Anything Model (SAM)はインタラクティブなイメージセグメンテーションの新しい標準を設定し、さまざまなタスクで堅牢なパフォーマンスを提供する。
我々は, エンコーダとデコーダの最適化を, Mean Squared Error (MSE) と Perceptual Loss の組み合わせで組み合わせた新しい知識蒸留手法 KD SAM を提案する。
KD SAMはセグメンテーションの精度と計算効率を効果的にバランスさせ、資源制約のある環境でリアルタイムの医用画像セグメンテーションに適している。
論文 参考訳(メタデータ) (2025-01-28T06:33:30Z) - MCP-MedSAM: A Powerful Lightweight Medical Segment Anything Model Trained with a Single GPU in Just One Day [0.6827423171182151]
医用画像のセグメンテーションは、解剖学的構造や病変の特定に焦点をあてて、医療画像を意味のある領域に分割する。
Anything Model(SAM)は、様々なタスクのパフォーマンスを改善するために、医学領域に適応するよう研究者に促している。
MCP-MedSAMは、40GBのメモリを持つ単一のA100 GPU上で1日以内にトレーニングできるように設計された、強力で軽量な医療SAMモデルである。
論文 参考訳(メタデータ) (2024-12-08T10:50:59Z) - Promptable Anomaly Segmentation with SAM Through Self-Perception Tuning [63.55145330447408]
異常セグメンテーションのための textbfSelf-textbfPerceptinon textbfTuning (textbfSPT) 法を提案する。
SPT法は, 自己描画型チューニング戦略を取り入れ, 異常マスクの初期粗いドラフトを生成し, 精製処理を行う。
論文 参考訳(メタデータ) (2024-11-26T08:33:25Z) - Adapting Segment Anything Model for Unseen Object Instance Segmentation [70.60171342436092]
Unseen Object Instance(UOIS)は、非構造環境で動作する自律ロボットにとって不可欠である。
UOISタスクのためのデータ効率のよいソリューションであるUOIS-SAMを提案する。
UOIS-SAMは、(i)HeatmapベースのPrompt Generator(HPG)と(ii)SAMのマスクデコーダに適応する階層識別ネットワーク(HDNet)の2つの重要なコンポーネントを統合する。
論文 参考訳(メタデータ) (2024-09-23T19:05:50Z) - SAM-Driven Weakly Supervised Nodule Segmentation with Uncertainty-Aware Cross Teaching [13.5553526185399]
自動結節分割は超音波画像におけるコンピュータ支援診断に不可欠である。
近年、SAMのようなセグメンテーション基礎モデルは、自然画像に顕著な一般化性を示している。
本研究では, セグメンテーション基盤モデルを利用して擬似ラベルを生成する, 弱教師付きフレームワークを考案する。
論文 参考訳(メタデータ) (2024-07-18T14:27:54Z) - ASPS: Augmented Segment Anything Model for Polyp Segmentation [77.25557224490075]
SAM(Segment Anything Model)は、ポリープセグメンテーションに先例のないポテンシャルを導入している。
SAMのTransformerベースの構造は、グローバルおよび低周波情報を優先する。
CFAはトレーニング可能なCNNエンコーダブランチと凍結したViTエンコーダを統合し、ドメイン固有の知識の統合を可能にする。
論文 参考訳(メタデータ) (2024-06-30T14:55:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。