論文の概要: Prompt-Free and Efficient SAM2 Adaptation for Biomedical Semantic Segmentation via Dual Adapters
- arxiv url: http://arxiv.org/abs/2605.05979v1
- Date: Thu, 07 May 2026 10:24:01 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-08 22:27:11.698129
- Title: Prompt-Free and Efficient SAM2 Adaptation for Biomedical Semantic Segmentation via Dual Adapters
- Title(参考訳): バイオメディカルセマンティック・セマンティック・セマンティック・セマンティック・セマンティック・セマンティック・アダプターのプロンプトフリー・効率的なSAM2適応
- Authors: Hinako Mitsuoka, Kazuhiro Hotta,
- Abstract要約: Segment Anything Model 2 (SAM2)は、自然画像上で印象的なゼロショット機能を示したが、ドメインシフトや依存関係の急激な追加によるバイオメディカルセグメンテーションの課題に直面した。
可変サイズの入力に対するマルチクラスセグメンテーションのために設計された,プロンプトフリーでパラメータ効率の良い微調整フレームワークを提案する。
本法では,バニラ2のセグメンテーション精度を19.66%向上させ,重度医療SAM適応と比較して計算コストを約87%削減した。
- 参考スコア(独自算出の注目度): 20.7405249370601
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Segment Anything Model 2 (SAM2) demonstrated impressive zero-shot capabilities on natural images but faces challenges in biomedical segmentation due to significant domain shifts and prompt dependency. To address these limitations, we propose a prompt-free, parameter-efficient fine-tuning framework designed for multi-class segmentation on variable-sized inputs. We introduce a convolutional Positional Encoding Generator to adapt effectively to arbitrary aspect ratios and present a dual-adapter strategy: High-Performance Adapter utilizing deformable convolutions for precise boundary modeling and Lightweight Adapter employing structural re-parameterization to minimize inference latency. Experiments on ISBI 2012, Kvasir-SEG, Synapse, and ACDC datasets demonstrate that our approach significantly outperforms strong adaptation baselines. Specifically, our method improved segmentation accuracy by up to 19.66\% over the vanilla SAM2, while reducing computational costs by approximately 87\% compared to heavyweight medical SAM adaptations, establishing a superior trade-off between accuracy and efficiency.
- Abstract(参考訳): Segment Anything Model 2 (SAM2)は、自然画像上で印象的なゼロショット機能を示したが、大きなドメインシフトと素早い依存性のため、バイオメディカルセグメンテーションの課題に直面した。
これらの制約に対処するために,変数サイズの入力に対するマルチクラスセグメンテーションのために設計された,プロンプトフリーでパラメータ効率の良い微調整フレームワークを提案する。
本稿では、任意のアスペクト比に効果的に対応するために、畳み込み型位置符号化生成器を導入し、デュアルアダプタ戦略を示す: 正確な境界モデリングのために変形可能な畳み込みを利用するハイパフォーマンスアダプタと、推論遅延を最小限に抑える構造的再パラメータ化を利用する軽量アダプタ。
ISBI 2012、Kvasir-SEG、Synapse、ACDCデータセットに関する実験は、我々のアプローチが強い適応ベースラインを著しく上回ることを示した。
具体的には,バニラSAM2のセグメンテーション精度を最大19.66 %向上させるとともに,重度医療SAM適応と比較して計算コストを約87 %削減し,精度と効率のトレードオフを良好に確立した。
関連論文リスト
- Harnessing Lightweight Transformer with Contextual Synergic Enhancement for Efficient 3D Medical Image Segmentation [59.711744386226194]
モデル効率を実現するための軽量トランスであるLight-UNETRを提案する。
Light-UNETRは軽量次元減少(LIDR)モジュールを備えており、空間次元とチャネル次元を減少させる。
また,変換器のデータ効率向上を目的としたCSE学習戦略も導入した。
論文 参考訳(メタデータ) (2026-03-24T16:24:19Z) - Adaptive Linear Path Model-Based Diffusion [52.84663832658799]
リニアパスモデルベース拡散(LP-MBD)を導入し、分散保存スケジュールをフローマッチング線形確率パスに置き換える。
また,適応型LP-MBD(ALP-MBD)を提案し,タスクの複雑さや環境条件に応じて拡散ステップやノイズレベルを調整する。
論文 参考訳(メタデータ) (2026-02-02T21:33:03Z) - Time2Vec Transformer for Robust Gesture Recognition from Low-Density sEMG [1.231764991565978]
本稿では筋電義手制御のための新しい,データ効率の高いディープラーニングフレームワークを提案する。
提案手法は, スパース2チャネル表面筋電図(sEMG)に最適化されたハイブリッドトランスフォーマーの実装である。
提案するフレームワークは, 迅速なパーソナライズが可能な次世代人工装具の堅牢で費用対効果の高い青写真を提供する。
論文 参考訳(メタデータ) (2026-02-02T09:28:27Z) - VesSAM: Efficient Multi-Prompting for Segmenting Complex Vessel [68.24765319399286]
本稿では,2次元血管セグメンテーションに適した,強力で効率的なフレームワークであるVesSAMを提案する。
VesSAMは、(1)局所的なテクスチャ機能を強化する畳み込みアダプタ、(2)解剖学的プロンプトを融合するマルチプロンプトエンコーダ、(3)ジャグアーティファクトを減らす軽量マスクデコーダを統合する。
VesSAMは、最先端のPEFTベースのSAMを10%以上のDiceと13%のIoUで一貫して上回っている。
論文 参考訳(メタデータ) (2025-11-02T15:47:05Z) - S2A: A Unified Framework for Parameter and Memory Efficient Transfer Learning [8.602744958104969]
本研究では,微調整時の活性化のメモリフットプリントを低減するため,新しいPETLフレームワークであるStructure to Activation (S2A)を提案する。
具体的には,1)パラメトリックモデル構造におけるアクティベーションモジュールの設計(バイアス,プロンプト,サイドモジュール)からなり,パラメータやアクティベーションメモリの大幅な削減を実現している。
提案手法は既存のPETL技術よりも優れており,GPUメモリフットプリントの4倍の削減を実現しているだけでなく,可変パラメータの少ない精度で競合性能を示す。
論文 参考訳(メタデータ) (2025-03-11T08:10:03Z) - Efficient Knowledge Distillation of SAM for Medical Image Segmentation [0.04672991859386895]
Segment Anything Model (SAM)はインタラクティブなイメージセグメンテーションの新しい標準を設定し、さまざまなタスクで堅牢なパフォーマンスを提供する。
我々は, エンコーダとデコーダの最適化を, Mean Squared Error (MSE) と Perceptual Loss の組み合わせで組み合わせた新しい知識蒸留手法 KD SAM を提案する。
KD SAMはセグメンテーションの精度と計算効率を効果的にバランスさせ、資源制約のある環境でリアルタイムの医用画像セグメンテーションに適している。
論文 参考訳(メタデータ) (2025-01-28T06:33:30Z) - SAM-DA: Decoder Adapter for Efficient Medical Domain Adaptation [3.5534229601986294]
本稿では,医用画像のセマンティックセグメンテーションにおける領域適応課題について述べる。
モデルのエンド・ツー・エンドの微調整を行う最近の手法は、単に計算的に抽出できない。
本稿では,訓練可能なパラメータの数を最小限に抑えつつ,完全微調整に匹敵する性能を実現する新しいSAMアダプタ手法を提案する。
論文 参考訳(メタデータ) (2025-01-12T15:08:29Z) - Promptable Anomaly Segmentation with SAM Through Self-Perception Tuning [63.55145330447408]
異常セグメンテーションのための textbfSelf-textbfPerceptinon textbfTuning (textbfSPT) 法を提案する。
SPT法は, 自己描画型チューニング戦略を取り入れ, 異常マスクの初期粗いドラフトを生成し, 精製処理を行う。
論文 参考訳(メタデータ) (2024-11-26T08:33:25Z) - Parameter Efficient Fine-tuning via Cross Block Orchestration for Segment Anything Model [81.55141188169621]
PEFTにクロスブロックオーケストレーション機構を組み、SAM(Segment Anything Model)の様々な下流シナリオへの適応を可能にする。
本稿では,超複素層から重みが生じる線形射影ヘッドを導入するブロック内拡張モジュールを提案する。
提案手法は,約1Kのパラメータのみを付加した新規シナリオにおいて,セグメンテーション性能を大幅に向上させる。
論文 参考訳(メタデータ) (2023-11-28T11:23:34Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。