論文の概要: EMA-SAM: Exponential Moving-average for SAM-based PTMC Segmentation
- arxiv url: http://arxiv.org/abs/2510.18213v1
- Date: Tue, 21 Oct 2025 01:30:27 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-25 03:08:12.754726
- Title: EMA-SAM: Exponential Moving-average for SAM-based PTMC Segmentation
- Title(参考訳): EMA-SAM:SAMベースのPTMCセグメンテーションのための指数移動平均
- Authors: Maryam Dialameh, Hossein Rajabzadeh, Jung Suk Sim, Hyock Ju Kwon,
- Abstract要約: EMA-SAMはSAM-2の軽量拡張で、信頼性に富んだ指数的移動平均ポインターをメモリバンクに組み込む。
PTMC-RFAデータセット(124分13人)では、EMA-SAMはEmphmaxDiceを0.82から0.86に改善し、emphmaxIoUを0.72から0.76に改善し、偽陽性を29%削減した。
- 参考スコア(独自算出の注目度): 1.7674345486888503
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Papillary thyroid microcarcinoma (PTMC) is increasingly managed with radio-frequency ablation (RFA), yet accurate lesion segmentation in ultrasound videos remains difficult due to low contrast, probe-induced motion, and heat-related artifacts. The recent Segment Anything Model 2 (SAM-2) generalizes well to static images, but its frame-independent design yields unstable predictions and temporal drift in interventional ultrasound. We introduce \textbf{EMA-SAM}, a lightweight extension of SAM-2 that incorporates a confidence-weighted exponential moving average pointer into the memory bank, providing a stable latent prototype of the tumour across frames. This design preserves temporal coherence through probe pressure and bubble occlusion while rapidly adapting once clear evidence reappears. On our curated PTMC-RFA dataset (124 minutes, 13 patients), EMA-SAM improves \emph{maxDice} from 0.82 (SAM-2) to 0.86 and \emph{maxIoU} from 0.72 to 0.76, while reducing false positives by 29\%. On external benchmarks, including VTUS and colonoscopy video polyp datasets, EMA-SAM achieves consistent gains of 2--5 Dice points over SAM-2. Importantly, the EMA pointer adds \textless0.1\% FLOPs, preserving real-time throughput of $\sim$30\,FPS on a single A100 GPU. These results establish EMA-SAM as a robust and efficient framework for stable tumour tracking, bridging the gap between foundation models and the stringent demands of interventional ultrasound. Codes are available here \hyperref[code {https://github.com/mdialameh/EMA-SAM}.
- Abstract(参考訳): 乳頭状甲状腺微小癌 (PTMC) は, 高周波アブレーション (RFA) で治療されているが, 低コントラスト, プローブ誘起運動, 熱関連アーティファクトなどにより, 超音波ビデオの正確な病変セグメンテーションは困難である。
最近のSegment Anything Model 2 (SAM-2) は静止画像によく似ているが、フレームに依存しない設計は、干渉超音波の不安定な予測と時間的ドリフトをもたらす。
SAM-2 の軽量拡張である \textbf{EMA-SAM} を導入し,信頼性の高い指数移動平均ポインタをメモリバンクに組み込んだ。
この設計は、プローブ圧力と気泡閉塞による時間的コヒーレンスを保ちながら、一度明確な証拠が再び現れるように迅速に適応する。
EMA-SAMはPTMC-RFAデータセット(124分13名)で0.82(SAM-2)から0.86に改善し、emph{maxIoU}は0.72から0.76に改善した。
VTUSや大腸内視鏡ビデオポリープデータセットを含む外部ベンチマークでは、EMA-SAMはSAM-2よりも2~5Diceポイントの連続的なゲインを達成している。
重要な点として、EMAポインタは \textless0.1\% FLOPsを追加し、1つのA100 GPU上で$\sim$30\,FPSのリアルタイムスループットを保存する。
これらの結果から,EMA-SAMは安定した腫瘍追跡のための堅牢かつ効率的なフレームワークとして確立され,基礎モデルと干渉超音波の強い要求とのギャップを埋めることができた。
コードは、 \hyperref[code {https://github.com/mdialameh/EMA-SAM} で入手できる。
関連論文リスト
- SAM2LoRA: Composite Loss-Guided, Parameter-Efficient Finetuning of SAM2 for Retinal Fundus Segmentation [0.5191474416940847]
本稿では,基底画像のセグメンテーションにセグメンテーション任意のモデル2(SAM2)を適用したパラメータ効率の良い微調整手法を提案する。
SAM2LoRAはイメージエンコーダとマスクデコーダの両方に低ランクのアダプタを統合し、オリジナルのトレーニング可能なパラメータの5%未満を必要とする。
血管のDiceスコアは最大0.86点、光学ディスクのセグメンテーションは0.93点、AUCスコアは最大0.98点、AUCスコアは0.99点である。
論文 参考訳(メタデータ) (2025-10-11T17:07:44Z) - Accelerating Volumetric Medical Image Annotation via Short-Long Memory SAM 2 [10.279314732888079]
ショートロングメモリSAM 2 (SLM-SAM 2) は、セグメント化精度を向上させるために、異なる短期記憶バンクと長期記憶バンクを統合する新しいアーキテクチャである。
臓器, 骨, 筋肉の3つの公開データセットからSLM-SAM 2をMRIおよびCTで評価した。
論文 参考訳(メタデータ) (2025-05-03T16:16:24Z) - RP-SAM2: Refining Point Prompts for Stable Surgical Instrument Segmentation [21.258106247629296]
我々は,新しいシフトブロックと複合損失関数を組み込んだRP-SAM2を導入し,ポイントプロンプトを安定化させる。
提案手法は,ロバストなセグメンテーション能力を維持しつつ,正確な位置決めに依存するアノテータを低減させる。
Cataract1kデータセットの実験では、RP-SAM2はセグメンテーション精度を向上し、2%のmDSCゲイン、21.36%のmHD95が減少し、SAM2と比較してランダムな単一点プロンプト結果のばらつきが減少した。
論文 参考訳(メタデータ) (2025-03-25T18:59:23Z) - SMILE-UHURA Challenge -- Small Vessel Segmentation at Mesoscopic Scale from Ultra-High Resolution 7T Magnetic Resonance Angiograms [60.35639972035727]
公開されている注釈付きデータセットの欠如は、堅牢で機械学習駆動のセグメンテーションアルゴリズムの開発を妨げている。
SMILE-UHURAチャレンジは、7T MRIで取得したTime-of-Flightアンジオグラフィーの注釈付きデータセットを提供することで、公開されている注釈付きデータセットのギャップに対処する。
Diceスコアは、それぞれのデータセットで0.838 $pm$0.066と0.716 $pm$ 0.125まで到達し、平均パフォーマンスは0.804 $pm$ 0.15までになった。
論文 参考訳(メタデータ) (2024-11-14T17:06:00Z) - SAMPa: Sharpness-aware Minimization Parallelized [51.668052890249726]
シャープネス認識(SAM)はニューラルネットワークの一般化を改善することが示されている。
SAMの更新には2つの勾配を瞬時に計算する必要がある。
我々は,SAMPaと呼ばれるSAMの簡単な修正を提案し,この2つの勾配計算を完全に並列化することができる。
論文 参考訳(メタデータ) (2024-10-14T16:21:23Z) - Is SAM 2 Better than SAM in Medical Image Segmentation? [0.6144680854063939]
Segment Anything Model (SAM) は、自然画像上のゼロショットプロンプト可能なセグメンテーションにおいて、印象的な性能を示した。
先日リリースされたSegment Anything Model 2 (SAM2)は、SAMを画像で上回り、モデルの能力をビデオセグメンテーションに拡張したと主張している。
SAM と SAM 2 の性能を比較するために,複数のデータセットを用いて広範囲にわたる研究を行った。
論文 参考訳(メタデータ) (2024-08-08T04:34:29Z) - ASPS: Augmented Segment Anything Model for Polyp Segmentation [77.25557224490075]
SAM(Segment Anything Model)は、ポリープセグメンテーションに先例のないポテンシャルを導入している。
SAMのTransformerベースの構造は、グローバルおよび低周波情報を優先する。
CFAはトレーニング可能なCNNエンコーダブランチと凍結したViTエンコーダを統合し、ドメイン固有の知識の統合を可能にする。
論文 参考訳(メタデータ) (2024-06-30T14:55:32Z) - Temporal-spatial Adaptation of Promptable SAM Enhance Accuracy and Generalizability of cine CMR Segmentation [10.911758824265736]
本研究では,時間的情報と空間的情報の両方をモデルアーキテクチャに組み込んだcineCMR-SAMを提案する。
STACOM 2011データセットでは,データ固有モデルのセグメンテーション精度が向上した。
我々はcineCMR-SAMにテキストプロンプト機能を導入し、入力スライスのビュータイプを指定する。
論文 参考訳(メタデータ) (2024-03-15T04:27:55Z) - Stable Segment Anything Model [79.9005670886038]
SAM(Segment Anything Model)は、高品質なプロンプトが与えられた場合、顕著に迅速なセグメンテーションを実現する。
本稿では,SAMのセグメンテーション安定性について,多様なプロンプト特性のスペクトルにわたって包括的解析を行った。
1)SAMのセグメンテーション安定性を広範囲に改善し,2)SAMの強力なセグメンテーション効率と一般化を維持した。
論文 参考訳(メタデータ) (2023-11-27T12:51:42Z) - Systematic Investigation of Sparse Perturbed Sharpness-Aware
Minimization Optimizer [158.2634766682187]
ディープニューラルネットワークは、複雑で非構造的なロスランドスケープのため、しばしば一般化の貧弱さに悩まされる。
SharpnessAware Minimization (SAM) は、摂動を加える際の景観の変化を最小限に抑えることで損失を平滑化するポピュラーなソリューションである。
本稿では,二元マスクによる摂動を効果的かつ効果的に行う訓練手法であるスパースSAMを提案する。
論文 参考訳(メタデータ) (2023-06-30T09:33:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。