論文の概要: Boosting SAM for Cross-Domain Few-Shot Segmentation via Conditional Point Sparsification
- arxiv url: http://arxiv.org/abs/2602.05218v1
- Date: Thu, 05 Feb 2026 02:17:38 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-06 18:49:08.718376
- Title: Boosting SAM for Cross-Domain Few-Shot Segmentation via Conditional Point Sparsification
- Title(参考訳): コンディショナルポイントスペーシングによるクロスドアシュートセグメンテーションのためのブースティングSAM
- Authors: Jiahao Nie, Yun Xing, Wenbin An, Qingsong Zhao, Jiawei Shao, Yap-Peng Tan, Alex C. Kot, Shijian Lu, Xuelong Li,
- Abstract要約: 我々は、参照例に基づいて、ドメイン間画像のSAMインタラクションを適応的にガイドする訓練不要なアプローチであるPoint Sparsification (CPS)を提案する。
CPSは、様々なCD-FSSデータセットで既存のトレーニング不要SAMベースのメソッドより優れている。
- 参考スコア(独自算出の注目度): 116.2386061247855
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Motivated by the success of the Segment Anything Model (SAM) in promptable segmentation, recent studies leverage SAM to develop training-free solutions for few-shot segmentation, which aims to predict object masks in the target image based on a few reference exemplars. These SAM-based methods typically rely on point matching between reference and target images and use the matched dense points as prompts for mask prediction. However, we observe that dense points perform poorly in Cross-Domain Few-Shot Segmentation (CD-FSS), where target images are from medical or satellite domains. We attribute this issue to large domain shifts that disrupt the point-image interactions learned by SAM, and find that point density plays a crucial role under such conditions. To address this challenge, we propose Conditional Point Sparsification (CPS), a training-free approach that adaptively guides SAM interactions for cross-domain images based on reference exemplars. Leveraging ground-truth masks, the reference images provide reliable guidance for adaptively sparsifying dense matched points, enabling more accurate segmentation results. Extensive experiments demonstrate that CPS outperforms existing training-free SAM-based methods across diverse CD-FSS datasets.
- Abstract(参考訳): セグメンテーションにおけるSAM(Seegment Anything Model)の成功に触発された最近の研究は、SAMを活用して数発のセグメンテーションのためのトレーニング不要なソリューションを開発した。
これらのSAMベースの手法は、通常、参照画像とターゲット画像の点マッチングに頼り、一致する密度の点をマスク予測のプロンプトとして使用する。
しかし,CD-FSS(Cross-Domain Few-Shot Segmentation)では,ターゲット画像が医療領域や衛星領域からのものである場合,高密度点が不十分である。
この問題はSAMが学んだ点像相互作用を妨害する大きな領域シフトによるもので、そのような条件下では点密度が重要な役割を果たす。
この課題に対処するために,コンディション・ポイント・スパシフィケーション(CPS)を提案する。これは,参照例に基づくドメイン間画像に対するSAMインタラクションを適応的にガイドする,トレーニング不要なアプローチである。
グラウントトラスマスクを活用することで、基準画像は、より正確なセグメンテーション結果を可能にするように、高密度のマッチング点を適応的にスペーシングするための信頼性の高いガイダンスを提供する。
大規模な実験では、CD-FSSデータセット間で、CPSが既存のトレーニング不要SAMベースのメソッドより優れていることが示されている。
関連論文リスト
- ConformalSAM: Unlocking the Potential of Foundational Segmentation Models in Semi-Supervised Semantic Segmentation with Conformal Prediction [57.930531826380836]
本研究は,未ラベル画像のアノテータとして画素レベルの視覚課題におけるラベル不足に,基礎的セグメンテーションモデルが対処できるかどうかを考察する。
ConformalSAMは,まず対象ドメインのラベル付きデータを用いて基礎モデルを校正し,ラベルなしデータの信頼できないピクセルラベルをフィルタリングする新しいSSSSフレームワークである。
論文 参考訳(メタデータ) (2025-07-21T17:02:57Z) - Bridge the Points: Graph-based Few-shot Segment Anything Semantically [79.1519244940518]
プレトレーニング技術の最近の進歩により、視覚基礎モデルの能力が向上した。
最近の研究はSAMをFew-shot Semantic segmentation (FSS)に拡張している。
本稿では,グラフ解析に基づく簡易かつ効果的な手法を提案する。
論文 参考訳(メタデータ) (2024-10-09T15:02:28Z) - Adapting Segment Anything Model for Unseen Object Instance Segmentation [70.60171342436092]
Unseen Object Instance(UOIS)は、非構造環境で動作する自律ロボットにとって不可欠である。
UOISタスクのためのデータ効率のよいソリューションであるUOIS-SAMを提案する。
UOIS-SAMは、(i)HeatmapベースのPrompt Generator(HPG)と(ii)SAMのマスクデコーダに適応する階層識別ネットワーク(HDNet)の2つの重要なコンポーネントを統合する。
論文 参考訳(メタデータ) (2024-09-23T19:05:50Z) - CycleSAM: Few-Shot Surgical Scene Segmentation with Cycle- and Scene-Consistent Feature Matching [2.595014480295933]
CycleSAMは、データ効率のトレーニングフェーズを採用し、一連のソフト制約を強制する、改善されたビジュアルプロンプト学習アプローチである。
CycleSAMは1ショットと5ショットの両方の設定で2~4倍の精度で既存の数ショットSAMアプローチより優れています。
論文 参考訳(メタデータ) (2024-07-09T12:08:07Z) - BLO-SAM: Bi-level Optimization Based Overfitting-Preventing Finetuning
of SAM [37.1263294647351]
BLO-SAMを導入し、二段階最適化(BLO)に基づいてSAM(Segment Anything Model)を微調整する。
BLO-SAMは、モデルの重みパラメータのトレーニングと、トレーニングデータセットの2つの別々のサブセットへの迅速な埋め込みによって、過適合のリスクを低減する。
その結果、BLO-SAMは様々な最先端画像セマンティックセグメンテーション法よりも優れた性能を示した。
論文 参考訳(メタデータ) (2024-02-26T06:36:32Z) - Semantic Attention and Scale Complementary Network for Instance
Segmentation in Remote Sensing Images [54.08240004593062]
本稿では,セマンティックアテンション(SEA)モジュールとスケール補完マスクブランチ(SCMB)で構成される,エンドツーエンドのマルチカテゴリインスタンスセグメンテーションモデルを提案する。
SEAモジュールは、機能マップ上の興味あるインスタンスのアクティベーションを強化するために、追加の監督を備えた、単純な完全な畳み込みセマンティックセマンティックセマンティクスブランチを含んでいる。
SCMBは、元のシングルマスクブランチをトリデントマスクブランチに拡張し、異なるスケールで補完マスクの監視を導入する。
論文 参考訳(メタデータ) (2021-07-25T08:53:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。