論文の概要: CMP: A Composable Meta Prompt for SAM-Based Cross-Domain Few-Shot Segmentation
- arxiv url: http://arxiv.org/abs/2507.16753v1
- Date: Tue, 22 Jul 2025 16:42:23 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-23 21:34:14.210663
- Title: CMP: A Composable Meta Prompt for SAM-Based Cross-Domain Few-Shot Segmentation
- Title(参考訳): CMP:SAMベースのクロスドメインFew-Shotセグメンテーションのための構成可能なメタプロンプト
- Authors: Shuai Chen, Fanman Meng, Chunjin Yang, Haoran Wei, Chenhao Wu, Qingbo Wu, Hongliang Li,
- Abstract要約: CD-FSS(Cross-Domain Few-Shots)は、限られたデータとドメインシフトのため、依然として困難である。
最近のSegment Anything Model (SAM) のような基礎モデルは、一般的なセグメンテーションタスクにおいて顕著なゼロショット一般化能力を示している。
i) セマンティック展開のための参照補完・変換(RCT)モジュール,(ii) 自動メタプロンプト合成のための構成可能メタプロンプト生成(CMPG)モジュール,(iii) ドメインの差分緩和のための周波数認識インタラクション(FAI)モジュールの3つの主要なモジュールを紹介する。
- 参考スコア(独自算出の注目度): 20.489756120720568
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Cross-Domain Few-Shot Segmentation (CD-FSS) remains challenging due to limited data and domain shifts. Recent foundation models like the Segment Anything Model (SAM) have shown remarkable zero-shot generalization capability in general segmentation tasks, making it a promising solution for few-shot scenarios. However, adapting SAM to CD-FSS faces two critical challenges: reliance on manual prompt and limited cross-domain ability. Therefore, we propose the Composable Meta-Prompt (CMP) framework that introduces three key modules: (i) the Reference Complement and Transformation (RCT) module for semantic expansion, (ii) the Composable Meta-Prompt Generation (CMPG) module for automated meta-prompt synthesis, and (iii) the Frequency-Aware Interaction (FAI) module for domain discrepancy mitigation. Evaluations across four cross-domain datasets demonstrate CMP's state-of-the-art performance, achieving 71.8\% and 74.5\% mIoU in 1-shot and 5-shot scenarios respectively.
- Abstract(参考訳): CD-FSS(Cross-Domain Few-Shot Segmentation)は、限られたデータとドメインシフトのため、依然として困難である。
最近のSegment Anything Model (SAM) のような基盤モデルは、一般的なセグメンテーションタスクにおいて顕著なゼロショットの一般化能力を示しており、数ショットのシナリオに対して有望なソリューションとなっている。
しかし、SAMをCD-FSSに適合させるには、手動のプロンプトへの依存とドメイン間の限られた能力の2つの重要な課題がある。
そこで我々は,3つの重要なモジュールを導入したComposable Meta-Prompt (CMP) フレームワークを提案する。
i) セマンティック展開のためのRCTモジュール
(II)自動メタプロンプト合成のための構成可能メタプロンプト生成(CMPG)モジュール及び
3)周波数-認識相互作用(FAI)モジュールは、ドメインの相違を緩和する。
4つのクロスドメインデータセットの評価は、CMPの最先端のパフォーマンスを示し、それぞれ1ショットと5ショットのシナリオで71.8\%と74.5\% mIoUを達成した。
関連論文リスト
- CMaP-SAM: Contraction Mapping Prior for SAM-driven Few-shot Segmentation [21.466035540502226]
Few-shot segmentation (FSS) は、注釈付きイメージをほとんど使用せずに新しいクラスをセグメンテーションすることを目的としている。
最近のFSS法は、SAM(Seegment Anything Model)を活用して大幅に改善されている。
CMaP-SAM は SAM 駆動 FSS の位置先を最適化するための縮尺写像理論を導入する新しいフレームワークである。
論文 参考訳(メタデータ) (2025-04-07T13:19:16Z) - Let Synthetic Data Shine: Domain Reassembly and Soft-Fusion for Single Domain Generalization [68.41367635546183]
単一ドメインの一般化は、単一のソースからのデータを使用して、さまざまなシナリオで一貫したパフォーマンスでモデルをトレーニングすることを目的としている。
モデル一般化を改善するために合成データを活用した学習フレームワークDRSFを提案する。
論文 参考訳(メタデータ) (2025-03-17T18:08:03Z) - FAMNet: Frequency-aware Matching Network for Cross-domain Few-shot Medical Image Segmentation [15.066227784509303]
既存の数発の医用画像分割(FSMIS)モデルは、様々な画像技術によって引き起こされる領域シフトという、医療画像の実践的な問題に対処できない。
本稿では、周波数対応マッチング(FAM)モジュールとマルチスペクトル融合(MSF)モジュールの2つの主要なコンポーネントを含む周波数対応マッチングネットワーク(FAMNet)を提案する。
我々のFAMNetは、既存のFSMISモデルと3つのクロスドメインデータセット上のクロスドメインFew-shot Semanticモデルを上回っています。
論文 参考訳(メタデータ) (2024-12-12T14:44:05Z) - TAVP: Task-Adaptive Visual Prompt for Cross-domain Few-shot Segmentation [40.49924427388922]
本稿では,CD-FSS(Cross-dominan Few-shot segmentation)のためのタスク適応型自動視覚プロンプトフレームワークを提案する。
クラスドメインタスク適応オートプロンプト(CDTAP)モジュールを組み込んで、クラスドメインの特徴抽出を可能にし、高品質で学習可能なビジュアルプロンプトを生成する。
本モデルでは,1ショット設定では1.3%,5ショット設定では11.76%の精度向上を実現し,最先端のCD-FSS手法よりも優れていた。
論文 参考訳(メタデータ) (2024-09-09T07:43:58Z) - APSeg: Auto-Prompt Network for Cross-Domain Few-Shot Semantic Segmentation [33.90244697752314]
クロスドメイン小ショットセマンティックセマンティックセグメンテーション(CD-FSS)のための新しい自動プロンプトネットワークであるAPSegを紹介する。
提案手法は,1ショット設定と5ショット設定の平均精度をそれぞれ5.24%,3.10%向上させる。
論文 参考訳(メタデータ) (2024-06-12T16:20:58Z) - Cross-Domain Few-Shot Segmentation via Iterative Support-Query
Correspondence Mining [81.09446228688559]
Cross-Domain Few-Shots (CD-FSS) は、限定された例のみを用いて、異なるドメインから新しいカテゴリを分割するという課題を提起する。
本稿では,CD-FSSの課題に対処する新しいクロスドメイン微調整手法を提案する。
論文 参考訳(メタデータ) (2024-01-16T14:45:41Z) - Collaborating Foundation Models for Domain Generalized Semantic Segmentation [23.359941294938142]
ドメイン一般化セマンティック(DGSS)は、ラベル付きソースドメイン上でモデルをトレーニングする。
我々はDGSSにアプローチし、CLOUDS(Domain Generalized Semantic)のためのCoLlaborative FOUndationモデルの組立を提案する。
論文 参考訳(メタデータ) (2023-12-15T13:43:24Z) - USER: Unified Semantic Enhancement with Momentum Contrast for Image-Text
Retrieval [115.28586222748478]
Image-Text Retrieval (ITR) は、与えられたクエリに意味のあるターゲットインスタンスを、他のモダリティから検索することを目的としている。
既存のアプローチは通常、2つの大きな制限に悩まされる。
論文 参考訳(メタデータ) (2023-01-17T12:42:58Z) - CRCNet: Few-shot Segmentation with Cross-Reference and Region-Global
Conditional Networks [59.85183776573642]
少ないショットセグメンテーションは、少数のトレーニングイメージを持つ新しいクラスに一般化できるセグメンテーションモデルを学ぶことを目的としている。
複数ショットセグメンテーションのためのクロスリファレンス・ローカル・グローバル・ネットワーク(CRCNet)を提案する。
我々のネットワークは、相互参照機構により、2つの画像に共起する物体をよりよく見つけることができる。
論文 参考訳(メタデータ) (2022-08-23T06:46:18Z) - Boosting Few-shot Semantic Segmentation with Transformers [81.43459055197435]
TRansformer-based Few-shot Semantic segmentation Method (TRFS)
我々のモデルは,グローバル・エンハンスメント・モジュール(GEM)とローカル・エンハンスメント・モジュール(LEM)の2つのモジュールから構成される。
論文 参考訳(メタデータ) (2021-08-04T20:09:21Z) - Memorizing Comprehensively to Learn Adaptively: Unsupervised
Cross-Domain Person Re-ID with Multi-level Memory [89.43986007948772]
対象領域における多レベル補完情報を発見するための新しいマルチレベルメモリネットワーク(MMN)を提案する。
従来の単純なメモリとは違って、ターゲット領域内の複数レベル補完情報を検出するための新しいマルチレベルメモリネットワーク(MMN)を提案する。
論文 参考訳(メタデータ) (2020-01-13T09:48:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。