論文の概要: Set Pivot Learning: Redefining Generalized Segmentation with Vision Foundation Models
- arxiv url: http://arxiv.org/abs/2508.01582v1
- Date: Sun, 03 Aug 2025 04:20:35 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-05 18:25:21.951135
- Title: Set Pivot Learning: Redefining Generalized Segmentation with Vision Foundation Models
- Title(参考訳): Set Pivot Learning:ビジョンファウンデーションモデルによる一般化セグメンテーションの再定義
- Authors: Xinhui Li, Xinyu He, Qiming Hu, Xiaojie Guo,
- Abstract要約: 本稿では,ビジョンファウンデーションモデル(VFM)に基づくドメイン一般化(DG)を再定義するパラダイムシフトであるSet Pivot Learningの概念を紹介する。
従来のDGは、トレーニング中にターゲットドメインがアクセスできないと仮定するが、VFMの出現により、この仮定は不明確で時代遅れである。
VFMに基づく新しいドメインマイグレーションタスクであるSet Pivot Learning (SPL)を提案する。
- 参考スコア(独自算出の注目度): 15.321114178936554
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In this paper, we introduce, for the first time, the concept of Set Pivot Learning, a paradigm shift that redefines domain generalization (DG) based on Vision Foundation Models (VFMs). Traditional DG assumes that the target domain is inaccessible during training, but the emergence of VFMs, trained on vast and diverse data, renders this assumption unclear and obsolete. Traditional DG assumes that the target domain is inaccessible during training, but the emergence of VFMs, which are trained on vast and diverse datasets, renders this assumption unclear and obsolete. To address this challenge, we propose Set Pivot Learning (SPL), a new definition of domain migration task based on VFMs, which is more suitable for current research and application requirements. Unlike conventional DG methods, SPL prioritizes adaptive refinement over rigid domain transfer, ensuring continuous alignment with evolving real-world conditions. Specifically, SPL features two key attributes: (i) Dynamic adaptation, transitioning from static domain alignment to flexible, task-driven feature optimization, enabling models to evolve with downstream scenarios; (ii) VFM-centric tuning, leveraging pretrained knowledge as a pivot to hone task-specific representations while preserving cross-domain robustness. Building on SPL, we propose a Dynamic Prompt Fine-Tuning method, which combines a Dynamic Class-aware Prompter with a Prompt-guided Feature Focuser, to elevate VFM performance in targeted scenarios. Extensive experiments on benchmark datasets show the effectiveness of our method, highlighting its superiority over state-of-the-art methods, particularly in generalized segmentation.
- Abstract(参考訳): 本稿では,ビジョンファウンデーションモデル(VFM)に基づくドメイン一般化(DG)を再定義するパラダイムシフトである,Set Pivot Learningの概念を初めて紹介する。
従来のDGは、トレーニング中にターゲットドメインがアクセスできないと仮定するが、膨大な多様なデータに基づいてトレーニングされたVFMの出現は、この仮定を不明瞭で時代遅れにする。
従来のDGは、トレーニング中にターゲットドメインにアクセスできないと仮定しているが、膨大な多様なデータセットでトレーニングされたVFMの出現は、この仮定を不明瞭で時代遅れにしている。
この課題に対処するために、我々は、VFMに基づく新しいドメインマイグレーションタスクであるSPL(Set Pivot Learning)を提案する。
従来のDG法とは異なり、SPLは厳密な領域移動よりも適応的な洗練を優先し、進化する現実世界の条件と連続的な整合性を確保する。
具体的には、SPLには2つの重要な属性がある。
(i)動的適応、静的ドメインアライメントからフレキシブルなタスク駆動機能最適化への移行により、下流シナリオでモデルを進化させることができる。
(II) VFM中心のチューニングは、事前訓練された知識を、ドメイン間の堅牢性を保ちながら、タスク固有の表現のピボットとして活用する。
SPL 上に構築した Dynamic Prompt Fine-Tuning 法では,動的クラス認識型 Prompter と Prompt 誘導型 Feature Focuser を組み合わせることで,ターゲットシナリオにおける VFM の性能向上を図る。
ベンチマークデータセットの大規模な実験により,提案手法の有効性が示され,特に一般化セグメンテーションにおいて,最先端手法よりも優位性が示された。
関連論文リスト
- Multi-Granularity Feature Calibration via VFM for Domain Generalized Semantic Segmentation [15.35795137118814]
ドメイン一般化セマンティック(DGSS)は、トレーニング中にターゲットデータにアクセスすることなく、目に見えないドメインにまたがるモデルの一般化能力を改善することを目的としている。
DGSSの最近の進歩は、パラメータ効率の良い微調整戦略を通じて、視覚基盤モデル(VFM)をますます活用している。
ドメインシフト下での強靭性を高めるために,VFM特徴の粗大なアライメントを行う新しいフレームワークであるMulti-Granularity Feature (MGFC)を提案する。
論文 参考訳(メタデータ) (2025-08-05T02:24:31Z) - FisherTune: Fisher-Guided Robust Tuning of Vision Foundation Models for Domain Generalized Segmentation [65.93276461982093]
既存のアプローチでは、パラメータを選択的に微調整するか、VFMを凍結し、アダプタのみを更新する。
我々は、Domain-Related Fisher Information Matrix (DR-FIM) によって誘導される堅牢な微調整法である textbfFisherTune を提案する。
DR-FIMはタスクやドメイン間でパラメータの感度を測定し、汎用性を維持し、DGSS適応性を高めるための選択的更新を可能にする。
論文 参考訳(メタデータ) (2025-03-23T04:47:15Z) - VLMs meet UDA: Boosting Transferability of Open Vocabulary Segmentation with Unsupervised Domain Adaptation [3.776249047528669]
本稿では、ビジョンランゲージ推論と教師なしドメイン適応(UDA)の鍵戦略を統合することにより、多様なドメイン間のセグメンテーション精度を向上させることを提案する。
提案したFROVSS(Foundational-Retaining Open Vocabulary)フレームワークにおいて,VLMの細粒度セグメンテーション機能の改善を,マルチスケールのコンテキストデータ,即時拡張による堅牢なテキスト埋め込み,レイヤワイズ微調整により実現した。
結果として生じるUDA-FROVフレームワークは、共有カテゴリを必要とせずにドメイン間で効果的に適応する最初のUDAアプローチである。
論文 参考訳(メタデータ) (2024-12-12T12:49:42Z) - Advancing Open-Set Domain Generalization Using Evidential Bi-Level Hardest Domain Scheduler [45.71475375161575]
Open-Set Domain Generalizationでは、新しいデータ外観(ドメイン)とオープンセット条件の両方でモデルが公開される。
適応型ドメインスケジューラを実現するために,Evidential Bi-Level Hardest Domain Scheduler (EBiL-HaDS)を提案する。
論文 参考訳(メタデータ) (2024-09-26T05:57:35Z) - HCVP: Leveraging Hierarchical Contrastive Visual Prompt for Domain
Generalization [69.33162366130887]
ドメイン一般化(DG)は、不変の機能を学ぶことによって、目に見えないシナリオに優れた機械学習モデルを作成するための取り組みである。
モデルにドメインレベルとタスク固有の特性を補足する新しい手法を提案する。
このアプローチは、特定の特徴から不変な特徴をより効果的に分離し、一般化を促進することを目的としている。
論文 参考訳(メタデータ) (2024-01-18T04:23:21Z) - Consistency Regularization for Generalizable Source-free Domain
Adaptation [62.654883736925456]
ソースフリードメイン適応(source-free domain adapt, SFDA)は、ソースデータセットにアクセスすることなく、十分にトレーニングされたソースモデルを未学習のターゲットドメインに適応することを目的としている。
既存のSFDAメソッドは、ターゲットのトレーニングセット上で適用されたモデルを評価し、目に見えないが同一の分散テストセットからデータを無視する。
より一般化可能なSFDA法を開発するための整合正則化フレームワークを提案する。
論文 参考訳(メタデータ) (2023-08-03T07:45:53Z) - Open-Set Domain Adaptation with Visual-Language Foundation Models [51.49854335102149]
非教師なしドメイン適応(UDA)は、ソースドメインからラベルのないデータを持つターゲットドメインへの知識の転送に非常に効果的であることが証明されている。
オープンセットドメイン適応(ODA)は、トレーニングフェーズ中にこれらのクラスを識別する潜在的なソリューションとして登場した。
論文 参考訳(メタデータ) (2023-07-30T11:38:46Z) - ViDA: Homeostatic Visual Domain Adapter for Continual Test Time Adaptation [48.039156140237615]
目標ドメインの継続的な変更に事前訓練されたモデルを適用するために、連続的なテスト時間適応タスクを提案する。
我々はCTTA用のVisual Domain Adapter (ViDA) を設計し、ドメイン固有知識とドメイン共有知識の両方を明示的に扱う。
提案手法は,CTTAタスクの分類とセグメント化の両方において,最先端の性能を実現する。
論文 参考訳(メタデータ) (2023-06-07T11:18:53Z) - IDA: Informed Domain Adaptive Semantic Segmentation [51.12107564372869]
クラスレベルのセグメンテーション性能に基づいてデータを混合する自己学習フレームワークであるDomain Informed Adaptation (IDA) モデルを提案する。
IDAモデルでは、クラスレベルの性能を期待信頼スコア(ECS)によって追跡し、動的スケジュールを用いて異なる領域のデータに対する混合比を決定する。
提案手法は,GTA-Vの都市景観への適応において1.1 mIoU,SynTHIAの都市への適応において0.9 mIoUのマージンで,最先端のUDA-SS法よりも優れる。
論文 参考訳(メタデータ) (2023-03-05T18:16:34Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。