論文の概要: UniVCD: A New Method for Unsupervised Change Detection in the Open-Vocabulary Era
- arxiv url: http://arxiv.org/abs/2512.13089v1
- Date: Mon, 15 Dec 2025 08:42:23 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-16 17:54:56.585529
- Title: UniVCD: A New Method for Unsupervised Change Detection in the Open-Vocabulary Era
- Title(参考訳): UniVCD:オープンボキャブラリ時代の教師なし変更検出のための新しい方法
- Authors: Ziqiang Zhu, Bowei Yang,
- Abstract要約: 変化検出(CD)は、多時間観測によるシーン変化を特定し、都市開発や環境モニタリングに広く利用されている。
既存のCD手法の多くは教師あり学習に依存しており、パフォーマンスはデータセットに依存し、高いアノテーションコストがかかる。
凍ったSAM2とCLIP上に構築された教師なしのオープン語彙変化検出手法Unified Open-Vocabulary Change Detection (UniVCD)を提案する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Change detection (CD) identifies scene changes from multi-temporal observations and is widely used in urban development and environmental monitoring. Most existing CD methods rely on supervised learning, making performance strongly dataset-dependent and incurring high annotation costs; they typically focus on a few predefined categories and generalize poorly to diverse scenes. With the rise of vision foundation models such as SAM2 and CLIP, new opportunities have emerged to relax these constraints. We propose Unified Open-Vocabulary Change Detection (UniVCD), an unsupervised, open-vocabulary change detection method built on frozen SAM2 and CLIP. UniVCD detects category-agnostic changes across diverse scenes and imaging geometries without any labeled data or paired change images. A lightweight feature alignment module is introduced to bridge the spatially detailed representations from SAM2 and the semantic priors from CLIP, enabling high-resolution, semantically aware change estimation while keeping the number of trainable parameters small. On top of this, a streamlined post-processing pipeline is further introduced to suppress noise and pseudo-changes, improving the detection accuracy for objects with well-defined boundaries. Experiments on several public BCD (Binary Change Detection) and SCD (Semantic Change Detection) benchmarks show that UniVCD achieves consistently strong performance and matches or surpasses existing open-vocabulary CD methods in key metrics such as F1 and IoU. The results demonstrate that unsupervised change detection with frozen vision foundation models and lightweight multi-modal alignment is a practical and effective paradigm for open-vocabulary CD. Code and pretrained models will be released at https://github.com/Die-Xie/UniVCD.
- Abstract(参考訳): 変化検出(CD)は、多時間観測によるシーン変化を特定し、都市開発や環境モニタリングに広く利用されている。
既存のCDメソッドの多くは教師あり学習に依存しており、パフォーマンスを強くデータセットに依存し、高いアノテーションコストをもたらす。
SAM2やCLIPといったビジョンファウンデーションモデルの台頭により、これらの制約を緩和する新たな機会が生まれている。
凍ったSAM2とCLIP上に構築された教師なしのオープン語彙変化検出手法Unified Open-Vocabulary Change Detection (UniVCD)を提案する。
UniVCDは、さまざまなシーンにまたがるカテゴリに依存しない変化を検出し、ラベル付きデータやペア化された変更画像なしでジオメトリーを撮像する。
SAM2からの空間的詳細表現とCLIPからのセマンティック事前表現をブリッジするために、軽量な機能アライメントモジュールを導入し、トレーニング可能なパラメータの数を小さく保ちながら、高解像度でセマンティックに認識された変更推定を可能にする。
これに加えて、ノイズや擬似変化を抑制し、明確に定義された境界を持つオブジェクトの検出精度を向上させるために、合理化された後処理パイプラインも導入された。
いくつかの公開BCD(Binary Change Detection)とSCD(Semantic Change Detection)ベンチマークの実験では、UniVCDは一貫して強い性能を達成し、F1やIoUといった主要な指標において既存のオープン語彙CDメソッドと一致または超えている。
その結果、凍結視覚基盤モデルと軽量マルチモーダルアライメントによる教師なし変化検出は、オープン語彙CDの実践的で効果的なパラダイムであることが示された。
コードと事前訓練されたモデルはhttps://github.com/Die-Xie/UniVCDでリリースされる。
関連論文リスト
- DiffRegCD: Integrated Registration and Change Detection with Diffusion Features [74.3102451211493]
DiffRegCDは、単一のモデルで密度の高い登録と変更検出を統一する統合フレームワークである。
空中(LEVIR-CD, DSIFN-CD, WHU-CD, SYSU-CD)と地上(VL-CMU-CD)のデータセットによる実験は、DiffRegCDが最近のベースラインを一貫して上回っていることを示している。
論文 参考訳(メタデータ) (2025-11-11T07:32:19Z) - LG-CD: Enhancing Language-Guided Change Detection through SAM2 Adaptation [9.324344835427858]
我々はLG-CD(Language-Guided Change Detection Model)を提案する。
このモデルは、自然言語のプロンプトを利用して、ネットワークの関心領域への注意を向ける。
3つのデータセットに対する実験により、LG-CDは最先端の変更検出方法よりも一貫して優れていることが示された。
論文 参考訳(メタデータ) (2025-09-26T05:30:11Z) - Cross-Domain Few-Shot Object Detection via Enhanced Open-Set Object Detector [72.05791402494727]
本稿では,CD-FSODを用いたクロスドメイン小ショット検出法について検討する。
最小限のラベル付き例で、新しいドメインのための正確なオブジェクト検出器を開発することを目的としている。
論文 参考訳(メタデータ) (2024-02-05T15:25:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。