論文の概要: Referring Change Detection in Remote Sensing Imagery
- arxiv url: http://arxiv.org/abs/2512.11719v1
- Date: Fri, 12 Dec 2025 16:57:12 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-15 15:48:11.847658
- Title: Referring Change Detection in Remote Sensing Imagery
- Title(参考訳): リモートセンシング画像における変化検出の参照
- Authors: Yilmaz Korkmaz, Jay N. Paranjape, Celso M. de Melo, Vishal M. Patel,
- Abstract要約: 本稿では、自然言語のプロンプトを利用してリモートセンシング画像の変化の特定のクラスを検出するReferring Change Detection (RCD)を紹介する。
我々は, (I) textbfRCDNet, (II) textbfRCDGen, (II) 拡散型合成データ生成パイプラインからなる2段階のフレームワークを提案する。
- 参考スコア(独自算出の注目度): 49.841833753558575
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Change detection in remote sensing imagery is essential for applications such as urban planning, environmental monitoring, and disaster management. Traditional change detection methods typically identify all changes between two temporal images without distinguishing the types of transitions, which can lead to results that may not align with specific user needs. Although semantic change detection methods have attempted to address this by categorizing changes into predefined classes, these methods rely on rigid class definitions and fixed model architectures, making it difficult to mix datasets with different label sets or reuse models across tasks, as the output channels are tightly coupled with the number and type of semantic classes. To overcome these limitations, we introduce Referring Change Detection (RCD), which leverages natural language prompts to detect specific classes of changes in remote sensing images. By integrating language understanding with visual analysis, our approach allows users to specify the exact type of change they are interested in. However, training models for RCD is challenging due to the limited availability of annotated data and severe class imbalance in existing datasets. To address this, we propose a two-stage framework consisting of (I) \textbf{RCDNet}, a cross-modal fusion network designed for referring change detection, and (II) \textbf{RCDGen}, a diffusion-based synthetic data generation pipeline that produces realistic post-change images and change maps for a specified category using only pre-change image, without relying on semantic segmentation masks and thereby significantly lowering the barrier to scalable data creation. Experiments across multiple datasets show that our framework enables scalable and targeted change detection. Project website is here: https://yilmazkorkmaz1.github.io/RCD.
- Abstract(参考訳): リモートセンシング画像の変化検出は、都市計画、環境モニタリング、災害管理などの応用に不可欠である。
従来の変更検出手法は、移行のタイプを区別することなく、2つの時間的イメージ間のすべての変更を識別する。
セマンティックチェンジ検出手法は、事前に定義されたクラスへの変更を分類することでこの問題に対処しようとしているが、これらの手法は厳密なクラス定義と固定モデルアーキテクチャに依存しており、出力チャネルがセマンティッククラスの数と型と密結合しているため、異なるラベルセットとデータセットを混合したり、タスク間でモデルの再利用を困難にしている。
これらの制限を克服するために、自然言語のプロンプトを利用してリモートセンシング画像の特定の変更のクラスを検出するReferring Change Detection (RCD)を導入する。
言語理解と視覚分析を統合することで、ユーザが興味を持っている変更の正確なタイプを特定できる。
しかし、注釈付きデータの可用性が限られ、既存のデータセットのクラス不均衡が深刻であるため、RCDのトレーニングモデルは困難である。
そこで本研究では, (I) 変化検出を参照するために設計されたクロスモーダル融合ネットワークである \textbf{RCDNet} と, (II) 意味的セグメンテーションマスクに頼ることなく, 特定のカテゴリに対して, リアルな後変化画像と変化マップを生成する拡散型合成データ生成パイプラインである \textbf{RCDGen} の2段階のフレームワークを提案する。
複数のデータセットにまたがる実験により、我々のフレームワークはスケーラブルでターゲットを絞った変更検出を可能にしている。
プロジェクトのWebサイトはこちら。
関連論文リスト
- Leveraging Geometric Priors for Unaligned Scene Change Detection [53.523333385654546]
Unaligned Scene Change Detectionは、視点アライメントを仮定することなく、異なるタイミングでキャプチャされた画像ペア間のシーン変化を検出することを目的としている。
非整合SCDの中核的課題に対処するために、初めて幾何学的事前を導入する。
視覚基盤モデルの強力な表現とそれらを統合した学習自由フレームワークを提案する。
論文 参考訳(メタデータ) (2025-09-14T14:31:08Z) - Advancing Weakly-Supervised Change Detection in Satellite Images via Adversarial Class Prompting [49.15470825004932]
本稿では,この共起雑音問題に対処するAdvCP法を提案する。
私たちのAdvCPは、追加の推論コストを加えることなく、現在のWSCDメソッドにシームレスに統合できます。
論文 参考訳(メタデータ) (2025-08-24T02:02:16Z) - Semantic-CD: Remote Sensing Image Semantic Change Detection towards Open-vocabulary Setting [19.663899648983417]
従来の変化検出手法は、現実的なシナリオにおける意味圏をまたいだ一般化において、しばしば課題に直面している。
本稿では,リモートセンシング画像における意味変化検出に特化して設計されたSemantic-CDという新しい手法を提案する。
CLIPの広範な語彙知識を活用することで,カテゴリ間の一般化能力を高めることができる。
論文 参考訳(メタデータ) (2025-01-12T13:22:11Z) - Detect Changes like Humans: Incorporating Semantic Priors for Improved Change Detection [52.62459671461816]
本稿では,視覚基盤モデルからのセマンティックな先入観を取り入れ,変化を検出する能力の向上について検討する。
人間の視覚パラダイムにインスパイアされた新しいデュアルストリーム特徴デコーダは、意味認識特徴と差認識特徴を組み合わせることで変化を区別するために導出される。
論文 参考訳(メタデータ) (2024-12-22T08:27:15Z) - ZeroSCD: Zero-Shot Street Scene Change Detection [2.3020018305241337]
Scene Change Detectionは、コンピュータビジョンとロボティクスにおいて難しいタスクである。
従来の変更検出方法は、これらのイメージペアを入力として、変更を見積もるトレーニングモデルに依存しています。
我々は,ゼロショットシーン変化検出フレームワークであるZeroSCDを提案する。
論文 参考訳(メタデータ) (2024-09-23T17:53:44Z) - Self-Pair: Synthesizing Changes from Single Source for Object Change
Detection in Remote Sensing Imagery [6.586756080460231]
本研究では,2つの空間的無関係な画像を用いて変化検出器をトレーニングする。
本稿では,画像の残像としての操作が,変化検出の性能に不可欠であることを示す。
本手法は, 単一時間監視に基づく既存手法よりも優れる。
論文 参考訳(メタデータ) (2022-12-20T13:26:42Z) - A Weakly Supervised Convolutional Network for Change Segmentation and
Classification [91.3755431537592]
W-CDNetは、画像レベルのセマンティックラベルでトレーニングできる、弱い教師付き変更検出ネットワークである。
W-CDNetは、2つの異なるタイプのデータセットでトレーニングすることができる。
論文 参考訳(メタデータ) (2020-11-06T20:20:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。