論文の概要: OmniCD: A Foundational Framework for Remote Sensing Image Change Detection Guided by Multimodal Semantics
- arxiv url: http://arxiv.org/abs/2605.30168v1
- Date: Thu, 28 May 2026 16:20:18 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-30 02:45:56.527814
- Title: OmniCD: A Foundational Framework for Remote Sensing Image Change Detection Guided by Multimodal Semantics
- Title(参考訳): OmniCD:マルチモーダル・セマンティックスによるリモートセンシング画像変化検出のための基礎的フレームワーク
- Authors: Chenhao Sun,
- Abstract要約: リモートセンシングにおける変化検出(CD)は、都市モニタリングや災害評価などの応用に不可欠である。
我々はマルチモーダル・セマンティック・ガイダンスを通じてリモートセンシングCDを統合・拡張するフレームワークであるOmniCDを提案する。
- 参考スコア(独自算出の注目度): 0.6345523830122167
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Change detection (CD) in remote sensing is vital for applications such as urban monitoring and disaster assessment, yet traditional methods struggle with generalization across diverse scenarios. We present OmniCD, a foundational framework that unifies and enhances remote sensing CD through multimodal semantic guidance. OmniCD incorporates image and text prompts -- such as textual descriptions, semantic maps, and geospatial metadata -- into a unified architecture, supporting tasks from binary CD to zero-shot semantic change understanding. The framework integrates a hierarchical scene retrieval module and a change detection module, reinforced by a style disentanglement mechanism for improved cross-domain robustness. We further introduce RSITCD, a large-scale multimodal dataset with 300K+ annotated image-text pairs. Extensive experiments show that OmniCD achieves state-of-the-art performance across benchmarks, demonstrating strong adaptability and setting a solid foundation for general-purpose CD systems in remote sensing.
- Abstract(参考訳): リモートセンシングにおける変化検出(CD)は、都市モニタリングや災害評価などの応用には不可欠であるが、従来の手法は様々なシナリオをまたいだ一般化に苦慮している。
我々は,マルチモーダル・セマンティック・ガイダンスを通じてリモートセンシングCDを統合・拡張する基盤的フレームワークであるOmniCDを提案する。
OmniCDは、画像とテキストのプロンプト(テキスト記述、セマンティックマップ、地理空間メタデータなど)を統一アーキテクチャに統合し、バイナリCDからゼロショットセマンティックチェンジ理解までのタスクをサポートする。
このフレームワークは、階層的なシーン検索モジュールと変更検出モジュールを統合し、ドメイン間の堅牢性を改善するためのスタイルのアンタングル機構によって強化される。
さらに,300K以上の注釈付き画像テキストペアを持つ大規模マルチモーダルデータセットであるRSITCDを紹介する。
大規模な実験により、OmniCDはベンチマーク全体で最先端のパフォーマンスを達成し、強力な適応性を示し、リモートセンシングにおける汎用CDシステムの基盤となることが示されている。
関連論文リスト
- Foundation Model-Driven Semantic Change Detection in Remote Sensing Imagery [12.711361119734542]
RS基盤モデルPerAにより駆動される意味変化検出(SCD)手法であるPerASCDを提案する。
複雑なSCDデコードパイプラインを単純化するモジュール型カスケードGated Decoder (CG-Decoder) を導入する。
我々のデコーダは、2つの公開ベンチマークデータセット上での最先端(SOTA)性能を達成する。
論文 参考訳(メタデータ) (2026-02-14T13:56:31Z) - ViLaCD-R1: A Vision-Language Framework for Semantic Change Detection in Remote Sensing [5.966253859501895]
ViLaCD-R1はMulti-Image Reasoner (MIR)とMask-Guided Decoder (MGD)からなる2段階のフレームワークである。
我々は,ViLaCD-R1が真の意味変化認識と局所化を大幅に改善し,非意味的変動を頑健に抑制し,複雑な実世界のシナリオにおいて不正確な精度を実現することを示す。
論文 参考訳(メタデータ) (2025-12-29T06:58:46Z) - Referring Change Detection in Remote Sensing Imagery [49.841833753558575]
本稿では、自然言語のプロンプトを利用してリモートセンシング画像の変化の特定のクラスを検出するReferring Change Detection (RCD)を紹介する。
我々は, (I) textbfRCDNet, (II) textbfRCDGen, (II) 拡散型合成データ生成パイプラインからなる2段階のフレームワークを提案する。
論文 参考訳(メタデータ) (2025-12-12T16:57:12Z) - LG-CD: Enhancing Language-Guided Change Detection through SAM2 Adaptation [9.324344835427858]
我々はLG-CD(Language-Guided Change Detection Model)を提案する。
このモデルは、自然言語のプロンプトを利用して、ネットワークの関心領域への注意を向ける。
3つのデータセットに対する実験により、LG-CDは最先端の変更検出方法よりも一貫して優れていることが示された。
論文 参考訳(メタデータ) (2025-09-26T05:30:11Z) - Multimodal Feature Fusion Network with Text Difference Enhancement for Remote Sensing Change Detection [36.96267014127019]
MMChangeは画像とテキストのモダリティを組み合わせて精度とロバスト性を高めるマルチモーダルRSCD手法である。
画像特徴のセマンティックな制限を克服するために、視覚言語モデル(VLM)を用いてバイテンポラル画像の意味的記述を生成する。
テキスト差分拡張(TDE)モジュールは細粒度のセマンティックシフトをキャプチャし、モデルを意味のある変化へと導く。
論文 参考訳(メタデータ) (2025-09-04T07:39:18Z) - MGCR-Net:Multimodal Graph-Conditioned Vision-Language Reconstruction Network for Remote Sensing Change Detection [55.702662643521265]
マルチモーダルデータのセマンティックインタラクション機能を検討するために,マルチモーダルグラフ条件付き視覚言語再構成ネットワーク(MGCR-Net)を提案する。
4つの公開データセットによる実験結果から,MGCRは主流CD法に比べて優れた性能を示した。
論文 参考訳(メタデータ) (2025-08-03T02:50:08Z) - AuxDet: Auxiliary Metadata Matters for Omni-Domain Infrared Small Target Detection [49.81255045696323]
補助メタデータ駆動型赤外小型ターゲット検出器(AuxDet)について述べる。
AuxDetはメタデータセマンティクスと視覚的特徴を統合し、各サンプルに対する適応表現学習を導く。
挑戦的なWideIRSTD-Fullベンチマークの実験は、AuxDetが一貫して最先端のメソッドより優れていることを示した。
論文 参考訳(メタデータ) (2025-05-21T07:02:05Z) - Semantic-CC: Boosting Remote Sensing Image Change Captioning via Foundational Knowledge and Semantic Guidance [19.663899648983417]
本稿では,基礎知識と意味指導に基づく新しい変更キャプション(CC)手法を提案する。
提案手法を LEVIR-CC および LEVIR-CD データセット上で検証する。
論文 参考訳(メタデータ) (2024-07-19T05:07:41Z) - Cross-Domain Few-Shot Object Detection via Enhanced Open-Set Object Detector [72.05791402494727]
本稿では,CD-FSODを用いたクロスドメイン小ショット検出法について検討する。
最小限のラベル付き例で、新しいドメインのための正確なオブジェクト検出器を開発することを目的としている。
論文 参考訳(メタデータ) (2024-02-05T15:25:32Z) - TransY-Net:Learning Fully Transformer Networks for Change Detection of
Remote Sensing Images [64.63004710817239]
リモートセンシング画像CDのためのトランスフォーマーベース学習フレームワークTransY-Netを提案する。
グローバルな視点からの特徴抽出を改善し、ピラミッド方式で多段階の視覚的特徴を組み合わせる。
提案手法は,4つの光学式および2つのSAR画像CDベンチマーク上での最先端性能を実現する。
論文 参考訳(メタデータ) (2023-10-22T07:42:19Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。