論文の概要: SegChange-R1:Augmented Reasoning for Remote Sensing Change Detection via Large Language Models
- arxiv url: http://arxiv.org/abs/2506.17944v1
- Date: Sun, 22 Jun 2025 08:40:56 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-24 19:06:36.662985
- Title: SegChange-R1:Augmented Reasoning for Remote Sensing Change Detection via Large Language Models
- Title(参考訳): SegChange-R1:大規模言語モデルによるリモートセンシング変化検出のための拡張推論
- Authors: Fei Zhou,
- Abstract要約: 本稿では,大規模言語モデル (LLM) 拡張推論手法 (SegChange-R1) を提案する。
また、UAV視点から変化検出を構築するための最初のデータセットを構築した。
- 参考スコア(独自算出の注目度): 7.156844376973501
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Remote sensing change detection is widely used in a variety of fields such as urban planning, terrain and geomorphology analysis, and environmental monitoring, mainly by analyzing the significant change differences of features (e.g., building changes) in the same spatial region at different time phases. In this paper, we propose a large language model (LLM) augmented inference approach (SegChange-R1), which enhances the detection capability by integrating textual descriptive information and aims at guiding the model to segment the more interested change regions, thus accelerating the convergence speed. Moreover, we design a spatial transformation module (BEV) based on linear attention, which solves the problem of modal misalignment in change detection by unifying features from different temporal perspectives onto the BEV space. In addition, we construct the first dataset for building change detection from UAV viewpoints (DVCD ), and our experiments on four widely-used change detection datasets show a significant improvement over existing methods. The code and pre-trained models are available in https://github.com/Yu-Zhouz/SegChange-R1.
- Abstract(参考訳): リモートセンシングによる変化検出は, 都市計画, 地形, 地形解析, 環境モニタリングなどの様々な分野で広く利用されており, 主に, 異なる時間相における同じ空間領域における特徴(例えば, 建物の変化)の有意な変化を解析することによって行われる。
本稿では,テキスト記述情報を統合することによって検出能力を向上する大規模言語モデル (LLM) 拡張推論手法 (SegChange-R1) を提案する。
さらに、線形注意に基づく空間変換モジュール(BEV)を設計し、異なる時間的視点からの特徴をBEV空間に統一することにより、変化検出における修正ミスアライメントの問題を解決する。
さらに,UAV視点(DVCD)から変化検出を構築するための最初のデータセットを構築した。
コードと事前トレーニングされたモデルはhttps://github.com/Yu-Zhouz/SegChange-R1.comで公開されている。
関連論文リスト
- A Remote Sensing Image Change Detection Method Integrating Layer Exchange and Channel-Spatial Differences [4.370130821531168]
リモートセンシング画像における変化検出は、地球観測にとって重要な技術である。
深層学習において、特徴写像の空間次元とチャネル次元は、元の画像と異なる情報を表す。
本研究では,両時間的特徴の空間次元だけでなく,チャネル次元からも差分情報を計算できることを見出した。
論文 参考訳(メタデータ) (2025-01-19T00:14:20Z) - Show Me What and Where has Changed? Question Answering and Grounding for Remote Sensing Change Detection [82.65760006883248]
我々は,CDQAG (Change Detection Question Answering and Grounding) という新しいタスクを導入する。
CDQAGは、解釈可能なテキスト回答と直感的な視覚的証拠を提供することで、従来の変更検出タスクを拡張している。
QAG-360Kと呼ばれる最初のCDQAGベンチマークデータセットを構築し、360K以上の質問、テキスト回答、およびそれに対応する高品質な視覚マスクを含む。
論文 参考訳(メタデータ) (2024-10-31T11:20:13Z) - A Mamba-based Siamese Network for Remote Sensing Change Detection [27.200043694866388]
リモートセンシング画像における変化検出は、異なるタイミングで領域を解析するための重要なツールである。
CNNやTransformerといったディープラーニングの手法は、大きな変化を検出することに成功しています。
本研究では,関心領域をよりよく分割するマンバ型変化検出器(M-CD)を提案する。
論文 参考訳(メタデータ) (2024-07-08T17:05:48Z) - MineNetCD: A Benchmark for Global Mining Change Detection on Remote Sensing Imagery [29.38505174142192]
リモートセンシング画像を用いた地球規模の地雷検出のためのベンチマークであるMineNetCDを紹介する。
まず,両時間高分解能リモートセンシング画像の70万枚以上のパッチを用いたグローバルな地雷変化検出データセットを構築した。
次に,変更対応のFast Fourier Transform (ChangeFFT) モジュールをベースとした新しいベースラインモデルを提案する。
第3に、13以上の高度な変更検出モデルを統合する統合された変更検出フレームワークを構築する。
論文 参考訳(メタデータ) (2024-07-04T14:45:44Z) - ChangeBind: A Hybrid Change Encoder for Remote Sensing Change Detection [16.62779899494721]
変化検出(CD)は、異なる時刻スタンプで同じ地理的領域間の意味的変化を検出することを目的とした、リモートセンシング(RS)の基本課題である。
本稿では,バイテンポラルRS画像における意味変化をエンコードする,効果的なSiameseベースのフレームワークを提案する。
論文 参考訳(メタデータ) (2024-04-26T17:47:14Z) - ELGC-Net: Efficient Local-Global Context Aggregation for Remote Sensing Change Detection [65.59969454655996]
本稿では,変化領域を正確に推定するために,リッチな文脈情報を利用する効率的な変化検出フレームワークELGC-Netを提案する。
提案するELGC-Netは、リモートセンシング変更検出ベンチマークにおいて、最先端の性能を新たに設定する。
また,ELGC-Net-LWも導入した。
論文 参考訳(メタデータ) (2024-03-26T17:46:25Z) - MS-Former: Memory-Supported Transformer for Weakly Supervised Change
Detection with Patch-Level Annotations [50.79913333804232]
弱い教師付き変化検出のためのメモリ支援トランス (MS-Former) を提案する。
MS-Former は双方向注意ブロック (BAB) とパッチレベルの監視スキーム (PSS) から構成される。
3つのベンチマークデータセットの実験結果から,提案手法の有効性が示された。
論文 参考訳(メタデータ) (2023-11-16T09:57:29Z) - Robust Domain Adaptive Object Detection with Unified Multi-Granularity Alignment [59.831917206058435]
ドメイン適応検出は、ターゲットドメイン上の検出器の一般化を改善することを目的としている。
近年のアプローチは、異なる粒度の特徴アライメントを通じて、逆学習を通じてドメイン適応を実現する。
ドメイン不変な特徴学習のための統合多重粒度アライメント(MGA)に基づく検出フレームワークを提案する。
論文 参考訳(メタデータ) (2023-01-01T08:38:07Z) - Semantic Change Detection with Asymmetric Siamese Networks [71.28665116793138]
2つの空中画像が与えられた場合、セマンティックチェンジ検出は、土地被覆のバリエーションを特定し、それらの変化タイプをピクセルワイド境界で識別することを目的としている。
この問題は、正確な都市計画や天然資源管理など、多くの地球ビジョンに関連するタスクにおいて不可欠である。
本研究では, 広く異なる構造を持つモジュールから得られた特徴対を用いて意味変化を同定し, 同定するための非対称システマネットワーク(ASN)を提案する。
論文 参考訳(メタデータ) (2020-10-12T13:26:30Z) - DASNet: Dual attentive fully convolutional siamese networks for change
detection of high resolution satellite images [17.839181739760676]
研究の目的は、関心の変化情報を識別し、無関係な変更情報を干渉要因としてフィルタリングすることである。
近年、ディープラーニングの台頭により、変化検出のための新しいツールが提供され、目覚ましい結果が得られた。
我々は,高解像度画像における変化検出のための新しい手法,すなわち,二重注意型完全畳み込みシームズネットワーク(DASNet)を提案する。
論文 参考訳(メタデータ) (2020-03-07T16:57:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。