論文の概要: SegChange-R1:Augmented Reasoning for Remote Sensing Change Detection via Large Language Models
- arxiv url: http://arxiv.org/abs/2506.17944v1
- Date: Sun, 22 Jun 2025 08:40:56 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-24 19:06:36.662985
- Title: SegChange-R1:Augmented Reasoning for Remote Sensing Change Detection via Large Language Models
- Title(参考訳): SegChange-R1:大規模言語モデルによるリモートセンシング変化検出のための拡張推論
- Authors: Fei Zhou,
- Abstract要約: 本稿では,大規模言語モデル (LLM) 拡張推論手法 (SegChange-R1) を提案する。
また、UAV視点から変化検出を構築するための最初のデータセットを構築した。
- 参考スコア(独自算出の注目度): 7.156844376973501
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Remote sensing change detection is widely used in a variety of fields such as urban planning, terrain and geomorphology analysis, and environmental monitoring, mainly by analyzing the significant change differences of features (e.g., building changes) in the same spatial region at different time phases. In this paper, we propose a large language model (LLM) augmented inference approach (SegChange-R1), which enhances the detection capability by integrating textual descriptive information and aims at guiding the model to segment the more interested change regions, thus accelerating the convergence speed. Moreover, we design a spatial transformation module (BEV) based on linear attention, which solves the problem of modal misalignment in change detection by unifying features from different temporal perspectives onto the BEV space. In addition, we construct the first dataset for building change detection from UAV viewpoints (DVCD ), and our experiments on four widely-used change detection datasets show a significant improvement over existing methods. The code and pre-trained models are available in https://github.com/Yu-Zhouz/SegChange-R1.
- Abstract(参考訳): リモートセンシングによる変化検出は, 都市計画, 地形, 地形解析, 環境モニタリングなどの様々な分野で広く利用されており, 主に, 異なる時間相における同じ空間領域における特徴(例えば, 建物の変化)の有意な変化を解析することによって行われる。
本稿では,テキスト記述情報を統合することによって検出能力を向上する大規模言語モデル (LLM) 拡張推論手法 (SegChange-R1) を提案する。
さらに、線形注意に基づく空間変換モジュール(BEV)を設計し、異なる時間的視点からの特徴をBEV空間に統一することにより、変化検出における修正ミスアライメントの問題を解決する。
さらに,UAV視点(DVCD)から変化検出を構築するための最初のデータセットを構築した。
コードと事前トレーニングされたモデルはhttps://github.com/Yu-Zhouz/SegChange-R1.comで公開されている。
関連論文リスト
- Information-Bottleneck Driven Binary Neural Network for Change Detection [53.866667209237434]
Binarized Change Detection (BiCD) は、変更検出用に設計された最初のバイナリニューラルネットワーク(BNN)である。
Information Bottleneck (IB) の原則に基づく補助的目的を導入し,本質的な入力情報を保持するようにエンコーダを誘導する。
BiCDは、BNNベースの変更検出のための新しいベンチマークを確立し、この領域で最先端のパフォーマンスを達成する。
論文 参考訳(メタデータ) (2025-07-04T11:56:16Z) - A Sensor Agnostic Domain Generalization Framework for Leveraging Geospatial Foundation Models: Enhancing Semantic Segmentation viaSynergistic Pseudo-Labeling and Generative Learning [5.299218284699214]
高性能セグメンテーションモデルは、センサ、照明、地理のアノテーション不足と可変性によって挑戦されている。
本稿では,ソフトアライメント擬似ラベルとソース・ツー・ターゲット生成事前学習を組み合わせることで,新しい地理空間基盤モデルを活用するための領域一般化手法を提案する。
ハイパースペクトルおよびマルチスペクトルリモートセンシングデータセットを用いた実験により、適応性とセグメンテーションを向上させる方法の有効性が確認された。
論文 参考訳(メタデータ) (2025-05-02T19:52:02Z) - A Remote Sensing Image Change Detection Method Integrating Layer Exchange and Channel-Spatial Differences [4.370130821531168]
リモートセンシング画像における変化検出は、地球観測にとって重要な技術である。
深層学習において、特徴写像の空間次元とチャネル次元は、元の画像と異なる情報を表す。
本研究では,両時間的特徴の空間次元だけでなく,チャネル次元からも差分情報を計算できることを見出した。
論文 参考訳(メタデータ) (2025-01-19T00:14:20Z) - Show Me What and Where has Changed? Question Answering and Grounding for Remote Sensing Change Detection [82.65760006883248]
我々は,CDQAG (Change Detection Question Answering and Grounding) という新しいタスクを導入する。
CDQAGは、解釈可能なテキスト回答と直感的な視覚的証拠を提供することで、従来の変更検出タスクを拡張している。
QAG-360Kと呼ばれる最初のCDQAGベンチマークデータセットを構築し、360K以上の質問、テキスト回答、およびそれに対応する高品質な視覚マスクを含む。
論文 参考訳(メタデータ) (2024-10-31T11:20:13Z) - A Mamba-based Siamese Network for Remote Sensing Change Detection [27.200043694866388]
リモートセンシング画像における変化検出は、異なるタイミングで領域を解析するための重要なツールである。
CNNやTransformerといったディープラーニングの手法は、大きな変化を検出することに成功しています。
本研究では,関心領域をよりよく分割するマンバ型変化検出器(M-CD)を提案する。
論文 参考訳(メタデータ) (2024-07-08T17:05:48Z) - MineNetCD: A Benchmark for Global Mining Change Detection on Remote Sensing Imagery [29.38505174142192]
リモートセンシング画像を用いた地球規模の地雷検出のためのベンチマークであるMineNetCDを紹介する。
まず,両時間高分解能リモートセンシング画像の70万枚以上のパッチを用いたグローバルな地雷変化検出データセットを構築した。
次に,変更対応のFast Fourier Transform (ChangeFFT) モジュールをベースとした新しいベースラインモデルを提案する。
第3に、13以上の高度な変更検出モデルを統合する統合された変更検出フレームワークを構築する。
論文 参考訳(メタデータ) (2024-07-04T14:45:44Z) - ChangeBind: A Hybrid Change Encoder for Remote Sensing Change Detection [16.62779899494721]
変化検出(CD)は、異なる時刻スタンプで同じ地理的領域間の意味的変化を検出することを目的とした、リモートセンシング(RS)の基本課題である。
本稿では,バイテンポラルRS画像における意味変化をエンコードする,効果的なSiameseベースのフレームワークを提案する。
論文 参考訳(メタデータ) (2024-04-26T17:47:14Z) - ELGC-Net: Efficient Local-Global Context Aggregation for Remote Sensing Change Detection [65.59969454655996]
本稿では,変化領域を正確に推定するために,リッチな文脈情報を利用する効率的な変化検出フレームワークELGC-Netを提案する。
提案するELGC-Netは、リモートセンシング変更検出ベンチマークにおいて、最先端の性能を新たに設定する。
また,ELGC-Net-LWも導入した。
論文 参考訳(メタデータ) (2024-03-26T17:46:25Z) - MS-Former: Memory-Supported Transformer for Weakly Supervised Change
Detection with Patch-Level Annotations [50.79913333804232]
弱い教師付き変化検出のためのメモリ支援トランス (MS-Former) を提案する。
MS-Former は双方向注意ブロック (BAB) とパッチレベルの監視スキーム (PSS) から構成される。
3つのベンチマークデータセットの実験結果から,提案手法の有効性が示された。
論文 参考訳(メタデータ) (2023-11-16T09:57:29Z) - Robust Domain Adaptive Object Detection with Unified Multi-Granularity Alignment [59.831917206058435]
ドメイン適応検出は、ターゲットドメイン上の検出器の一般化を改善することを目的としている。
近年のアプローチは、異なる粒度の特徴アライメントを通じて、逆学習を通じてドメイン適応を実現する。
ドメイン不変な特徴学習のための統合多重粒度アライメント(MGA)に基づく検出フレームワークを提案する。
論文 参考訳(メタデータ) (2023-01-01T08:38:07Z) - Weakly Supervised Change Detection Using Guided Anisotropic Difusion [97.43170678509478]
我々は、このようなデータセットを変更検出の文脈で活用するのに役立つ独自のアイデアを提案する。
まず,意味的セグメンテーション結果を改善する誘導異方性拡散(GAD)アルゴリズムを提案する。
次に、変化検出に適した2つの弱い教師付き学習戦略の可能性を示す。
論文 参考訳(メタデータ) (2021-12-31T10:03:47Z) - Spatial Context Awareness for Unsupervised Change Detection in Optical
Satellite Images [11.018182254899859]
SiROC(Sibling Regression for Optical Change Detection)について紹介する。
SiROCは、中高解像度の光学衛星画像における変化検出の教師なし手法である。
中解像度のSentinel-2と高解像度のPlanetscope画像による変化検出の競合性能を実現する。
論文 参考訳(メタデータ) (2021-10-05T14:13:48Z) - AdaZoom: Adaptive Zoom Network for Multi-Scale Object Detection in Large
Scenes [57.969186815591186]
大規模なシーンの検出は、小さなオブジェクトと極端なスケールの変動のために難しい問題である。
本稿では,物体検出のための焦点領域を適応的に拡大するために,フレキシブルな形状と焦点長を有する選択的拡大器として,新しい適応型Zoom(AdaZoom)ネットワークを提案する。
論文 参考訳(メタデータ) (2021-06-19T03:30:22Z) - Cycle and Semantic Consistent Adversarial Domain Adaptation for Reducing
Simulation-to-Real Domain Shift in LiDAR Bird's Eye View [110.83289076967895]
ドメイン適応プロセス中に関心のある小さなオブジェクトの情報を保存するために,事前の意味分類を用いたサイクガンに基づくbevドメイン適応法を提案する。
生成したBEVの品質は,KITTI 3D Object Detection Benchmarkの最先端3Dオブジェクト検出フレームワークを用いて評価されている。
論文 参考訳(メタデータ) (2021-04-22T12:47:37Z) - Semantic Change Detection with Asymmetric Siamese Networks [71.28665116793138]
2つの空中画像が与えられた場合、セマンティックチェンジ検出は、土地被覆のバリエーションを特定し、それらの変化タイプをピクセルワイド境界で識別することを目的としている。
この問題は、正確な都市計画や天然資源管理など、多くの地球ビジョンに関連するタスクにおいて不可欠である。
本研究では, 広く異なる構造を持つモジュールから得られた特徴対を用いて意味変化を同定し, 同定するための非対称システマネットワーク(ASN)を提案する。
論文 参考訳(メタデータ) (2020-10-12T13:26:30Z) - DASNet: Dual attentive fully convolutional siamese networks for change
detection of high resolution satellite images [17.839181739760676]
研究の目的は、関心の変化情報を識別し、無関係な変更情報を干渉要因としてフィルタリングすることである。
近年、ディープラーニングの台頭により、変化検出のための新しいツールが提供され、目覚ましい結果が得られた。
我々は,高解像度画像における変化検出のための新しい手法,すなわち,二重注意型完全畳み込みシームズネットワーク(DASNet)を提案する。
論文 参考訳(メタデータ) (2020-03-07T16:57:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。