論文の概要: STeInFormer: Spatial-Temporal Interaction Transformer Architecture for Remote Sensing Change Detection
- arxiv url: http://arxiv.org/abs/2412.17247v1
- Date: Mon, 23 Dec 2024 03:40:04 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-12-24 15:58:07.039604
- Title: STeInFormer: Spatial-Temporal Interaction Transformer Architecture for Remote Sensing Change Detection
- Title(参考訳): STeInFormer:リモートセンシング変化検出のための時空間相互作用変換器アーキテクチャ
- Authors: Xiaowen Ma, Zhenkai Wu, Mengting Ma, Mengjiao Zhao, Fan Yang, Zhenhong Du, Wei Zhang,
- Abstract要約: マルチ時間特徴抽出のための時空間相互作用変換器アーキテクチャSTeInFormerを提案する。
また、RSCDのスペクトル情報を提供する周波数領域機能を統合するためのパラメータフリー多周波トークンミキサーを提案する。
- 参考スコア(独自算出の注目度): 5.4610555622532475
- License:
- Abstract: Convolutional neural networks and attention mechanisms have greatly benefited remote sensing change detection (RSCD) because of their outstanding discriminative ability. Existent RSCD methods often follow a paradigm of using a non-interactive Siamese neural network for multi-temporal feature extraction and change detection heads for feature fusion and change representation. However, this paradigm lacks the contemplation of the characteristics of RSCD in temporal and spatial dimensions, and causes the drawback on spatial-temporal interaction that hinders high-quality feature extraction. To address this problem, we present STeInFormer, a spatial-temporal interaction Transformer architecture for multi-temporal feature extraction, which is the first general backbone network specifically designed for RSCD. In addition, we propose a parameter-free multi-frequency token mixer to integrate frequency-domain features that provide spectral information for RSCD. Experimental results on three datasets validate the effectiveness of the proposed method, which can outperform the state-of-the-art methods and achieve the most satisfactory efficiency-accuracy trade-off. Code is available at https://github.com/xwmaxwma/rschange.
- Abstract(参考訳): 畳み込みニューラルネットワークと注意機構は、その優れた識別能力のために、リモートセンシング変化検出(RSCD)に大きな恩恵を受けている。
既存のRSCD法は、多時間的特徴抽出や特徴融合や変化表現のための変化検出ヘッドに非インタラクティブなシームズニューラルネットワークを使用するというパラダイムに従うことが多い。
しかし、このパラダイムは、時空間次元におけるRSCDの特性の考察を欠き、高品位の特徴抽出を妨げる空間的時間的相互作用の欠点を引き起こす。
この問題に対処するため,マルチ時間特徴抽出のための時空間対話型トランスフォーマアーキテクチャSTeInFormerを提案する。
さらに,RSCDのスペクトル情報を提供する周波数領域機能を統合するために,パラメータフリーな多周波トークンミキサを提案する。
3つのデータセットによる実験結果から,提案手法の有効性が検証された。
コードはhttps://github.com/xwmaxwma/rschange.comから入手できる。
関連論文リスト
- Neuromorphic Wireless Split Computing with Multi-Level Spikes [69.73249913506042]
ニューロモルフィックコンピューティングでは、スパイクニューラルネットワーク(SNN)が推論タスクを実行し、シーケンシャルデータを含むワークロードの大幅な効率向上を提供する。
ハードウェアとソフトウェアの最近の進歩は、スパイクニューロン間で交換された各スパイクに数ビットのペイロードを埋め込むことにより、推論精度をさらに高めることを示した。
本稿では,マルチレベルSNNを用いた無線ニューロモルフィック分割計算アーキテクチャについて検討する。
論文 参考訳(メタデータ) (2024-11-07T14:08:35Z) - Relating CNN-Transformer Fusion Network for Change Detection [23.025190360146635]
RCTNetは、空間的特徴と時間的特徴の両方を利用する早期融合バックボーンを導入した。
実験では、従来のRS画像CD法よりもRCTNetの方が明らかに優れていることを示した。
論文 参考訳(メタデータ) (2024-07-03T14:58:40Z) - DDLNet: Boosting Remote Sensing Change Detection with Dual-Domain Learning [5.932234366793244]
変化センシング(RSCD)は、多時間リモートセンシング画像を分析して、ある領域における関心の変化を特定することを目的としている。
既存のRSCD法は、関心の変化を高めるために空間領域におけるコンテキストモデリングに費やされている。
二重領域学習(周波数領域と空間領域)に基づくRSCDネットワークDNetを提案する。
論文 参考訳(メタデータ) (2024-06-19T14:54:09Z) - Time-Selective RNN for Device-Free Multi-Room Human Presence Detection
Using WiFi CSI [9.927073290898848]
デバイスなしの人間の存在検知は、ホームオートメーション、セキュリティ、ヘルスケアなど、さまざまなアプリケーションにとって重要な技術である。
近年,商用WiFiアクセスポイント(AP)から抽出した無線チャネル状態情報を用いて,詳細なチャネル特性について検討している。
本稿では,時間選択型条件付き二重特徴抽出再帰ネットワークを用いたマルチルームシナリオのためのデバイスフリーな人間の存在検知システムを提案する。
論文 参考訳(メタデータ) (2023-04-25T19:21:47Z) - STNet: Spatial and Temporal feature fusion network for change detection
in remote sensing images [5.258365841490956]
空間的・時間的特徴融合に基づくリモートセンシング変化検出ネットワークSTNetを提案する。
RSCDのための3つのベンチマークデータセットの実験結果から,提案手法が最先端の性能を実現することを示す。
論文 参考訳(メタデータ) (2023-04-22T14:40:41Z) - Deep Metric Learning for Unsupervised Remote Sensing Change Detection [60.89777029184023]
リモートセンシング変化検出(RS-CD)は、マルチテンポラルリモートセンシング画像(MT-RSI)から関連する変化を検出することを目的とする。
既存のRS-CD法の性能は、大規模な注釈付きデータセットのトレーニングによるものである。
本稿では,これらの問題に対処可能なディープメトリック学習に基づく教師なしCD手法を提案する。
論文 参考訳(メタデータ) (2023-03-16T17:52:45Z) - Gait Recognition in the Wild with Multi-hop Temporal Switch [81.35245014397759]
野生での歩行認識は、より実践的な問題であり、マルチメディアとコンピュータビジョンのコミュニティの注目を集めています。
本稿では,現実のシーンにおける歩行パターンの効果的な時間的モデリングを実現するために,新しいマルチホップ時間スイッチ方式を提案する。
論文 参考訳(メタデータ) (2022-09-01T10:46:09Z) - Deep Cellular Recurrent Network for Efficient Analysis of Time-Series
Data with Spatial Information [52.635997570873194]
本研究では,空間情報を用いた複雑な多次元時系列データを処理するための新しいディープセルリカレントニューラルネットワーク(DCRNN)アーキテクチャを提案する。
提案するアーキテクチャは,文献に比較して,学習可能なパラメータをかなり少なくしつつ,最先端の性能を実現している。
論文 参考訳(メタデータ) (2021-01-12T20:08:18Z) - Searching Multi-Rate and Multi-Modal Temporal Enhanced Networks for
Gesture Recognition [89.0152015268929]
RGB-Dジェスチャ認識のための最初のニューラルアーキテクチャサーチ(NAS)手法を提案する。
提案手法は,1)3次元中央差分畳畳み込み(3D-CDC)ファミリーによる時間的表現の強化,および多モードレート分岐と横方向接続のための最適化されたバックボーンを含む。
結果として得られたマルチレートネットワークは、RGBと深さ変調と時間力学の関係を理解するための新しい視点を提供する。
論文 参考訳(メタデータ) (2020-08-21T10:45:09Z) - Deep Siamese Domain Adaptation Convolutional Neural Network for
Cross-domain Change Detection in Multispectral Images [28.683734356006262]
クロスドメイン変化検出のための新しいディープ・サイムズ・ドメイン適応畳み込みニューラルネットワーク(DSDANet)アーキテクチャを提案する。
我々の知る限りでは、このようなドメイン適応に基づくディープネットワークが変更検出のために提案されたのは初めてである。
論文 参考訳(メタデータ) (2020-04-13T02:15:04Z) - Temporal-Spatial Neural Filter: Direction Informed End-to-End
Multi-channel Target Speech Separation [66.46123655365113]
ターゲット音声分離とは、混合信号からターゲット話者の音声を抽出することを指す。
主な課題は、複雑な音響環境とリアルタイム処理の要件である。
複数話者混合から対象音声波形を直接推定する時間空間ニューラルフィルタを提案する。
論文 参考訳(メタデータ) (2020-01-02T11:12:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。