Fugu-MT 論文翻訳(概要): TransY-Net:Learning Fully Transformer Networks for Change Detection of Remote Sensing Images

論文の概要: TransY-Net:Learning Fully Transformer Networks for Change Detection of Remote Sensing Images

arxiv url: http://arxiv.org/abs/2310.14214v1
Date: Sun, 22 Oct 2023 07:42:19 GMT
ステータス: 翻訳完了
システム内更新日: 2023-10-25 01:02:05.513430
Title: TransY-Net:Learning Fully Transformer Networks for Change Detection of Remote Sensing Images
Title（参考訳）: transy-net:リモートセンシング画像の変更検出のための完全トランスフォーマネットワークの学習
Authors: Tianyu Yan and Zifu Wan and Pingping Zhang and Gong Cheng and Huchuan Lu
Abstract要約: リモートセンシング画像CDのためのトランスフォーマーベース学習フレームワークTransY-Netを提案する。グローバルな視点からの特徴抽出を改善し、ピラミッド方式で多段階の視覚的特徴を組み合わせる。提案手法は,4つの光学式および2つのSAR画像CDベンチマーク上での最先端性能を実現する。
参考スコア（独自算出の注目度）: 64.63004710817239
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: In the remote sensing field, Change Detection (CD) aims to identify and localize the changed regions from dual-phase images over the same places. Recently, it has achieved great progress with the advances of deep learning. However, current methods generally deliver incomplete CD regions and irregular CD boundaries due to the limited representation ability of the extracted visual features. To relieve these issues, in this work we propose a novel Transformer-based learning framework named TransY-Net for remote sensing image CD, which improves the feature extraction from a global view and combines multi-level visual features in a pyramid manner. More specifically, the proposed framework first utilizes the advantages of Transformers in long-range dependency modeling. It can help to learn more discriminative global-level features and obtain complete CD regions. Then, we introduce a novel pyramid structure to aggregate multi-level visual features from Transformers for feature enhancement. The pyramid structure grafted with a Progressive Attention Module (PAM) can improve the feature representation ability with additional inter-dependencies through spatial and channel attentions. Finally, to better train the whole framework, we utilize the deeply-supervised learning with multiple boundary-aware loss functions. Extensive experiments demonstrate that our proposed method achieves a new state-of-the-art performance on four optical and two SAR image CD benchmarks. The source code is released at https://github.com/Drchip61/TransYNet.
Abstract（参考訳）: リモートセンシングの分野では、変更検出(cd)は、変化した領域を2相画像から同一場所に識別し、ローカライズすることを目的としている。近年、深層学習の進歩によって大きな進歩を遂げている。しかし、現在の方法では、抽出された視覚特徴の限られた表現能力のため、一般に不完全なCD領域と不規則なCD境界が提供される。そこで本研究では,リモートセンシング画像CDのためのトランスフォーマーベースの新しい学習フレームワークであるTransY-Netを提案する。より具体的には、提案フレームワークは、まず、長距離依存性モデリングにおけるTransformerの利点を利用する。より差別的なグローバルレベルの特徴を学び、完全なCD領域を得るのに役立つ。次に,トランスフォーマーの多層視覚特徴を集約して特徴強調を行う新しいピラミッド構造を提案する。プログレッシブ・アテンション・モジュール(PAM)でグラフトされたピラミッド構造は、空間的およびチャネル的注意により、追加の依存性で特徴表現能力を向上させることができる。最後に、フレームワーク全体をより良くトレーニングするために、複数の境界認識損失関数を持つ深い教師付き学習を利用する。広汎な実験により,提案手法は4つの光学式および2つのSAR画像CDベンチマークにおいて,新しい最先端性能を実現することを示した。ソースコードはhttps://github.com/Drchip61/TransYNetで公開されている。

関連論文リスト

Wavelet-Guided Dual-Frequency Encoding for Remote Sensing Change Detection [67.84730634802204]
リモートセンシング画像の変化検出は,自然災害監視,都市拡張追跡,インフラ管理など,さまざまな工学的応用において重要な役割を担っている。既存のほとんどの手法は空間領域モデリングに依存しており、特徴表現の限られた多様性は微妙な変化領域の検出を妨げる。本研究では、特にウェーブレット領域における周波数領域の特徴モデリングが周波数成分の微細な違いを増幅し、空間領域において捉えにくいエッジ変化の知覚を高めることを観察する。
論文参考訳（メタデータ） (2025-08-07T11:14:16Z)
MGCR-Net:Multimodal Graph-Conditioned Vision-Language Reconstruction Network for Remote Sensing Change Detection [55.702662643521265]
マルチモーダルデータのセマンティックインタラクション機能を検討するために,マルチモーダルグラフ条件付き視覚言語再構成ネットワーク(MGCR-Net)を提案する。 4つの公開データセットによる実験結果から,MGCRは主流CD法に比べて優れた性能を示した。
論文参考訳（メタデータ） (2025-08-03T02:50:08Z)
Unity is Strength: Unifying Convolutional and Transformeral Features for Better Person Re-Identification [60.9670254833103]
人物再識別(ReID)は、重複しないカメラを通して特定の人物を回収することを目的としている。画像に基づく人物ReIDのためのCNNとトランスフォーマーの強みを統合するために,FusionReIDと呼ばれる新しい融合フレームワークを提案する。
論文参考訳（メタデータ） (2024-12-23T03:19:19Z)
A Hybrid Transformer-Mamba Network for Single Image Deraining [70.64069487982916]
既存のデラリング変換器では、固定レンジウィンドウやチャネル次元に沿って自己アテンション機構を採用している。本稿では,多分岐型トランスフォーマー・マンバネットワーク(Transformer-Mamba Network,TransMamba Network,Transformer-Mamba Network)を提案する。
論文参考訳（メタデータ） (2024-08-31T10:03:19Z)
EfficientCD: A New Strategy For Change Detection Based With Bi-temporal Layers Exchanged [3.3885253104046993]
本稿では,リモートセンシング画像変化検出のためのEfficientCDという新しいディープラーニングフレームワークを提案する。このフレームワークは機能抽出のバックボーンネットワークとしてEfficientNetを使用している。 EfficientCDは4つのリモートセンシングデータセットで実験的に検証されている。
論文参考訳（メタデータ） (2024-07-22T19:11:50Z)
Spatial-frequency Dual-Domain Feature Fusion Network for Low-Light Remote Sensing Image Enhancement [49.15531684596958]
低照度リモートセンシング画像強調のためのDFFN(Dual-Domain Feature Fusion Network)を提案する。第1フェーズは振幅情報を学習して画像輝度を復元し、第2フェーズは位相情報を学習して詳細を洗練させる。我々は、現在の暗光リモートセンシング画像強調におけるデータセットの欠如に対応するために、2つの暗光リモートセンシングデータセットを構築した。
論文参考訳（メタデータ） (2024-04-26T13:21:31Z)
ELGC-Net: Efficient Local-Global Context Aggregation for Remote Sensing Change Detection [65.59969454655996]
本稿では,変化領域を正確に推定するために,リッチな文脈情報を利用する効率的な変化検出フレームワークELGC-Netを提案する。提案するELGC-Netは、リモートセンシング変更検出ベンチマークにおいて、最先端の性能を新たに設定する。また,ELGC-Net-LWも導入した。
論文参考訳（メタデータ） (2024-03-26T17:46:25Z)
ObjFormer: Learning Land-Cover Changes From Paired OSM Data and Optical High-Resolution Imagery via Object-Guided Transformer [31.46969412692045]
本稿では,ペアOSMデータと光学画像を用いた土地被覆変化の直接検出の先駆者となる。本稿では、オブジェクトベース画像解析(OBIA)技術と高度な視覚変換器アーキテクチャを自然に組み合わせたオブジェクト誘導変換器(Former)を提案する。 OpenMapCDと呼ばれる大規模なベンチマークデータセットは、詳細な実験を行うために構築されている。
論文参考訳（メタデータ） (2023-10-04T09:26:44Z)
Effective Image Tampering Localization via Enhanced Transformer and Co-attention Fusion [5.691973573807887]
本稿では,2分岐拡張型トランスフォーマーエンコーダを用いた画像改ざんネットワーク(EITLNet)を提案する。 RGBとノイズストリームから抽出した特徴は、座標注意に基づく融合モジュールによって効果的に融合される。
論文参考訳（メタデータ） (2023-09-17T15:43:06Z)
MCTNet: A Multi-Scale CNN-Transformer Network for Change Detection in Optical Remote Sensing Images [7.764449276074902]
MCTNetと呼ばれるマルチスケールCNN変換器構造に基づくハイブリッドネットワークを提案する。 MCTNetは既存の最先端CD法よりも優れた検出性能が得られることを示す。
論文参考訳（メタデータ） (2022-10-14T07:54:28Z)
Fully Transformer Network for Change Detection of Remote Sensing Images [22.989324947501014]
リモートセンシング画像CDのための新しい学習フレームワークであるFully Transformer Network (FTN)を提案する。グローバルな視点からの特徴抽出を改善し、ピラミッド方式で多段階の視覚的特徴を組み合わせる。提案手法は,4つの公開CDベンチマーク上での最先端性能を実現する。
論文参考訳（メタデータ） (2022-10-03T08:21:25Z)
Vision Transformer with Convolutions Architecture Search [72.70461709267497]
本稿では,畳み込み型アーキテクチャサーチ(VTCAS)を用いたアーキテクチャ探索手法を提案する。 VTCASによって探索された高性能バックボーンネットワークは、畳み込みニューラルネットワークの望ましい特徴をトランスフォーマーアーキテクチャに導入する。これは、特に低照度屋内シーンにおいて、物体認識のためのニューラルネットワークの堅牢性を高める。
論文参考訳（メタデータ） (2022-03-20T02:59:51Z)
HAT: Hierarchical Aggregation Transformers for Person Re-identification [87.02828084991062]
我々は,CNNとトランスフォーマーの両方の利点を,高性能な画像ベース人物Re-IDに適用する。作業は、画像ベースのRe-IDのためのCNNとTransformerの両方の利点を初めて活用する。
論文参考訳（メタデータ） (2021-07-13T09:34:54Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。