Fugu-MT 論文翻訳(概要): IDET: Iterative Difference-Enhanced Transformers for High-Quality Change Detection

論文の概要: IDET: Iterative Difference-Enhanced Transformers for High-Quality Change Detection

arxiv url: http://arxiv.org/abs/2207.09240v3
Date: Mon, 09 Dec 2024 15:11:17 GMT
ステータス: 翻訳完了
システム内更新日: 2024-12-11 15:47:16.412306
Title: IDET: Iterative Difference-Enhanced Transformers for High-Quality Change Detection
Title（参考訳）: IDET:高品質変化検出のための反復差分変換器
Authors: Qing Guo, Ruofei Wang, Rui Huang, Shuifa Sun, Yuxiang Zhang,
Abstract要約: 我々は、異なる視点からCDを研究する。つまり、特徴差を最適化して変化を強調し、変化しない領域を抑える方法である。反復差分エンハンス変換器(IDET)と呼ばれる新しいモジュールを提案する。最後のCD法は,アプリケーションシナリオの異なる6つの大規模データセットに対して,最先端の7つの手法より優れている。
参考スコア（独自算出の注目度）: 10.182069964391122
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Change detection (CD) aims to detect change regions within an image pair captured at different times, playing a significant role in diverse real-world applications. Nevertheless, most of the existing works focus on designing advanced network architectures to map the feature difference to the final change map while ignoring the influence of the quality of the feature difference. In this paper, we study the CD from a different perspective, i.e., how to optimize the feature difference to highlight changes and suppress unchanged regions, and propose a novel module denoted as iterative difference-enhanced transformers (IDET). IDET contains three transformers: two transformers for extracting the long-range information of the two images and one transformer for enhancing the feature difference. In contrast to the previous transformers, the third transformer takes the outputs of the first two transformers to guide the enhancement of the feature difference iteratively. To achieve more effective refinement, we further propose the multi-scale IDET-based change detection that uses multi-scale representations of the images for multiple feature difference refinements and proposes a coarse-to-fine fusion strategy to combine all refinements. Our final CD method outperforms seven state-of-the-art methods on six large-scale datasets under diverse application scenarios, which demonstrates the importance of feature difference enhancements and the effectiveness of IDET.
Abstract（参考訳）: 変化検出(CD)は、異なるタイミングでキャプチャされたイメージペア内の変化領域を検出し、さまざまな現実世界のアプリケーションで重要な役割を果たすことを目的としている。それにもかかわらず、既存の作業の多くは、特徴差の質の影響を無視しながら、特徴差を最終変更マップにマッピングする高度なネットワークアーキテクチャの設計に焦点を当てている。本稿では,異なる視点,すなわち特徴差を最適化して変化を強調し,変化しない領域を抑える方法について検討し,反復差分エンハンス変換器(IDET)として表現される新しいモジュールを提案する。 IDETは、2つの画像の長距離情報を抽出する2つの変換器と、特徴差を増強する1つの変換器を含む。前の変圧器とは対照的に、第3の変圧器は第1の2つの変圧器の出力を取り、特徴差の増大を反復的に導く。さらに,複数の特徴差分補正のために画像のマルチスケール表現を用いたマルチスケールIDETに基づく変更検出を提案し,全ての改良を組み合わせた粗大な融合戦略を提案する。最後のCD法は, 多様なアプリケーションシナリオ下で6つの大規模データセットに対して, 特徴差の増大とIDETの有効性を示す7つの最先端手法より優れていた。

関連論文リスト

Enhancing Perception of Key Changes in Remote Sensing Image Change Captioning [49.24306593078429]
KCFI(Key Change Features and Instruction-tuned)によるリモートセンシング画像変換キャプションのための新しいフレームワークを提案する。 KCFIは、バイテンポラルリモートセンシング画像特徴を抽出するViTsエンコーダと、重要な変化領域を識別するキー特徴知覚器と、画素レベルの変化検出デコーダとを含む。提案手法の有効性を検証するため,LEVIR-CCデータセット上のいくつかの最新の変更キャプション手法との比較を行った。
論文参考訳（メタデータ） (2024-09-19T09:33:33Z)
ChangeViT: Unleashing Plain Vision Transformers for Change Detection [3.582733645632794]
ChangeViTは、大規模な変更のパフォーマンスを高めるために、プレーンなViTバックボーンを採用するフレームワークである。このフレームワークは3つの一般的な高解像度データセット上で最先端のパフォーマンスを実現する。
論文参考訳（メタデータ） (2024-06-18T17:59:08Z)
TransY-Net:Learning Fully Transformer Networks for Change Detection of Remote Sensing Images [64.63004710817239]
リモートセンシング画像CDのためのトランスフォーマーベース学習フレームワークTransY-Netを提案する。グローバルな視点からの特徴抽出を改善し、ピラミッド方式で多段階の視覚的特徴を組み合わせる。提案手法は,4つの光学式および2つのSAR画像CDベンチマーク上での最先端性能を実現する。
論文参考訳（メタデータ） (2023-10-22T07:42:19Z)
Changes-Aware Transformer: Learning Generalized Changes Representation [56.917000244470174]
差分特徴の精細化のための新しい変化認識変換器(CAT)を提案する。様々な変化の一般化表現は、差分特徴空間において容易に学習される。精細化後、差分特徴空間における変化画素同士が近接し、変化検出を容易にする。
論文参考訳（メタデータ） (2023-09-24T12:21:57Z)
Image Deblurring by Exploring In-depth Properties of Transformer [86.7039249037193]
我々は、事前訓練された視覚変換器(ViT)から抽出した深い特徴を活用し、定量的な測定値によって測定された性能を犠牲にすることなく、回復した画像のシャープ化を促進する。得られた画像と対象画像の変換器特徴を比較することにより、事前学習された変換器は、高解像度のぼやけた意味情報を提供する。特徴をベクトルとみなし、抽出された画像から抽出された表現とユークリッド空間における対象表現との差を計算する。
論文参考訳（メタデータ） (2023-03-24T14:14:25Z)
Multi-manifold Attention for Vision Transformers [12.862540139118073]
ビジョントランスフォーマーは、いくつかのコンピュータビジョンタスクにおける最先端の性能のために、今日では非常に人気がある。本研究では, 変圧器のバニラ自己注意の代替として, マルチマニフォールドマルチヘッドアテンションと呼ばれる新しいアテンション機構を提案する。
論文参考訳（メタデータ） (2022-07-18T12:53:53Z)
Rich CNN-Transformer Feature Aggregation Networks for Super-Resolution [50.10987776141901]
近年の視覚変換器と自己注意は,様々なコンピュータビジョンタスクにおいて有望な成果を上げている。我々は,CNNの局所的特徴とトランスフォーマーが捉えた長距離依存性を活用する,超解像(SR)タスクのための効果的なハイブリッドアーキテクチャを提案する。提案手法は,多数のベンチマークデータセットから最先端のSR結果を得る。
論文参考訳（メタデータ） (2022-03-15T06:52:25Z)
AdaViT: Adaptive Vision Transformers for Efficient Image Recognition [78.07924262215181]
AdaViTは、パッチ、セルフアテンションヘッド、およびトランスフォーマーブロックを使用するための利用ポリシーを導出する適応フレームワークである。本手法は,0.8%の精度で,最先端のビジョントランスに比べて2倍以上の効率向上を実現している。
論文参考訳（メタデータ） (2021-11-30T18:57:02Z)
DASNet: Dual attentive fully convolutional siamese networks for change detection of high resolution satellite images [17.839181739760676]
研究の目的は、関心の変化情報を識別し、無関係な変更情報を干渉要因としてフィルタリングすることである。近年、ディープラーニングの台頭により、変化検出のための新しいツールが提供され、目覚ましい結果が得られた。我々は,高解像度画像における変化検出のための新しい手法,すなわち,二重注意型完全畳み込みシームズネットワーク(DASNet)を提案する。
論文参考訳（メタデータ） (2020-03-07T16:57:10Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。