論文の概要: Dual-Tasks Siamese Transformer Framework for Building Damage Assessment
- arxiv url: http://arxiv.org/abs/2201.10953v1
- Date: Wed, 26 Jan 2022 14:11:16 GMT
- ステータス: 処理完了
- システム内更新日: 2022-01-27 13:25:49.831159
- Title: Dual-Tasks Siamese Transformer Framework for Building Damage Assessment
- Title(参考訳): 建物被害評価のためのデュアルタスクシームス変圧器フレームワーク
- Authors: Hongruixuan Chen, Edoardo Nemni, Sofia Vallecorsa, Xi Li, Chen Wu,
Lars Bromley
- Abstract要約: トランスフォーマーによる損傷評価アーキテクチャ(DamFormer)の設計の試みについて述べる。
我々の知る限り、このような深層トランスフォーマーベースのネットワークがマルチテンポラルリモートセンシングの解釈タスクのために提案されたのは、これが初めてである。
- 参考スコア(独自算出の注目度): 11.888964682446879
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Accurate and fine-grained information about the extent of damage to buildings
is essential for humanitarian relief and disaster response. However, as the
most commonly used architecture in remote sensing interpretation tasks,
Convolutional Neural Networks (CNNs) have limited ability to model the
non-local relationship between pixels. Recently, Transformer architecture first
proposed for modeling long-range dependency in natural language processing has
shown promising results in computer vision tasks. Considering the frontier
advances of Transformer architecture in the computer vision field, in this
paper, we present the first attempt at designing a Transformer-based damage
assessment architecture (DamFormer). In DamFormer, a siamese Transformer
encoder is first constructed to extract non-local and representative deep
features from input multitemporal image-pairs. Then, a multitemporal fusion
module is designed to fuse information for downstream tasks. Finally, a
lightweight dual-tasks decoder aggregates multi-level features for final
prediction. To the best of our knowledge, it is the first time that such a deep
Transformer-based network is proposed for multitemporal remote sensing
interpretation tasks. The experimental results on the large-scale damage
assessment dataset xBD demonstrate the potential of the Transformer-based
architecture.
- Abstract(参考訳): 人道的救済と災害対応には,建物被害の程度に関する正確な,きめ細かい情報が必要である。
しかしながら、遠隔センシングの解釈タスクでよく使われるアーキテクチャであるため、畳み込みニューラルネットワーク(cnns)はピクセル間の非局所関係をモデル化する能力が限られている。
近年,自然言語処理における長距離依存性をモデル化するためのTransformerアーキテクチャが提案されている。
本稿では,コンピュータビジョン分野におけるトランスフォーマーアーキテクチャのフロンティア進歩を考えると,トランスフォーマーによる損傷評価アーキテクチャ(DamFormer)を設計するための最初の試みを示す。
DamFormerでは、シアム変換器エンコーダが最初に構築され、入力されたマルチテンポラル画像ペアから非局所的および代表的深い特徴を抽出する。
次に、ダウンストリームタスクのための情報を融合するマルチタイムフュージョンモジュールを設計する。
最後に、軽量なデュアルタスクデコーダが最終予測のために複数のレベル機能を集約する。
我々の知る限り、このような深層トランスフォーマーベースのネットワークがマルチテンポラルリモートセンシングの解釈タスクのために提案されたのは初めてである。
大規模損傷評価データセット xbd の実験結果は,トランスフォーマーアーキテクチャの可能性を示している。
関連論文リスト
- SiamixFormer: a fully-transformer Siamese network with temporal Fusion
for accurate building detection and change detection in bi-temporal remote
sensing images [0.0]
リモートセンシング画像による建物検出と変更検出は、都市と救助計画に役立つ。
現在、建物検出のための既存のモデルのほとんどは、建物を検知するために1つの画像(事前発見画像)しか使用していない。
本稿では,前・後画像を入力として使用するシアミキフォーマー(SiamixFormer)を提案する。
論文 参考訳(メタデータ) (2022-08-01T07:35:45Z) - Defect Transformer: An Efficient Hybrid Transformer Architecture for
Surface Defect Detection [2.0999222360659604]
表面欠陥検出のための効率的なハイブリッドトランスアーキテクチャであるDefect Transformer (DefT)を提案する。
DefTはCNNとTransformerを統一モデルに組み込んで、局所的および非局所的関係を協調的にキャプチャする。
3つのデータセットの実験は、他のCNNやトランスフォーマーベースのネットワークと比較して、我々の手法の優位性と効率性を実証している。
論文 参考訳(メタデータ) (2022-07-17T23:37:48Z) - Swin-Pose: Swin Transformer Based Human Pose Estimation [16.247836509380026]
畳み込みニューラルネットワーク(CNN)は多くのコンピュータビジョンタスクで広く利用されている。
CNNは、固定された受信フィールドを持ち、人間のポーズ推定に不可欠である長距離知覚能力に欠ける。
本稿では,特徴ピラミッド融合構造により拡張されたトランスフォーマーアーキテクチャに基づく新しいモデルを提案する。
論文 参考訳(メタデータ) (2022-01-19T02:15:26Z) - CSformer: Bridging Convolution and Transformer for Compressive Sensing [65.22377493627687]
本稿では,CNNからの詳細な空間情報を活用するためのハイブリッドフレームワークと,表現学習の強化を目的としたトランスフォーマーが提供するグローバルコンテキストを統合することを提案する。
提案手法は、適応的なサンプリングとリカバリからなるエンドツーエンドの圧縮画像センシング手法である。
実験により, 圧縮センシングにおける専用トランスアーキテクチャの有効性が示された。
論文 参考訳(メタデータ) (2021-12-31T04:37:11Z) - PE-former: Pose Estimation Transformer [0.0]
2次元ボディポーズ推定問題に対する純変圧器アーキテクチャの適用について検討する。
エンコーダ・デコーダ変換器アーキテクチャを用いることで, この推定問題に対して, 技術結果の状態が得られることを示す。
論文 参考訳(メタデータ) (2021-12-09T15:20:23Z) - ViDT: An Efficient and Effective Fully Transformer-based Object Detector [97.71746903042968]
検出変換器は、オブジェクト検出のための最初のエンドツーエンド学習システムである。
視覚変換器は、画像分類のための最初の完全変換器ベースのアーキテクチャである。
本稿では、視覚・検出変換器(ViDT)を統合し、効果的で効率的な物体検出装置を構築する。
論文 参考訳(メタデータ) (2021-10-08T06:32:05Z) - Multi-Exit Vision Transformer for Dynamic Inference [88.17413955380262]
視覚変換器のバックボーンの動的推論に使用できる早期出口分岐のための7つの異なるアーキテクチャを提案する。
提案したアーキテクチャのそれぞれが,精度と速度のトレードオフにおいて有用であることを示す。
論文 参考訳(メタデータ) (2021-06-29T09:01:13Z) - P2T: Pyramid Pooling Transformer for Scene Understanding [62.41912463252468]
私たちはP2Tと呼ばれる下流タスク指向のトランスネットワークを構築します。
プールベースのMHSAを組み込んで、P2Tと呼ばれる下流タスク指向のトランスネットワークを構築しました。
論文 参考訳(メタデータ) (2021-06-22T18:28:52Z) - Transformers Solve the Limited Receptive Field for Monocular Depth
Prediction [82.90445525977904]
畳み込みニューラルネットワークとトランスの両方の恩恵を受けるアーキテクチャであるTransDepthを提案します。
連続ラベルを含む画素単位での予測問題にトランスフォーマーを適用する最初の論文である。
論文 参考訳(メタデータ) (2021-03-22T18:00:13Z) - Transformers in Vision: A Survey [101.07348618962111]
トランスフォーマーは、入力シーケンス要素間の長い依存関係をモデリングし、シーケンスの並列処理をサポートします。
変圧器は設計に最小限の誘導バイアスを必要とし、自然にセット関数として適しています。
本調査は,コンピュータビジョン分野におけるトランスフォーマーモデルの概要を概観することを目的としている。
論文 参考訳(メタデータ) (2021-01-04T18:57:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。