論文の概要: Detecting Building Changes with Off-Nadir Aerial Images
- arxiv url: http://arxiv.org/abs/2301.10922v1
- Date: Thu, 26 Jan 2023 04:04:14 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-27 14:29:32.927195
- Title: Detecting Building Changes with Off-Nadir Aerial Images
- Title(参考訳): オフnadir空中画像による建物変化の検出
- Authors: Chao Pang, Jiang Wu, Jian Ding, Can Song, Gui-Song Xia
- Abstract要約: 船外画像の傾いた視認は、建物変更検出問題に深刻な課題をもたらす。
本稿ではMTGCD-Netと呼ばれるマルチタスクガイドによる変更検出ネットワークモデルを提案する。
我々のモデルは、これまでの最先端の競合他社よりも優れたパフォーマンスを実現している。
- 参考スコア(独自算出の注目度): 37.58581646229069
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The tilted viewing nature of the off-nadir aerial images brings severe
challenges to the building change detection (BCD) problem: the mismatch of the
nearby buildings and the semantic ambiguity of the building facades. To tackle
these challenges, we present a multi-task guided change detection network
model, named as MTGCD-Net. The proposed model approaches the specific BCD
problem by designing three auxiliary tasks, including: (1) a pixel-wise
classification task to predict the roofs and facades of buildings; (2) an
auxiliary task for learning the roof-to-footprint offsets of each building to
account for the misalignment between building roof instances; and (3) an
auxiliary task for learning the identical roof matching flow between
bi-temporal aerial images to tackle the building roof mismatch problem. These
auxiliary tasks provide indispensable and complementary building parsing and
matching information. The predictions of the auxiliary tasks are finally fused
to the main building change detection branch with a multi-modal distillation
module. To train and test models for the BCD problem with off-nadir aerial
images, we create a new benchmark dataset, named BANDON. Extensive experiments
demonstrate that our model achieves superior performance over the previous
state-of-the-art competitors.
- Abstract(参考訳): オフナディア航空画像の傾いた視界特性は、近くの建物のミスマッチや建物ファサードの意味的曖昧さといった、ビル変更検出(BCD)問題に深刻な課題をもたらす。
これらの課題に対処するため,MTGCD-Netと呼ばれるマルチタスクガイドによる変更検出ネットワークモデルを提案する。
提案手法は,(1)建物の屋根とファサードの予測を行う画素ワイド分類タスク,(2)建物の屋根とフットプリントの相違を考慮に入れた各建物の屋根とフットプリントの相違点を学習する補助タスク,(3)建築屋根のミスマッチ問題に対処する時空間画像間の同一の屋根の一致フローを学習する補助タスク,の3つのタスクを設計することによって,特定のBCD問題にアプローチする。
これらの補助タスクは、必須で補完的な建物解析とマッチング情報を提供する。
補助タスクの予測は、最終的にマルチモーダル蒸留モジュールを備えた主建物変更検出ブランチに融合される。
そこで我々は,BANDONという新しいベンチマークデータセットを作成し,BCD問題のトレーニングとテストを行う。
広範な実験により,これまでの最先端の競争相手よりも優れた性能が得られた。
関連論文リスト
- RSBuilding: Towards General Remote Sensing Image Building Extraction and Change Detection with Foundation Model [22.56227565913003]
本稿では、基礎モデルの観点から、RSBuildingと呼ばれる総合的なリモートセンシング画像構築モデルを提案する。
RSBuildingはクロスシーンの一般化とタスク理解を強化するように設計されている。
我々のモデルは最大245,000の画像からなるデータセットでトレーニングされ、複数のビルの抽出と変更検出データセットで検証された。
論文 参考訳(メタデータ) (2024-03-12T11:51:59Z) - DiAD: A Diffusion-based Framework for Multi-class Anomaly Detection [55.48770333927732]
本稿では,拡散型異常検出(Difusion-based Anomaly Detection, DAD)フレームワークを提案する。
画素空間オートエンコーダ、安定拡散の復調ネットワークに接続する潜在空間セマンティックガイド(SG)ネットワーク、特徴空間事前学習機能抽出器から構成される。
MVTec-ADとVisAデータセットの実験は、我々のアプローチの有効性を実証している。
論文 参考訳(メタデータ) (2023-12-11T18:38:28Z) - Learning Efficient Unsupervised Satellite Image-based Building Damage
Detection [43.06758527206676]
建物被害検出(BDD)手法は, 常に, 建物とその条件に対する, 労働集約的なピクセルレベルのアノテーションを必要とする。
本稿では,未解決の衛星画像ペアのみを提供するU-BDDの挑戦的かつ実践的なシナリオについて検討する。
衛星画像に関連する領域固有の問題に対処することで、U-BDDベースラインを改善する、新しい自己教師型フレームワークU-BDD++を提案する。
論文 参考訳(メタデータ) (2023-12-04T02:20:35Z) - Fine-grained building roof instance segmentation based on domain adapted
pretraining and composite dual-backbone [13.09940764764909]
本稿では,高解像度光衛星画像を用いた個々の建物の意味解釈を実現するための枠組みを提案する。
具体的には、レバレッジされたドメイン適応事前学習戦略と複合二重バックボーンは、非ネイティブな特徴学習を大いに促進する。
その結果,本手法は2023年のIEEE GRSS Data Fusion Contestの第一位に位置づけられた。
論文 参考訳(メタデータ) (2023-08-10T05:54:57Z) - BCE-Net: Reliable Building Footprints Change Extraction based on
Historical Map and Up-to-Date Images using Contrastive Learning [13.543968710641746]
我々は,1枚の最新のリモートセンシング画像に対して,歴史的建造物のフットプリントを検証することで,対照的な学習手法を開発する。
変形可能な畳み込みニューラルネットワークを用いて、オフセットを直感的に学習する。
提案手法は94.63%のF1スコアを得た。
論文 参考訳(メタデータ) (2023-04-14T12:00:47Z) - Fast Inference and Transfer of Compositional Task Structures for
Few-shot Task Generalization [101.72755769194677]
本稿では,タスクがサブタスクグラフによって特徴づけられる,数発の強化学習問題として定式化する。
我々のマルチタスクサブタスクグラフ推論器(MTSGI)は、トレーニングタスクから、まず、サブタスクグラフの観点から、一般的なハイレベルなタスク構造を推測する。
提案手法は,2次元グリッドワールドおよび複雑なWebナビゲーション領域において,タスクの共通基盤構造を学習し,活用し,未知のタスクへの適応を高速化する。
論文 参考訳(メタデータ) (2022-05-25T10:44:25Z) - Robust Self-Supervised LiDAR Odometry via Representative Structure
Discovery and 3D Inherent Error Modeling [67.75095378830694]
そこで我々は,2段階のオドメトリ推定ネットワークを構築し,一連の部分領域変換を推定してエゴモーメントを求める。
本稿では,トレーニング,推論,マッピングフェーズにおける信頼できない構造の影響を軽減することを目的とする。
我々の2フレームのオードメトリーは、翻訳/回転誤差の点で、過去の芸術の状態を16%/12%上回っている。
論文 参考訳(メタデータ) (2022-02-27T12:52:27Z) - Unpaired Referring Expression Grounding via Bidirectional Cross-Modal
Matching [53.27673119360868]
表現基盤の参照はコンピュータビジョンにおいて重要かつ困難な課題である。
本稿では,これらの課題に対処する新しい双方向クロスモーダルマッチング(BiCM)フレームワークを提案する。
私たちのフレームワークは、2つの一般的なグラウンドデータセットで、以前の作業の6.55%と9.94%を上回っています。
論文 参考訳(メタデータ) (2022-01-18T01:13:19Z) - A Multi-Task Deep Learning Framework for Building Footprint Segmentation [0.0]
足跡線構築タスクのための共同最適化方式を提案する。
また,画像再構成と建物足跡境界分割という2つの補助タスクも導入する。
特に、深層マルチタスク学習(MTL)ベースの統合完全畳み込みフレームワークを提案します。
論文 参考訳(メタデータ) (2021-04-19T15:07:27Z) - RescueNet: Joint Building Segmentation and Damage Assessment from
Satellite Imagery [83.49145695899388]
RescueNetは、建物を同時に分割し、個々の建物に対する損傷レベルを評価し、エンドツーエンドでトレーニングできる統一モデルである。
RescueNetは大規模で多様なxBDデータセットでテストされており、従来の手法よりもはるかに優れたセグメンテーションと損傷分類性能を実現している。
論文 参考訳(メタデータ) (2020-04-15T19:52:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。