論文の概要: LIGHT: Joint Individual Building Extraction and Height Estimation from
Satellite Images through a Unified Multitask Learning Network
- arxiv url: http://arxiv.org/abs/2304.01090v1
- Date: Mon, 3 Apr 2023 15:48:24 GMT
- ステータス: 処理完了
- システム内更新日: 2023-04-04 14:45:51.817678
- Title: LIGHT: Joint Individual Building Extraction and Height Estimation from
Satellite Images through a Unified Multitask Learning Network
- Title(参考訳): 光:統合型マルチタスク学習ネットワークによる衛星画像からの個別建物抽出と高さ推定
- Authors: Yongqiang Mao, Xian Sun, Xingliang Huang, Kaiqiang Chen
- Abstract要約: 建物抽出と高さ推定はリモートセンシング画像解釈における2つの重要な基本課題である。
現存する研究の多くは、この2つの課題を独立した研究とみなしている。
本研究では,IndividuaL buIlding extract と HeiGHt Estimation を組み合わせたマルチタスク学習ネットワークを提案する。
- 参考スコア(独自算出の注目度): 8.09909901104654
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Building extraction and height estimation are two important basic tasks in
remote sensing image interpretation, which are widely used in urban planning,
real-world 3D construction, and other fields. Most of the existing research
regards the two tasks as independent studies. Therefore the height information
cannot be fully used to improve the accuracy of building extraction and vice
versa. In this work, we combine the individuaL buIlding extraction and heiGHt
estimation through a unified multiTask learning network (LIGHT) for the first
time, which simultaneously outputs a height map, bounding boxes, and a
segmentation mask map of buildings. Specifically, LIGHT consists of an instance
segmentation branch and a height estimation branch. In particular, so as to
effectively unify multi-scale feature branches and alleviate feature spans
between branches, we propose a Gated Cross Task Interaction (GCTI) module that
can efficiently perform feature interaction between branches. Experiments on
the DFC2023 dataset show that our LIGHT can achieve superior performance, and
our GCTI module with ResNet101 as the backbone can significantly improve the
performance of multitask learning by 2.8% AP50 and 6.5% delta1, respectively.
- Abstract(参考訳): ビルの抽出と高さ推定はリモートセンシング画像解釈における2つの重要な基本課題であり、都市計画、現実世界の3D構築、その他の分野で広く利用されている。
現存する研究のほとんどは、この2つの課題を独立した研究とみなしている。
したがって、高さ情報は、建物の抽出精度を向上させるために完全には利用できない。
本研究では,建物の高さマップ,境界ボックス,セグメンテーションマスクマップを同時に出力する統合マルチタスク学習ネットワーク(LIGHT)を用いて,IndividuaL buIlding extract と heiGHt Estimation を初めて組み合わせた。
具体的には、LIGHTはインスタンスセグメンテーションブランチと高さ推定ブランチで構成される。
特に,マルチスケール機能ブランチを効果的に統一し,ブランチ間の機能を緩和するために,ブランチ間の機能インタラクションを効率的に行うGCTI (Gated Cross Task Interaction) モジュールを提案する。
DFC2023データセットの実験では、LIGHTは優れた性能を達成でき、ResNet101をバックボーンとしたGCTIモジュールは、それぞれ2.8%のAP50と6.5%のデルタ1でマルチタスク学習の性能を大幅に向上させることができる。
関連論文リスト
- A Point-Based Approach to Efficient LiDAR Multi-Task Perception [49.91741677556553]
PAttFormerは、ポイントクラウドにおける共同セマンティックセグメンテーションとオブジェクト検出のための効率的なマルチタスクアーキテクチャである。
他のLiDARベースのマルチタスクアーキテクチャとは異なり、提案したPAttFormerはタスク固有のポイントクラウド表現のために別の機能エンコーダを必要としない。
マルチタスク学習では,mIouでは+1.7%,mAPでは3Dオブジェクト検出では+1.7%,LiDARセマンティックセマンティックセグメンテーションは+1.7%向上した。
論文 参考訳(メタデータ) (2024-04-19T11:24:34Z) - Auxiliary Tasks Enhanced Dual-affinity Learning for Weakly Supervised
Semantic Segmentation [79.05949524349005]
AuxSegNet+は、サリエンシマップから豊富な情報を探索する弱教師付き補助学習フレームワークである。
また,サリエンシとセグメンテーションの特徴マップから画素レベルの親和性を学習するためのクロスタスク親和性学習機構を提案する。
論文 参考訳(メタデータ) (2024-03-02T10:03:21Z) - Multi-task Learning with 3D-Aware Regularization [55.97507478913053]
本稿では,画像エンコーダから抽出した特徴を共有3D特徴空間に投影することで,複数のタスクをインタフェースする構造化3D認識正規化器を提案する。
提案手法はアーキテクチャ非依存であり,従来のマルチタスクバックボーンにプラグインすることで,性能を向上できることを示す。
論文 参考訳(メタデータ) (2023-10-02T08:49:56Z) - MuraNet: Multi-task Floor Plan Recognition with Relation Attention [9.295218599901249]
フロアプランデータにおけるセグメンテーションと検出タスクのためのアテンションベースマルチタスクモデルであるMuraNetを紹介する。
検出タスクとセグメンテーションタスクの両方でモデルを共同でトレーニングすることで、MuraNetは両方のタスクに関係のある機能を効果的に抽出し活用できると信じている。
論文 参考訳(メタデータ) (2023-09-01T09:10:04Z) - HGDNet: A Height-Hierarchy Guided Dual-Decoder Network for Single View
Building Extraction and Height Estimation [13.09940764764909]
建物の高さを推定するために,高階層型デュアルデコーダネットワーク(HGDNet)を提案する。
合成された高さ階層nDSMの指導の下で、補助的な高さ階層的建築物抽出枝は高さ推定枝を強化する。
より正確な建物抽出を実現するために、追加の2段階のカスケードアーキテクチャが採用されている。
論文 参考訳(メタデータ) (2023-08-10T07:03:32Z) - A Dynamic Feature Interaction Framework for Multi-task Visual Perception [100.98434079696268]
複数の共通認識課題を解決するための効率的な統合フレームワークを考案する。
これらのタスクには、インスタンスセグメンテーション、セマンティックセグメンテーション、モノクル3D検出、深さ推定が含まれる。
提案するフレームワークはD2BNetと呼ばれ,マルチタスク認識のためのパラメータ効率予測に一意なアプローチを示す。
論文 参考訳(メタデータ) (2023-06-08T09:24:46Z) - Learning to Relate Depth and Semantics for Unsupervised Domain
Adaptation [87.1188556802942]
教師なしドメイン適応(UDA)設定において,視覚的タスク関係を符号化してモデル性能を向上させる手法を提案する。
本稿では,意味的および深さ的予測のタスク依存性を符号化する新しいクロスタスク関係層(ctrl)を提案する。
さらに、セマンティック擬似ラベルを利用してターゲットドメインを監督する反復自己学習(ISL)トレーニングスキームを提案する。
論文 参考訳(メタデータ) (2021-05-17T13:42:09Z) - A Multi-Task Deep Learning Framework for Building Footprint Segmentation [0.0]
足跡線構築タスクのための共同最適化方式を提案する。
また,画像再構成と建物足跡境界分割という2つの補助タスクも導入する。
特に、深層マルチタスク学習(MTL)ベースの統合完全畳み込みフレームワークを提案します。
論文 参考訳(メタデータ) (2021-04-19T15:07:27Z) - Neural Architecture Search From Fr\'echet Task Distance [50.9995960884133]
与えられたベースラインタスクのセット内の対象タスクと各タスクの間の距離を、ターゲットタスクのニューラルネットワークアーキテクチャ検索スペースを減らすためにどのように使用できるかを示す。
タスク固有のアーキテクチャに対する検索空間の複雑さの低減は、このサイド情報を用いることなく完全な検索を行う代わりに、類似したタスクのために最適化されたアーキテクチャ上に構築することで達成される。
論文 参考訳(メタデータ) (2021-03-23T20:43:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。