論文の概要: Multi-task deep learning for large-scale building detail extraction from
high-resolution satellite imagery
- arxiv url: http://arxiv.org/abs/2310.18899v1
- Date: Sun, 29 Oct 2023 04:43:30 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-31 15:39:50.306725
- Title: Multi-task deep learning for large-scale building detail extraction from
high-resolution satellite imagery
- Title(参考訳): 高分解能衛星画像からの大規模建物ディテール抽出のためのマルチタスクディープラーニング
- Authors: Zhen Qian, Min Chen, Zhuo Sun, Fan Zhang, Qingsong Xu, Jinzhao Guo,
Zhiwei Xie, Zhixin Zhang
- Abstract要約: MT-BR(Multi-task Building Refiner)は、衛星画像から構築の詳細を同時抽出するための適応型ニューラルネットワークである。
大規模アプリケーションでは,限定的だが代表的画像サンプルを戦略的に選択する新しい空間サンプリング方式を考案する。
MT-BRは、様々なメトリクスをまたいだ詳細の構築において、他の最先端の手法よりも一貫して優れている。
- 参考スコア(独自算出の注目度): 13.544826927121992
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Understanding urban dynamics and promoting sustainable development requires
comprehensive insights about buildings. While geospatial artificial
intelligence has advanced the extraction of such details from Earth
observational data, existing methods often suffer from computational
inefficiencies and inconsistencies when compiling unified building-related
datasets for practical applications. To bridge this gap, we introduce the
Multi-task Building Refiner (MT-BR), an adaptable neural network tailored for
simultaneous extraction of spatial and attributional building details from
high-resolution satellite imagery, exemplified by building rooftops, urban
functional types, and roof architectural types. Notably, MT-BR can be
fine-tuned to incorporate additional building details, extending its
applicability. For large-scale applications, we devise a novel spatial sampling
scheme that strategically selects limited but representative image samples.
This process optimizes both the spatial distribution of samples and the urban
environmental characteristics they contain, thus enhancing extraction
effectiveness while curtailing data preparation expenditures. We further
enhance MT-BR's predictive performance and generalization capabilities through
the integration of advanced augmentation techniques. Our quantitative results
highlight the efficacy of the proposed methods. Specifically, networks trained
with datasets curated via our sampling method demonstrate improved predictive
accuracy relative to those using alternative sampling approaches, with no
alterations to network architecture. Moreover, MT-BR consistently outperforms
other state-of-the-art methods in extracting building details across various
metrics. The real-world practicality is also demonstrated in an application
across Shanghai, generating a unified dataset that encompasses both the spatial
and attributional details of buildings.
- Abstract(参考訳): 都市のダイナミクスを理解し、持続可能な開発を促進するには、建物に関する包括的な洞察が必要です。
地理空間人工知能は、地球観測データからそのような詳細の抽出を進歩させたが、既存の手法は、実用的な用途のために統一されたビル関連データセットをコンパイルする場合、計算上の非効率と不整合に苦しむことが多い。
このギャップを埋めるために,高解像度衛星画像から空間的および属性的な建物の詳細を同時抽出するための適応型ニューラルネットワークであるMulti-task Building Refiner (MT-BR)を導入する。
特に、MT-BRは、追加の建築詳細を組み込むことで、適用性を高めることができる。
大規模アプリケーションでは,限られた画像サンプルを戦略的に選択する空間サンプリング方式を考案する。
このプロセスはサンプルの空間分布とそれらを含む都市環境特性の両方を最適化し、データ作成費を削減しながら抽出効率を向上する。
MT-BRの予測性能と一般化能力は,高度拡張技術の統合によりさらに向上する。
提案手法の有効性を定量的に評価した。
特に,本手法を用いて学習したネットワークは,ネットワークアーキテクチャの変更を伴わずに,代替サンプリング手法と比較して予測精度が向上した。
さらに、mt-brは他の最先端メソッドよりも一貫して優れており、様々なメトリクスにまたがって構築の詳細を抽出する。
実世界の実用性は上海全域のアプリケーションでも実証されており、建物の空間的および帰属的詳細の両方を包含する統一データセットを生成する。
関連論文リスト
- GBSS:a global building semantic segmentation dataset for large-scale
remote sensing building extraction [10.39943244036649]
我々は6大陸から116.9kのサンプル(約742kの建物)からなるグローバル・ビルディング・セマンティック・データセット(データセットを公開予定)を構築した。
サイズとスタイルの点で、ビルドサンプルには大きなバリエーションがあるため、セマンティックセグメンテーションモデルの構築の一般化と堅牢性を評価する上で、データセットはより難しいベンチマークになり得る。
論文 参考訳(メタデータ) (2024-01-02T12:13:35Z) - Fine-grained building roof instance segmentation based on domain adapted
pretraining and composite dual-backbone [13.09940764764909]
本稿では,高解像度光衛星画像を用いた個々の建物の意味解釈を実現するための枠組みを提案する。
具体的には、レバレッジされたドメイン適応事前学習戦略と複合二重バックボーンは、非ネイティブな特徴学習を大いに促進する。
その結果,本手法は2023年のIEEE GRSS Data Fusion Contestの第一位に位置づけられた。
論文 参考訳(メタデータ) (2023-08-10T05:54:57Z) - T1: Scaling Diffusion Probabilistic Fields to High-Resolution on Unified
Visual Modalities [69.16656086708291]
拡散確率場(DPF)は、距離空間上で定義された連続関数の分布をモデル化する。
本稿では,局所構造学習に着目したビューワイズサンプリングアルゴリズムによる新しいモデルを提案する。
モデルは、複数のモダリティを統一しながら、高解像度のデータを生成するためにスケールすることができる。
論文 参考訳(メタデータ) (2023-05-24T03:32:03Z) - Semantic Segmentation of Vegetation in Remote Sensing Imagery Using Deep
Learning [77.34726150561087]
本稿では,公開されているリモートセンシングデータからなるマルチモーダル・大規模時間データセットを作成するためのアプローチを提案する。
我々は、異なる種類の植生を分離できる畳み込みニューラルネットワーク(CNN)モデルを使用する。
論文 参考訳(メタデータ) (2022-09-28T18:51:59Z) - A diverse large-scale building dataset and a novel plug-and-play domain
generalization method for building extraction [2.578242050187029]
リモートセンシング画像からのビルディング抽出の開発を容易にするために,新しいビルディングデータセットを導入し,新しい領域一般化手法を提案する。
WHU-Mixビルディングデータセットは、世界中から収集された43,727の多様な画像を含むトレーニング/検証セットと、5大陸5都市からの8402の画像を含むテストセットで構成されている。
建物抽出モデルの一般化能力をさらに向上するために,バッチ型混合(BSM)というドメイン一般化手法を提案する。
論文 参考訳(メタデータ) (2022-08-22T01:43:13Z) - TRoVE: Transforming Road Scene Datasets into Photorealistic Virtual
Environments [84.6017003787244]
本研究では、シミュレーションデータセットに存在する困難とドメインギャップに対処する合成データ生成パイプラインを提案する。
既存のデータセットからアノテーションや視覚的手がかりを利用すれば、自動マルチモーダルデータ生成が容易になることを示す。
論文 参考訳(メタデータ) (2022-08-16T20:46:08Z) - CAFE: Learning to Condense Dataset by Aligning Features [72.99394941348757]
本稿ではCAFE(Aligning features)によるCondenseデータセットの新しいスキームを提案する。
このアプローチの核心は、さまざまなスケールにわたる実データと合成データから機能を整合させる効果的な戦略です。
提案したCAFEを様々なデータセットで検証し,概ね最先端技術であることを示す。
論文 参考訳(メタデータ) (2022-03-03T05:58:49Z) - Deep residential representations: Using unsupervised learning to unlock
elevation data for geo-demographic prediction [0.0]
LiDAR技術は、都市景観と農村景観の詳細な3次元標高マップを提供するために利用することができる。
現在まで、空中LiDAR画像は、主に環境と考古学の領域に限られている。
我々は、このデータの適合性は、独自のだけでなく、人口統計学的特徴と組み合わせたデータの源でもあると考え、埋め込みの現実的なユースケースを提供する。
論文 参考訳(メタデータ) (2021-12-02T17:10:52Z) - Deep Human-guided Conditional Variational Generative Modeling for
Automated Urban Planning [30.614010268762115]
都市計画は土地利用形態を設計し、居住可能で持続可能で安全なコミュニティの構築に役立てることができる。
画像生成にインスパイアされた深層都市計画は、深層学習を活用して土地利用構成を生成することを目的としている。
本稿では, 上記の課題を共同で解決するための, 深層都市計画手法について検討する。
論文 参考訳(メタデータ) (2021-10-12T15:45:38Z) - Shared Space Transfer Learning for analyzing multi-site fMRI data [83.41324371491774]
マルチボクセルパターン解析(MVPA)は、タスクベース機能磁気共鳴画像(fMRI)データから予測モデルを学習する。
MVPAはよく設計された機能セットと十分なサンプルサイズで機能する。
ほとんどのfMRIデータセットはノイズが多く、高次元で、収集するのに高価で、サンプルサイズも小さい。
本稿では,新しい伝達学習手法として共有空間移動学習(SSTL)を提案する。
論文 参考訳(メタデータ) (2020-10-24T08:50:26Z) - Spatial-Spectral Residual Network for Hyperspectral Image
Super-Resolution [82.1739023587565]
ハイパースペクトル画像超解像のための新しいスペクトル空間残差ネットワーク(SSRNet)を提案する。
提案手法は,2次元畳み込みではなく3次元畳み込みを用いて空間スペクトル情報の探索を効果的に行うことができる。
各ユニットでは空間的・時間的分離可能な3次元畳み込みを用いて空間的・スペクトル的な情報を抽出する。
論文 参考訳(メタデータ) (2020-01-14T03:34:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。