論文の概要: A Semantic Segmentation Network for Urban-Scale Building Footprint
Extraction Using RGB Satellite Imagery
- arxiv url: http://arxiv.org/abs/2104.01263v1
- Date: Fri, 2 Apr 2021 22:32:04 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-08 04:20:30.485374
- Title: A Semantic Segmentation Network for Urban-Scale Building Footprint
Extraction Using RGB Satellite Imagery
- Title(参考訳): RGB衛星画像を用いた都市規模の足跡抽出のためのセマンティックセグメンテーションネットワーク
- Authors: Aatif Jiwani, Shubhrakanti Ganguly, Chao Ding, Nan Zhou, and David M.
Chan
- Abstract要約: 都市部は世界のエネルギーの3分の2以上を消費し、世界のCO2排出量の70%以上を占めています。
3チャンネルのRGB衛星画像から建物の足跡のマスクを生成するために、拡張ResNetバックボーンを備えた変更されたDeeplabV3+モジュールを提案します。
3つの標準ベンチマークで最先端のパフォーマンスを達成し,衛星画像の規模,解像度,都市密度に依存しないことを実証した。
- 参考スコア(独自算出の注目度): 1.9400948599830012
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Urban areas consume over two-thirds of the world's energy and account for
more than 70 percent of global CO2 emissions. As stated in IPCC's Global
Warming of 1.5C report, achieving carbon neutrality by 2050 requires a scalable
approach that can be applied in a global context. Conventional methods of
collecting data on energy use and emissions of buildings are extremely
expensive and require specialized geometry information that not all cities have
readily available. High-quality building footprint generation from satellite
images can accelerate this predictive process and empower municipal
decision-making at scale. However, previous deep learning-based approaches use
supplemental data such as point cloud data, building height information, and
multi-band imagery - which has limited availability and is difficult to
produce. In this paper, we propose a modified DeeplabV3+ module with a Dilated
ResNet backbone to generate masks of building footprints from only
three-channel RGB satellite imagery. Furthermore, we introduce an F-Beta
measure in our objective function to help the model account for skewed class
distributions. In addition to an F-Beta objective function, we incorporate an
exponentially weighted boundary loss and use a cross-dataset training strategy
to further increase the quality of predictions. As a result, we achieve
state-of-the-art performance across three standard benchmarks and demonstrate
that our RGB-only method is agnostic to the scale, resolution, and urban
density of satellite imagery.
- Abstract(参考訳): 都市部は世界のエネルギーの3分の2以上を消費し、世界の二酸化炭素排出量の70%以上を占めている。
IPCCのGlobal Warming of 1.5Cレポートで述べられているように、2050年までに炭素中立性を達成するには、グローバルコンテキストに適用可能なスケーラブルなアプローチが必要である。
従来のエネルギー利用と建物の排出に関するデータ収集手法は非常に高価であり、全ての都市が容易に利用できるわけではない特別な幾何学情報を必要とする。
衛星画像からの高品質な建物のフットプリント生成は、この予測プロセスを加速し、大規模な自治体の意思決定を促進することができる。
しかし、従来のディープラーニングベースのアプローチでは、ポイントクラウドデータ、ビルディングハイト情報、マルチバンドイメージなどの補足データを使用し、可用性が限られており、生成が困難だった。
本稿では,Dilated ResNetのバックボーンを付加したDeeplabV3+モジュールを提案する。
さらに,対象関数にfベータ尺度を導入し,歪んだクラス分布のモデル説明を支援する。
f-ベータの目的関数に加えて,指数関数重み付けされた境界損失を取り入れ,クロスデータセットのトレーニング戦略を用いて予測の質をさらに高める。
その結果,3つの標準ベンチマークにおいて最先端の性能を達成し,衛星画像の規模,解像度,都市密度に依存しないrgbのみの手法を実証した。
関連論文リスト
- AGBD: A Global-scale Biomass Dataset [18.976975819550173]
衛星画像から地上バイオマスを推定するための既存のデータセットは限られている。
このデータセットは、GEDIミッションからのAGB参照データとSentinel-2とPALSAR-2の画像のデータを組み合わせる。
これには、密集した天蓋の高さマップ、標高マップ、土地被覆分類マップなど、事前処理された高水準の特徴が含まれている。
単一の行のコードで簡単にアクセスでき、グローバルなAGB推定への取り組みの確固たる基盤を提供する。
論文 参考訳(メタデータ) (2024-06-07T13:34:17Z) - Leveraging Neural Radiance Fields for Uncertainty-Aware Visual
Localization [56.95046107046027]
我々は,Neural Radiance Fields (NeRF) を用いてシーン座標回帰のためのトレーニングサンプルを生成することを提案する。
レンダリングにおけるNeRFの効率にもかかわらず、レンダリングされたデータの多くはアーティファクトによって汚染されるか、最小限の情報ゲインしか含まない。
論文 参考訳(メタデータ) (2023-10-10T20:11:13Z) - Cross-City Matters: A Multimodal Remote Sensing Benchmark Dataset for
Cross-City Semantic Segmentation using High-Resolution Domain Adaptation
Networks [82.82866901799565]
我々は,都市間セマンティックセマンティックセグメンテーションタスクの研究を目的とした,新しいマルチモーダルリモートセンシングベンチマークデータセット(ハイパースペクトル,マルチスペクトル,SARを含む)を構築した。
単一都市に留まらず,多都市環境からAIモデルの一般化能力を促進するため,高解像度なドメイン適応ネットワークであるHighDANを提案する。
高DANは, 並列高分解能融合方式で, 都市景観の空間的トポロジカルな構造を良好に維持することができる。
論文 参考訳(メタデータ) (2023-09-26T23:55:39Z) - Very high resolution canopy height maps from RGB imagery using
self-supervised vision transformer and convolutional decoder trained on
Aerial Lidar [14.07306593230776]
本稿では,複数の非国家の管轄区域で同時に作成される最初の高分解能天蓋の高さマップについて述べる。
地図は、2017年から2020年にかけて、マクサー画像に基づいて訓練された自己教師モデルから特徴を抽出することによって生成される。
また、GEDI観測に基づいて訓練された畳み込みネットワークを用いた後処理のステップも導入する。
論文 参考訳(メタデータ) (2023-04-14T15:52:57Z) - FedUKD: Federated UNet Model with Knowledge Distillation for Land Use
Classification from Satellite and Street Views [1.7847474813778919]
衛星画像とストリートビュー画像のセマンティックにフェデレートUNetモデルを用いる。
精度は95%以上で,それぞれ17回以上,62回以上のストリートビューと衛星画像に有意なモデル圧縮を実現した。
提案フレームワークは,地球上の気候変動のリアルタイム追跡において,ゲームチェンジャーとなる可能性を持っている。
論文 参考訳(メタデータ) (2022-12-05T12:14:00Z) - SensatUrban: Learning Semantics from Urban-Scale Photogrammetric Point
Clouds [52.624157840253204]
センサットウルバン(SensatUrban)は、イギリスの3都市から収集された7.6km2の30億点近くからなる、都市規模のUAV測光点クラウドデータセットである。
データセットの各ポイントは、粒度の細かいセマンティックアノテーションでラベル付けされ、その結果、既存の最大のフォトグラムポイントクラウドデータセットの3倍の大きさのデータセットが生成される。
論文 参考訳(メタデータ) (2022-01-12T14:48:11Z) - Deep residential representations: Using unsupervised learning to unlock
elevation data for geo-demographic prediction [0.0]
LiDAR技術は、都市景観と農村景観の詳細な3次元標高マップを提供するために利用することができる。
現在まで、空中LiDAR画像は、主に環境と考古学の領域に限られている。
我々は、このデータの適合性は、独自のだけでなく、人口統計学的特徴と組み合わせたデータの源でもあると考え、埋め込みの現実的なユースケースを提供する。
論文 参考訳(メタデータ) (2021-12-02T17:10:52Z) - Low Light Image Enhancement via Global and Local Context Modeling [164.85287246243956]
低照度画像強調のためのコンテキスト認識ディープネットワークを導入。
まず、全空間領域上の補完的な手がかりを見つけるために空間相関をモデル化するグローバルコンテキストモジュールを特徴とする。
第二に、比較的大きな受容フィールドで局所的なコンテキストをキャプチャする密な残留ブロックを導入する。
論文 参考訳(メタデータ) (2021-01-04T09:40:54Z) - PC-RGNN: Point Cloud Completion and Graph Neural Network for 3D Object
Detection [57.49788100647103]
LiDARベースの3Dオブジェクト検出は、自動運転にとって重要なタスクです。
現在のアプローチでは、遠方および閉ざされた物体の偏りと部分的な点雲に苦しむ。
本稿では,この課題を2つの解決法で解決する新しい二段階アプローチ,pc-rgnnを提案する。
論文 参考訳(メタデータ) (2020-12-18T18:06:43Z) - Towards Semantic Segmentation of Urban-Scale 3D Point Clouds: A Dataset,
Benchmarks and Challenges [52.624157840253204]
我々は、30億点近い注釈付きポイントを持つ都市規模の測光点クラウドデータセットを提示する。
私たちのデータセットは、イギリスの3つの都市からなり、都市の景観の約7.6km2をカバーしています。
我々は,データセット上での最先端アルゴリズムの性能を評価し,その結果を包括的に分析する。
論文 参考訳(メタデータ) (2020-09-07T14:47:07Z) - A Nearest Neighbor Network to Extract Digital Terrain Models from 3D
Point Clouds [1.6249267147413524]
本稿では,3Dポイントのクラウド上で動作し,エンド・ツー・エンドのアプローチを用いてシーンの基盤となるDTMを推定するアルゴリズムを提案する。
我々のモデルは近隣情報を学習し、これをポイントワイドでブロックワイドなグローバルな特徴とシームレスに統合する。
論文 参考訳(メタデータ) (2020-05-21T15:54:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。