論文の概要: Semi-supervised Learning from Street-View Images and OpenStreetMap for
Automatic Building Height Estimation
- arxiv url: http://arxiv.org/abs/2307.02574v1
- Date: Wed, 5 Jul 2023 18:16:30 GMT
- ステータス: 処理完了
- システム内更新日: 2023-07-07 16:23:54.115920
- Title: Semi-supervised Learning from Street-View Images and OpenStreetMap for
Automatic Building Height Estimation
- Title(参考訳): ストリートビュー画像とOpenStreetMapからの半教師付き学習による建物高さの自動推定
- Authors: Hao Li, Zhendong Yuan, Gabriel Dax, Gefei Kong, Hongchao Fan,
Alexander Zipf, Martin Werner
- Abstract要約: 本稿では,Mapillary SVIとOpenStreetMapのデータから建物の高さを自動的に推定する半教師付き学習(SSL)手法を提案する。
提案手法は, 平均絶対誤差(MAE)が約2.1mである建物の高さを推定する上で, 明らかな性能向上につながる。
予備結果は,低コストなVGIデータに基づく提案手法のスケールアップに向けた今後の取り組みを期待し,動機づけるものである。
- 参考スコア(独自算出の注目度): 59.6553058160943
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Accurate building height estimation is key to the automatic derivation of 3D
city models from emerging big geospatial data, including Volunteered
Geographical Information (VGI). However, an automatic solution for large-scale
building height estimation based on low-cost VGI data is currently missing. The
fast development of VGI data platforms, especially OpenStreetMap (OSM) and
crowdsourced street-view images (SVI), offers a stimulating opportunity to fill
this research gap. In this work, we propose a semi-supervised learning (SSL)
method of automatically estimating building height from Mapillary SVI and OSM
data to generate low-cost and open-source 3D city modeling in LoD1. The
proposed method consists of three parts: first, we propose an SSL schema with
the option of setting a different ratio of "pseudo label" during the supervised
regression; second, we extract multi-level morphometric features from OSM data
(i.e., buildings and streets) for the purposed of inferring building height;
last, we design a building floor estimation workflow with a pre-trained facade
object detection network to generate "pseudo label" from SVI and assign it to
the corresponding OSM building footprint. In a case study, we validate the
proposed SSL method in the city of Heidelberg, Germany and evaluate the model
performance against the reference data of building heights. Based on three
different regression models, namely Random Forest (RF), Support Vector Machine
(SVM), and Convolutional Neural Network (CNN), the SSL method leads to a clear
performance boosting in estimating building heights with a Mean Absolute Error
(MAE) around 2.1 meters, which is competitive to state-of-the-art approaches.
The preliminary result is promising and motivates our future work in scaling up
the proposed method based on low-cost VGI data, with possibilities in even
regions and areas with diverse data quality and availability.
- Abstract(参考訳): 大規模地理空間情報(vgi)を用いた3次元都市モデルの自動導出には,正確な建物の高さ推定が重要である。
しかし、低コストなVGIデータに基づく大規模建物の高さ推定のための自動解が現在欠落している。
VGIデータプラットフォーム、特にOpenStreetMap(OSM)とクラウドソースのストリートビューイメージ(SVI)の開発は、この研究ギャップを埋めるための刺激的な機会を提供する。
本研究では,Mapillary SVIとOSMデータから建物の高さを自動的に推定し,低コストでオープンソースの3D都市モデリングをLoD1で生成する半教師付き学習手法を提案する。
The proposed method consists of three parts: first, we propose an SSL schema with the option of setting a different ratio of "pseudo label" during the supervised regression; second, we extract multi-level morphometric features from OSM data (i.e., buildings and streets) for the purposed of inferring building height; last, we design a building floor estimation workflow with a pre-trained facade object detection network to generate "pseudo label" from SVI and assign it to the corresponding OSM building footprint.
本研究では,ドイツハイデルベルク市におけるSSL方式の有効性を検証し,建物の高さの基準データに対してモデル性能を評価する。
ランダムフォレスト(rf)、サポートベクターマシン(svm)、畳み込みニューラルネットワーク(cnn)という3つの異なる回帰モデルに基づいて、ssl法は、平均絶対誤差(mae)約2.1メートルのビルの高さを推定する上で、明確なパフォーマンス向上につながる。
予備的な結果は、低コストなvgiデータに基づいて提案手法をスケールアップする上での今後の取り組みに有望であり、また、さまざまなデータ品質と可用性を備えたリージョンや領域での可能性も期待でき、モチベーションを与えてくれます。
関連論文リスト
- UniMODE: Unified Monocular 3D Object Detection [76.77182583753051]
我々は,鳥眼視(BEV)検出パラダイムに基づく検出器を構築した。
本稿では,この課題に起因する収束不安定性に対応するために,不均一なBEVグリッド設計を提案する。
統一検出器UniMODEが導出され、挑戦的なOmni3Dデータセットの先行技術を上回る。
論文 参考訳(メタデータ) (2024-02-28T18:59:31Z) - RadOcc: Learning Cross-Modality Occupancy Knowledge through Rendering
Assisted Distillation [50.35403070279804]
マルチビュー画像を用いた3次元シーンの占有状況とセマンティクスを推定することを目的とした,新たな課題である3D占有予測手法を提案する。
本稿では,RandOccを提案する。Rendering Assisted distillation paradigm for 3D Occupancy prediction。
論文 参考訳(メタデータ) (2023-12-19T03:39:56Z) - MV-JAR: Masked Voxel Jigsaw and Reconstruction for LiDAR-Based
Self-Supervised Pre-Training [58.07391711548269]
Masked Voxel Jigsaw and Reconstruction (MV-JAR) method for LiDAR-based self-supervised pre-training
Masked Voxel Jigsaw and Reconstruction (MV-JAR) method for LiDAR-based self-supervised pre-training
論文 参考訳(メタデータ) (2023-03-23T17:59:02Z) - Elevation Estimation-Driven Building 3D Reconstruction from Single-View
Remote Sensing Imagery [20.001807614214922]
リモートセンシング画像からの3D再構築は、スマートシティやフォトグラムなどの分野に幅広い応用がある。
入力単視点リモートセンシング画像から3次元ビルディングモデルを再構築するための効率的なDSM推定駆動再構築フレームワーク(Building3D)を提案する。
我々のビル3Dは高度予測のためのSFFDEネットワークに根ざし、マスク構築のためのビル抽出ネットワークと同期し、点雲再構成、表面再構成(シティGMLモデル再構成)を順次実施する。
論文 参考訳(メタデータ) (2023-01-11T17:20:30Z) - Stereo Neural Vernier Caliper [57.187088191829886]
学習に基づくステレオ3Dオブジェクト検出のための新しいオブジェクト中心フレームワークを提案する。
初期3次元立方体推定値から改良された更新を予測する方法の問題に対処する。
提案手法は,KITTIベンチマークの最先端性能を実現する。
論文 参考訳(メタデータ) (2022-03-21T14:36:07Z) - H3D: Benchmark on Semantic Segmentation of High-Resolution 3D Point
Clouds and textured Meshes from UAV LiDAR and Multi-View-Stereo [4.263987603222371]
本稿では,3つの方法でユニークな3次元データセットを提案する。
ヘシグハイム(ドイツ語: Hessigheim, H3D)は、ドイツの都市。
片手で3次元データ分析の分野での研究を促進するとともに、新しいアプローチの評価とランク付けを目的としている。
論文 参考訳(メタデータ) (2021-02-10T09:33:48Z) - SA-Det3D: Self-Attention Based Context-Aware 3D Object Detection [9.924083358178239]
本稿では,3次元物体検出におけるコンテキストモデリングのための2種類の自己注意法を提案する。
まず,現状のbev,voxel,ポイントベース検出器にペアワイズ自着機構を組み込む。
次に,ランダムにサンプリングされた位置の変形を学習することにより,最も代表的な特徴のサブセットをサンプリングするセルフアテンション変種を提案する。
論文 参考訳(メタデータ) (2021-01-07T18:30:32Z) - Height estimation from single aerial images using a deep ordinal
regression network [12.991266182762597]
単体画像からの高度推定の曖昧で未解決な問題に対処する。
深層学習、特に深層畳み込みニューラルネットワーク(CNN)の成功により、いくつかの研究は、単一の空中画像から高さ情報を推定することを提案した。
本稿では,高さ値を間隔増加間隔に分割し,回帰問題を順序回帰問題に変換することを提案する。
論文 参考訳(メタデータ) (2020-06-04T12:03:51Z) - A Nearest Neighbor Network to Extract Digital Terrain Models from 3D
Point Clouds [1.6249267147413524]
本稿では,3Dポイントのクラウド上で動作し,エンド・ツー・エンドのアプローチを用いてシーンの基盤となるDTMを推定するアルゴリズムを提案する。
我々のモデルは近隣情報を学習し、これをポイントワイドでブロックワイドなグローバルな特徴とシームレスに統合する。
論文 参考訳(メタデータ) (2020-05-21T15:54:55Z) - Improving 3D Object Detection through Progressive Population Based
Augmentation [91.56261177665762]
本稿では3次元オブジェクト検出のためのデータ拡張ポリシーの設計を自動化するための最初の試みを示す。
このアルゴリズムは,探索空間を狭め,過去の反復で発見された最良のパラメータを採用することで,拡張戦略の最適化を学習する。
PPBAは, 拡張のないベースライン3次元検出モデルよりも最大10倍のデータ効率が高く, ラベル付きモデルよりもはるかに少ない精度で3次元検出モデルが競合精度を達成できる可能性が示唆された。
論文 参考訳(メタデータ) (2020-04-02T05:57:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。