論文の概要: Building Floor Number Estimation from Crowdsourced Street-Level Images: Munich Dataset and Baseline Method
- arxiv url: http://arxiv.org/abs/2505.18021v1
- Date: Fri, 23 May 2025 15:27:46 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-26 18:08:34.19107
- Title: Building Floor Number Estimation from Crowdsourced Street-Level Images: Munich Dataset and Baseline Method
- Title(参考訳): クラウドソーシングストリートレベル画像からの床数推定:ミュンヘンデータセットとベースライン法
- Authors: Yao Sun, Sining Chen, Yifan Tian, Xiao Xiang Zhu,
- Abstract要約: 大規模なフロアカウントデータは、カダストラルと3D都市データベースではほとんど利用できない。
本研究では,道路画像から直接床数を推定するエンドツーエンドのディープラーニングフレームワークを提案する。
提案された分類回帰ネットワークは精度81.2%に達し、+/-1階内の建物の97.9%を予測している。
- 参考スコア(独自算出の注目度): 17.492721759864505
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Accurate information on the number of building floors, or above-ground storeys, is essential for household estimation, utility provision, risk assessment, evacuation planning, and energy modeling. Yet large-scale floor-count data are rarely available in cadastral and 3D city databases. This study proposes an end-to-end deep learning framework that infers floor numbers directly from unrestricted, crowdsourced street-level imagery, avoiding hand-crafted features and generalizing across diverse facade styles. To enable benchmarking, we release the Munich Building Floor Dataset, a public set of over 6800 geo-tagged images collected from Mapillary and targeted field photography, each paired with a verified storey label. On this dataset, the proposed classification-regression network attains 81.2% exact accuracy and predicts 97.9% of buildings within +/-1 floor. The method and dataset together offer a scalable route to enrich 3D city models with vertical information and lay a foundation for future work in urban informatics, remote sensing, and geographic information science. Source code and data will be released under an open license at https://github.com/ya0-sun/Munich-SVI-Floor-Benchmark.
- Abstract(参考訳): ビルの床数、あるいは地上の店舗数に関する正確な情報は、家計推定、ユーティリティー提供、リスク評価、避難計画、エネルギーモデリングに不可欠である。
しかし、大規模なフロアカウントデータは、カダストラルと3D都市データベースではほとんど利用できない。
本研究では,制約のないクラウドソースのストリートレベルの画像から直接フロア番号を推定し,手作りの特徴を回避し,多様なファサードスタイルをまたいだ一般化を行うエンド・ツー・エンドのディープラーニングフレームワークを提案する。
ベンチマークを可能にするために,Mapillaryから収集した6800以上のジオタグ付き画像を公開して,それぞれが検証済みのストアリーラベルと組み合わせた,ミュンヘンビルディングフロアデータセットをリリースした。
このデータセットでは、提案された分類回帰ネットワークは81.2%の精度で、+/-1階内の建物の97.9%を予測している。
この手法とデータセットは、垂直情報で3D都市モデルを充実させるスケーラブルなルートを提供し、都市情報学、リモートセンシング、地理情報科学における将来の研究の基礎を築いた。
ソースコードとデータはhttps://github.com/ya0-sun/Munich-SVI-Floor-Benchmarkで公開ライセンスでリリースされる。
関連論文リスト
- Population estimation using 3D city modelling and Carto2S datasets -- A case study [0.0]
カルト2Sシリーズの打ち上げにより、高解像度画像(0.6-1.0m)が取得され、使用することができる。
精度の良い高解像度ディジタル標高モデル(DEM)は、C2Sマルチビューとマルチ日付データセットを使用して生成することができる。
DEMは、デジタル地形モデル(DTM)を導出し、地球表面上の物体(建物と木)の正確な高さを抽出するためにさらに使用される。
論文 参考訳(メタデータ) (2024-11-07T10:52:57Z) - Extracting the U.S. building types from OpenStreetMap data [0.16060719742433224]
この研究は、アメリカ合衆国全体をカバーする住宅・非住宅の分類を提供することで包括的なデータセットを作成する。
そこで我々は,ビルディングフットプリントと利用可能なOpenStreetMap情報に基づいて,ビルディングタイプを分類するための教師なし機械学習手法を提案し,活用する。
この検証は、非住宅の建物分類の高精度化と、住宅用建物の高いリコールを示す。
論文 参考訳(メタデータ) (2024-09-09T15:05:27Z) - Identifying every building's function in large-scale urban areas with multi-modality remote-sensing data [5.18540804614798]
本研究は,大規模都市部における建物機能同定のための半教師付き枠組みを提案する。
光画像、建築高さ、夜間光データを収集し、建物の形態特性を記述する。
結果は、政府による2万の検証ポイントと統計調査によって評価される。
論文 参考訳(メタデータ) (2024-05-08T15:32:20Z) - Semi-supervised Learning from Street-View Images and OpenStreetMap for
Automatic Building Height Estimation [59.6553058160943]
本稿では,Mapillary SVIとOpenStreetMapのデータから建物の高さを自動的に推定する半教師付き学習(SSL)手法を提案する。
提案手法は, 平均絶対誤差(MAE)が約2.1mである建物の高さを推定する上で, 明らかな性能向上につながる。
予備結果は,低コストなVGIデータに基づく提案手法のスケールアップに向けた今後の取り組みを期待し,動機づけるものである。
論文 参考訳(メタデータ) (2023-07-05T18:16:30Z) - Building Floorspace in China: A Dataset and Learning Pipeline [0.32228025627337864]
本稿は、中国40大都市における建物の床面積を計測する最初のマイルストーンを提供する。
我々は、メインデータソースとしてSentinel-1と-2の衛星画像を使用する。
データ、アルゴリズム、評価の詳細な説明を提供する。
論文 参考訳(メタデータ) (2023-03-03T21:45:36Z) - A Large Scale Homography Benchmark [52.55694707744518]
1DSfMデータセットから10万枚の画像から約1000個の平面が観測された3D, Pi3Dの平面の大規模データセットを示す。
また,Pi3Dを利用した大規模ホモグラフィ推定ベンチマークであるHEBを提案する。
論文 参考訳(メタデータ) (2023-02-20T14:18:09Z) - SensatUrban: Learning Semantics from Urban-Scale Photogrammetric Point
Clouds [52.624157840253204]
センサットウルバン(SensatUrban)は、イギリスの3都市から収集された7.6km2の30億点近くからなる、都市規模のUAV測光点クラウドデータセットである。
データセットの各ポイントは、粒度の細かいセマンティックアノテーションでラベル付けされ、その結果、既存の最大のフォトグラムポイントクラウドデータセットの3倍の大きさのデータセットが生成される。
論文 参考訳(メタデータ) (2022-01-12T14:48:11Z) - FloorLevel-Net: Recognizing Floor-Level Lines with
Height-Attention-Guided Multi-task Learning [49.30194762653723]
本研究は, 教師付き深層学習手法を用いて, ストリートビュー画像中のフロアレベル線の位置を求める問題に対処する。
まず、新しいデータセットをコンパイルし、トレーニングサンプルを合成する新しいデータ拡張スキームを開発する。
次にFloorLevel-Netを設計する。FloorLevel-Netは、ファサードと暗黙のフロアレベルラインの明示的な特徴を関連付けるマルチタスク学習ネットワークである。
論文 参考訳(メタデータ) (2021-07-06T08:17:59Z) - Towards Semantic Segmentation of Urban-Scale 3D Point Clouds: A Dataset,
Benchmarks and Challenges [52.624157840253204]
我々は、30億点近い注釈付きポイントを持つ都市規模の測光点クラウドデータセットを提示する。
私たちのデータセットは、イギリスの3つの都市からなり、都市の景観の約7.6km2をカバーしています。
我々は,データセット上での最先端アルゴリズムの性能を評価し,その結果を包括的に分析する。
論文 参考訳(メタデータ) (2020-09-07T14:47:07Z) - Hidden Footprints: Learning Contextual Walkability from 3D Human Trails [70.01257397390361]
現在のデータセットは、人々がどこにいるか、どこにいるかを教えてくれません。
まず、画像間で人の観察を伝播させ、3D情報を利用して、私たちが「隠れ足跡」と呼ぶものを作成することで、有効なラベル付き歩行可能領域の集合を拡大する。
このようなスパースラベルのために設計されたトレーニング戦略を考案し、クラスバランスの分類損失と文脈逆転損失を組み合わせた。
論文 参考訳(メタデータ) (2020-08-19T23:19:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。