論文の概要: Monocular Building Height Estimation from PhiSat-2 Imagery: Dataset and Method
- arxiv url: http://arxiv.org/abs/2603.29245v2
- Date: Thu, 02 Apr 2026 13:20:19 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-03 14:21:09.174772
- Title: Monocular Building Height Estimation from PhiSat-2 Imagery: Dataset and Method
- Title(参考訳): PhiSat-2画像からの単分子建物の高さ推定:データセットと方法
- Authors: Yanjiao Song, Bowen Cai, Timo Balz, Zhenfeng Shao, Neema Simon Sumari, James Magidi, Walter Musakwa,
- Abstract要約: 我々は、PhiSat-2-Heightデータセット(PHDataset)を構築し、TSONet(Two-Stream Ordinal Network)を提案する。
TSONetはフットプリントのセグメンテーションと高さ推定を共同でモデル化し、フットプリントを意識した機能インタラクションと正規高精細化のためのクロスストリーム交換モジュール(CSEM)とFeature-Enhanced Bin Refinement(FEBR)モジュールを導入している。
PHDatasetの実験では、TSONetは最高性能を達成し、MAEとRMSEを13.2%、9.7%削減し、IoUとF1スコアを14.0%、F1スコアを10.1%改善した。
- 参考スコア(独自算出の注目度): 3.5218718367219335
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Monocular building height estimation from optical imagery is important for urban morphology characterization but remains challenging due to ambiguous height cues, large inter-city variations in building morphology, and the long-tailed distribution of building heights. PhiSat-2 is a promising open-access data source for this task because of its global coverage, 4.75 m spatial resolution, and seven-band spectral observations, yet its potential has not been systematically evaluated. To address this gap, we construct a PhiSat-2-Height dataset (PHDataset) and propose a Two-Stream Ordinal Network (TSONet). PHDataset contains 9,475 co-registered image-label patch pairs from 26 cities worldwide. TSONet jointly models footprint segmentation and height estimation, and introduces a Cross-Stream Exchange Module (CSEM) and a Feature-Enhanced Bin Refinement (FEBR) module for footprint-aware feature interaction and ordinal height refinement. Experiments on PHDataset show that TSONet achieves the best overall performance, reducing MAE and RMSE by 13.2% and 9.7%, and improving IoU and F1-score by 14.0% and 10.1% over the strongest competing results. Ablation studies further verify the effectiveness of CSEM, FEBR, and the joint use of ordinal regression and footprint assistance. Additional analyses and patch-level comparison with publicly available building height products indicate that PhiSat-2 benefits monocular building height estimation through its balanced combination of building-relevant spatial detail and multispectral observations. Overall, this study confirms the potential of PhiSat-2 for monocular building height estimation and provides a dedicated dataset and an effective method for future research.
- Abstract(参考訳): 光画像からの単分子的建物の高さ推定は, 都市構造評価において重要であるが, 未開高の手がかり, 建物形態の大きな都市間変動, 建物高さの長期分布などにより, 依然として困難である。
PhiSat-2は、4.75mの空間分解能と7バンドの分光観測のため、このタスクのための有望なオープンアクセスデータソースであるが、そのポテンシャルは体系的に評価されていない。
このギャップに対処するため、PhiSat-2-Height データセット(PHDataset)を構築し、TSONet(Two-Stream Ordinal Network)を提案する。
PHDatasetには、世界中の26都市から9,475のイメージラベルパッチが登録されている。
TSONetはフットプリントのセグメンテーションと高さ推定を共同でモデル化し、フットプリントを意識した機能インタラクションと正規高精細化のためのクロスストリーム交換モジュール(CSEM)とFeature-Enhanced Bin Refinement(FEBR)モジュールを導入している。
PHDatasetの実験では、TSONetは最高性能を達成し、MAEとRMSEを13.2%、9.7%削減し、IoUとF1スコアを14.0%、F1スコアを10.1%改善した。
アブレーション研究は、CSEM、FEBR、および順序回帰とフットプリントアシストの併用の有効性をさらに検証する。
PhiSat-2は、建築関連空間的詳細と多スペクトル観測のバランスの取れた組み合わせにより、単分子構造の高さ推定に有効であることを示す。
本研究は, 単分子建屋の高さ推定におけるPhiSat-2の可能性を確認し, 専用のデータセットと今後の研究に有効な方法を提供する。
関連論文リスト
- TEMPO: Global Temporal Building Density and Height Estimation from Satellite Imagery [6.725489723441197]
深層学習モデルを用いた高解像度衛星画像から得られた建物密度と高さのグローバル・時間分解データセットTEMPOを提案する。
我々は,4分の1のPlanetScopeベースマップ衛星画像とビルのフットプリントと高さデータを組み合わせて,ビルの密度と高さを37.6m/ピクセルの解像度で予測するマルチタスク深度学習モデルを訓練する。
このモデルを2018年第1四半期から2025年第2四半期にかけてのグローバルなPlanetScopeベースマップに適用し、建物密度と高さのグローバルな時間マップを作成する。
論文 参考訳(メタデータ) (2025-11-15T08:48:34Z) - Pearl: A Foundation Model for Placing Every Atom in the Right Location [52.35027831422145]
タンパク質-リガンド共フォールディングの基礎モデルであるPearlを紹介した。
パールはタンパク質-リガンド結合における新しい最先端性能を確立している。
Pearlは、パブリックなRuns N' PosesとPoseBustersベンチマークでAlphaFold 3や他のオープンソースベースラインを上回っている。
論文 参考訳(メタデータ) (2025-10-28T17:36:51Z) - SpectralEarth: Training Hyperspectral Foundation Models at Scale [47.93167977587301]
ハイパースペクトル基礎モデルの事前学習を目的とした大規模マルチテンポラルデータセットであるSpectralEarthを紹介する。
我々はSpectralEarthの一連の基礎モデルを事前訓練し、古典的な視覚バックボーンにスペクトルアダプタを統合する。
タンデムでは、土地被覆、作物型マッピング、樹木種分類のための9つの下流データセットを構築した。
論文 参考訳(メタデータ) (2024-08-15T22:55:59Z) - Estimate the building height at a 10-meter resolution based on Sentinel data [5.080045077714947]
本研究では,空間-スペクトル-時間的特徴データベースのセットを構築した。
これは、Sentinel-1によって提供されるSARデータ、Sentinel-2によって提供される光学データ、および建築フットプリントによって提供される形状データを組み合わせている。
時間尺度上の統計指標を抽出し、160個の特徴からなる豊富なデータベースを形成する。
論文 参考訳(メタデータ) (2024-05-02T03:53:59Z) - HGDNet: A Height-Hierarchy Guided Dual-Decoder Network for Single View
Building Extraction and Height Estimation [13.09940764764909]
建物の高さを推定するために,高階層型デュアルデコーダネットワーク(HGDNet)を提案する。
合成された高さ階層nDSMの指導の下で、補助的な高さ階層的建築物抽出枝は高さ推定枝を強化する。
より正確な建物抽出を実現するために、追加の2段階のカスケードアーキテクチャが採用されている。
論文 参考訳(メタデータ) (2023-08-10T07:03:32Z) - Fine-grained building roof instance segmentation based on domain adapted
pretraining and composite dual-backbone [13.09940764764909]
本稿では,高解像度光衛星画像を用いた個々の建物の意味解釈を実現するための枠組みを提案する。
具体的には、レバレッジされたドメイン適応事前学習戦略と複合二重バックボーンは、非ネイティブな特徴学習を大いに促進する。
その結果,本手法は2023年のIEEE GRSS Data Fusion Contestの第一位に位置づけられた。
論文 参考訳(メタデータ) (2023-08-10T05:54:57Z) - Semi-supervised Learning from Street-View Images and OpenStreetMap for
Automatic Building Height Estimation [59.6553058160943]
本稿では,Mapillary SVIとOpenStreetMapのデータから建物の高さを自動的に推定する半教師付き学習(SSL)手法を提案する。
提案手法は, 平均絶対誤差(MAE)が約2.1mである建物の高さを推定する上で, 明らかな性能向上につながる。
予備結果は,低コストなVGIデータに基づく提案手法のスケールアップに向けた今後の取り組みを期待し,動機づけるものである。
論文 参考訳(メタデータ) (2023-07-05T18:16:30Z) - A CNN regression model to estimate buildings height maps using
Sentinel-1 SAR and Sentinel-2 MSI time series [0.0]
本研究では,Sentinel-1 (S1) とSentinel-2 (S2) の時系列を用いて,ビルの高さを空間分解能10mで推定するための教師付きマルチモーダルビルディングハイトネットワーク (MBHR-Net) を提案する。
我々のMBHR-Netは,S1画像とS2画像から意味のある特徴を抽出し,画像パターンと建築高さの複雑な時間的関係を学習することを目的としている。
モデルはオランダのRoot Mean Squared Error(RMSE)、Intersection over Union(IoU)、R-squared(R2)の10都市でトレーニングされ、テストされる。
論文 参考訳(メタデータ) (2023-07-03T22:16:17Z) - Augmented Parallel-Pyramid Net for Attention Guided Pose-Estimation [90.28365183660438]
本稿では、注意部分モジュールと微分可能な自動データ拡張を備えた拡張並列ピラミドネットを提案する。
我々は、データ拡張のシーケンスをトレーニング可能なCNNコンポーネントとして定式化する新しいポーズ検索空間を定義する。
特に,本手法は,挑戦的なCOCOキーポイントベンチマークとMPIIデータセットの最先端結果において,トップ1の精度を実現する。
論文 参考訳(メタデータ) (2020-03-17T03:52:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。