論文の概要: GeoFormer: A Swin Transformer-Based Framework for Scene-Level Building Height and Footprint Estimation from Sentinel Imagery
- arxiv url: http://arxiv.org/abs/2602.09932v1
- Date: Tue, 10 Feb 2026 16:04:53 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-11 20:17:43.67063
- Title: GeoFormer: A Swin Transformer-Based Framework for Scene-Level Building Height and Footprint Estimation from Sentinel Imagery
- Title(参考訳): GeoFormer: シーンレベルビルディング高さとセンチネル画像からのフットプリント推定のためのスイニングトランスフォーマーベースのフレームワーク
- Authors: Han Jinzhen, JinByeong Lee, JiSung Kim, MinKyung Cho, DaHee Kim, HongSik Yun,
- Abstract要約: GeoFormerは、Sentinel-1/2画像とオープンDEMデータのみを使用して、100mグリッド上の高さとフットプリントを推定する。
54以上の多様な都市で評価され、GeoFormerは3.19mのBH RMSEと0.05のBF RMSEを達成し、最強のCNNベースラインよりも7.5%と15.3%改善している。
- 参考スコア(独自算出の注目度): 0.44127910213853666
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Accurate three-dimensional urban data are critical for climate modelling, disaster risk assessment, and urban planning, yet remain scarce due to reliance on proprietary sensors or poor cross-city generalisation. We propose GeoFormer, an open-source Swin Transformer framework that jointly estimates building height (BH) and footprint (BF) on a 100 m grid using only Sentinel-1/2 imagery and open DEM data. A geo-blocked splitting strategy ensures strict spatial independence between training and test sets. Evaluated over 54 diverse cities, GeoFormer achieves a BH RMSE of 3.19 m and a BF RMSE of 0.05, improving 7.5% and 15.3% over the strongest CNN baseline, while maintaining under 3.5 m BH RMSE in cross-continent transfer. Ablation studies confirm that DEM is indispensable for height estimation and that optical reflectance dominates over SAR, though multi-source fusion yields the best overall accuracy. All code, weights, and global products are publicly released.
- Abstract(参考訳): 正確な3次元都市データは、気候モデリング、災害リスク評価、都市計画において重要であるが、独自のセンサーや都市間一般化の貧弱さに頼っても不十分である。
我々は,Sentinel-1/2画像とオープンDEMデータのみを用いて,100mグリッド上のビルディング高さ(BH)とフットプリント(BF)を共同で推定する,オープンソースのSwin TransformerフレームワークであるGeoFormerを提案する。
ジオブロック分割戦略は、トレーニングとテストセットの間の厳密な空間的独立性を保証する。
54以上の多様な都市で評価され、GeoFormerは3.19mのBH RMSEと0.05のBF RMSEを達成し、最強のCNNベースラインよりも7.5%と15.3%改善した。
アブレーション研究により、DEMは高度推定には不可欠であり、光反射率がSARよりも優れていることが確認された。
コード、重み付け、グローバル製品はすべて公開されています。
関連論文リスト
- Geodiffussr: Generative Terrain Texturing with Elevation Fidelity [48.82552523546255]
テキスト誘導テクスチャマップを合成するフローマッチングパイプラインであるGeodiffussrを紹介する。
マルチスケールコンテンツアグリゲーション(MCA): DEM機能は、複数の解像度でUNetブロックに注入され、グローバルからローカライズされた高度の一貫性が強制される。
Geodiffussrを訓練し,評価するために,SRTM由来のDEMとSentinel-2画像と視覚接地型自然出現キャプションを組み合わせた三重項のグローバル分布,バイオメ-および気候成層コーパスを組み立てた。
論文 参考訳(メタデータ) (2025-11-28T09:52:44Z) - Where on Earth? A Vision-Language Benchmark for Probing Model Geolocation Skills Across Scales [61.03549470159347]
視覚言語モデル (VLM) は急速に進歩しているが, オープンワールド環境における画像位置決め能力は, 網羅的に評価されていない。
我々は、視覚認識、ステップバイステップ推論、エビデンス利用を評価するVLM画像位置情報の総合ベンチマークであるEarthWhereを提示する。
論文 参考訳(メタデータ) (2025-10-13T01:12:21Z) - Baltimore Atlas: FreqWeaver Adapter for Semi-supervised Ultra-high Spatial Resolution Land Cover Classification [9.706130801069143]
ランドカバー分類は、サブメーターリモート画像上でのランドカバータイプを特定する。
既存の手法のほとんどは1mの画像にフォーカスし、大規模なアノテーションに大きく依存している。
本稿では,大規模トレーニングデータへの依存度を低減するため,土地被覆分類フレームワークであるボルチモア・アトラスを紹介する。
論文 参考訳(メタデータ) (2025-06-18T15:41:29Z) - Geolocation with Real Human Gameplay Data: A Large-Scale Dataset and Human-Like Reasoning Framework [59.42946541163632]
3つの重要なコンポーネントを持つ包括的位置決めフレームワークを導入する。
大規模データセットGeoComp、新しい推論手法GeoCoT、評価指標GeoEval。
また,GeoCoTは解釈可能性を高めつつ,位置情報の精度を最大25%向上させることを示した。
論文 参考訳(メタデータ) (2025-02-19T14:21:25Z) - OpenEarthMap-SAR: A Benchmark Synthetic Aperture Radar Dataset for Global High-Resolution Land Cover Mapping [16.387666608029882]
我々は,地球規模の高解像度土地被覆マッピングのためのベンチマークSARデータセットOpenEarthMap-SARを紹介する。
OpenEarthMap-SARは、5033の航空画像と衛星画像の150万部で構成され、サイズは1024$times$1024ピクセルで、日本、フランス、アメリカから35の地域をカバーしている。
セマンティックセグメンテーションのための最先端手法の性能評価と,さらなる技術開発に適した課題設定を提案する。
論文 参考訳(メタデータ) (2025-01-18T22:30:27Z) - A global product of fine-scale urban building height based on spaceborne
lidar [14.651500878252723]
我々は2020年ごろに150mの細いグリッドサイズを基準に,都市ビルの高さの最新のグローバルな製品を提供する。
GEDIデータに基づく高さ推定法は, ピアソンrの0.78, RMSEの3.67mで有効であった。
この研究は、気候、環境、生態学、社会科学など多くの分野にわたる将来の都市研究を促進するだろう。
論文 参考訳(メタデータ) (2023-10-22T16:51:15Z) - Semi-supervised Learning from Street-View Images and OpenStreetMap for
Automatic Building Height Estimation [59.6553058160943]
本稿では,Mapillary SVIとOpenStreetMapのデータから建物の高さを自動的に推定する半教師付き学習(SSL)手法を提案する。
提案手法は, 平均絶対誤差(MAE)が約2.1mである建物の高さを推定する上で, 明らかな性能向上につながる。
予備結果は,低コストなVGIデータに基づく提案手法のスケールアップに向けた今後の取り組みを期待し,動機づけるものである。
論文 参考訳(メタデータ) (2023-07-05T18:16:30Z) - Country-wide Retrieval of Forest Structure From Optical and SAR
Satellite Imagery With Bayesian Deep Learning [74.94436509364554]
本研究では,10mの解像度で森林構造変数を高密度に推定するベイズ深層学習手法を提案する。
本手法は,Sentinel-2光画像とSentinel-1合成開口レーダ画像を5種類の森林構造変数のマップに変換する。
ノルウェーを横断する41の空中レーザー走査ミッションの基準データに基づいて、我々のモデルを訓練し、テストする。
論文 参考訳(メタデータ) (2021-11-25T16:21:28Z) - A Semantic Segmentation Network for Urban-Scale Building Footprint
Extraction Using RGB Satellite Imagery [1.9400948599830012]
都市部は世界のエネルギーの3分の2以上を消費し、世界のCO2排出量の70%以上を占めています。
3チャンネルのRGB衛星画像から建物の足跡のマスクを生成するために、拡張ResNetバックボーンを備えた変更されたDeeplabV3+モジュールを提案します。
3つの標準ベンチマークで最先端のパフォーマンスを達成し,衛星画像の規模,解像度,都市密度に依存しないことを実証した。
論文 参考訳(メタデータ) (2021-04-02T22:32:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。