論文の概要: Prompt2DEM: High-Resolution DEMs for Urban and Open Environments from Global Prompts Using a Monocular Foundation Model
- arxiv url: http://arxiv.org/abs/2507.09681v2
- Date: Mon, 21 Jul 2025 13:29:28 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-22 14:33:32.600549
- Title: Prompt2DEM: High-Resolution DEMs for Urban and Open Environments from Global Prompts Using a Monocular Foundation Model
- Title(参考訳): Prompt2DEM:モノクロファンデーションモデルを用いたグローバルプロンプトからの都市・オープン環境の高分解能DEM
- Authors: Osher Rafaeli, Tal Svoray, Ariel Nahlieli,
- Abstract要約: 高分解能標高推定は、捕食と斜面水文学を理解し、都市形態学と動態を研究し、地球生態系の成長、衰退、死亡をモニターするために不可欠である。
本稿では,絶対的地球高度マッピングのための新しいパラダイムとして,高分解能DEMを推定するためのフレームワークを提案する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: High-resolution elevation estimations are essential to understand catchment and hillslope hydrology, study urban morphology and dynamics, and monitor the growth, decline, and mortality of terrestrial ecosystems. Various deep learning approaches (e.g., super-resolution techniques, monocular depth estimation) have been developed to create high-resolution Digital Elevation Models (DEMs). However, super-resolution techniques are limited by the upscaling factor, and monocular depth estimation lacks global elevation context, making its conversion to a seamless DEM restricted. The recently introduced technique of prompt-based monocular depth estimation has opened new opportunities to extract estimates of absolute elevation in a global context. We present here a framework for the estimation of high-resolution DEMs as a new paradigm for absolute global elevation mapping. It is exemplified using low-resolution Shuttle Radar Topography Mission (SRTM) elevation data as prompts and high-resolution RGB imagery from the National Agriculture Imagery Program (NAIP). The approach fine-tunes a vision transformer encoder with LiDAR-derived DEMs and employs a versatile prompting strategy, enabling tasks such as DEM estimation, void filling, and updating. Our framework achieves a 100x resolution gain (from 30-m to 30-cm), surpassing prior methods by an order of magnitude. Evaluations across three diverse U.S. landscapes show robust generalization, capturing urban structures and fine-scale terrain features with < 5 m MAE relative to LiDAR, improving over SRTM by up to 18%. Hydrological analysis confirms suitability for hazard and environmental studies. We demonstrate scalability by applying the framework to large regions in the U.S. and Israel. All code and pretrained models are publicly available at: https://osherr1996.github.io/prompt2dem_propage/.
- Abstract(参考訳): 高分解能標高推定は、捕食と斜面水文学を理解し、都市形態学と動態を研究し、地球生態系の成長、衰退、死亡をモニターするために不可欠である。
様々な深層学習手法(超解像法、単分子深度推定など)が開発され、高分解能DEM(Digital Elevation Models)が開発されている。
しかし、超高分解能技術はアップスケーリング係数によって制限されており、モノクル深度推定にはグローバルな標高コンテキストが欠如しており、シームレスなDEMへの変換が制限されている。
最近導入されたプロンプトベースの単分子深度推定技術は、グローバルな文脈で絶対標高の推定を抽出する新たな機会を開放した。
本稿では,絶対的地球高度マッピングのための新しいパラダイムとして,高分解能DEMを推定するためのフレームワークを提案する。
国立農業画像プログラム(NAIP)のプロンプトや高解像度RGB画像として、低解像度のShuttle Radar Topography Mission(SRTM)標高データを用いて実証されている。
このアプローチは、LiDARから派生したDEMで視覚トランスフォーマーエンコーダを微調整し、汎用的なプロンプト戦略を採用し、DEM推定や空白フィリング、更新などのタスクを可能にする。
従来の手法を桁違いに上回る100倍の分解能(30-mから30-cm)を達成する。
アメリカ合衆国の3つの異なる景観における評価は、都市構造を捉え、LiDARと比較して5 m MAE未満の地形の特徴を捉え、SRTMを最大18%改善している。
水文学的分析は、危険および環境研究に適したことを確認する。
米国とイスラエルの大規模地域にフレームワークを適用することでスケーラビリティを実証する。
すべてのコードと事前訓練されたモデルは、https://osherr 1996.github.io/prompt2dem_propage/で公開されている。
関連論文リスト
- Data Augmentation and Resolution Enhancement using GANs and Diffusion Models for Tree Segmentation [49.13393683126712]
都市森林は、環境の質を高め、都市における生物多様性を支援する上で重要な役割を担っている。
複雑な地形と異なる衛星センサーやUAV飛行高度による画像解像度の変化により、正確に木を検知することは困難である。
低解像度空中画像の品質を高めるため,GANと拡散モデルとドメイン適応を統合した新しいパイプラインを提案する。
論文 参考訳(メタデータ) (2025-05-21T03:57:10Z) - Multi-view Reconstruction via SfM-guided Monocular Depth Estimation [92.89227629434316]
マルチビュー幾何再構成のための新しい手法を提案する。
深度推定プロセスに、より強力なマルチビューであるSfM情報を組み込む。
本手法は, 従来の単分子深度推定法と比較して, 深度推定の精度を著しく向上させる。
論文 参考訳(メタデータ) (2025-03-18T17:54:06Z) - Tomographic SAR Reconstruction for Forest Height Estimation [4.1942958779358674]
樹高推定は、生態学および森林学の応用において、バイオマス推定の重要な指標となる。
本研究では,SAR(Synthetic Aperture Radar)の派生である2Dシングルルックコンプレックス(SLC)画像から直接,深層学習を用いて林冠の高さを推定する。
本手法は,従来のトモグラフィ信号処理を回避し,SARキャプチャからエンド製品への遅延を低減する。
論文 参考訳(メタデータ) (2024-12-01T17:37:25Z) - MetricGold: Leveraging Text-To-Image Latent Diffusion Models for Metric Depth Estimation [9.639797094021988]
MetricGoldは、生成拡散モデルの豊富な先行値を利用して、メートル法深さ推定を改善する新しいアプローチである。
我々の実験は、多様なデータセットをまたいだ堅牢な一般化を実証し、よりシャープで高品質なメートル法深さ推定を導出する。
論文 参考訳(メタデータ) (2024-11-16T20:59:01Z) - TanDepth: Leveraging Global DEMs for Metric Monocular Depth Estimation in UAVs [5.6168844664788855]
本研究は,推定時間における相対的推定から距離深度を求めるための実用的スケール回復手法であるTanDepthを提示する。
提案手法は,GDEM(Global Digital Elevation Models)のスパース計測をカメラビューに投影することで活用する。
推定深度マップから接地点を選択して、投影された基準点と相関するクラスフィルタシミュレーションへの適応を示す。
論文 参考訳(メタデータ) (2024-09-08T15:54:43Z) - MambaDS: Near-Surface Meteorological Field Downscaling with Topography Constrained Selective State Space Modeling [68.69647625472464]
気象予測において重要な課題であるダウンスケーリングは、ターゲット領域に対する高解像度気象状態の再構築を可能にする。
以前のダウンスケーリング手法には気象学のための調整された設計が欠けており、構造的な限界に遭遇した。
本稿では,多変数相関と地形情報の利用性を高める新しいモデルであるMambaDSを提案する。
論文 参考訳(メタデータ) (2024-08-20T13:45:49Z) - Monocular Visual-Inertial Depth Estimation [66.71452943981558]
単眼深度推定と視覚慣性計測を統合した視覚慣性深度推定パイプラインを提案する。
提案手法は, 疎度度に対する大域的スケールとシフトアライメントを行い, 続いて学習に基づく高密度アライメントを行う。
本研究では,TartanAir と VOID のデータセットを用いて,密集したスケールアライメントによるRMSE の最大30%の削減を観測した。
論文 参考訳(メタデータ) (2023-03-21T18:47:34Z) - DARF: Depth-Aware Generalizable Neural Radiance Field [51.29437249009986]
本稿では,Depth-Aware Dynamic Smpling(DADS)戦略を用いたDARF(Depth-Aware Generalizable Neural Radiance Field)を提案する。
筆者らのフレームワークは,数枚の入力画像で,画素レベルと幾何学レベルの両方の見えないシーンを推測する。
DARFは、最先端の一般化可能なNeRF法と比較して、レンダリング品質と深さ推定を改善しつつ、サンプルを50%削減する。
論文 参考訳(メタデータ) (2022-12-05T14:00:59Z) - Guided deep learning by subaperture decomposition: ocean patterns from
SAR imagery [36.922471841100176]
センチネル1 SAR 波動モードのヴィグネットは、2014年以来、多くの重要な海洋現象や大気現象を捉えてきた。
本研究では,SAR深層学習モデルの事前処理段階としてサブアパーチャ分解を適用することを提案する。
論文 参考訳(メタデータ) (2022-04-09T09:49:05Z) - Improving Monocular Visual Odometry Using Learned Depth [84.05081552443693]
単眼深度推定を応用して視力計測(VO)を改善する枠組みを提案する。
我々のフレームワークの中核は、多様なシーンに対して強力な一般化能力を持つ単眼深度推定モジュールである。
現在の学習型VO法と比較して,本手法は多様なシーンに対してより強力な一般化能力を示す。
論文 参考訳(メタデータ) (2022-04-04T06:26:46Z) - Flood Extent Mapping based on High Resolution Aerial Imagery and DEM: A
Hidden Markov Tree Approach [10.72081512622396]
本稿では,高分解能空中画像のケーススタディにより,提案した地理的隠れマルコフ木モデルを評価する。
2016年のハリケーン・マシューの洪水で、ノースカロライナ州グリムズランド市とキンストン市の近くで、3つのシーンが植林された洪水原で選ばれた。
その結果,提案した隠れマルコフ木モデルは,機械学習アルゴリズムのいくつかの状態よりも優れていた。
論文 参考訳(メタデータ) (2020-08-25T18:35:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。