論文の概要: GrounDiff: Diffusion-Based Ground Surface Generation from Digital Surface Models
- arxiv url: http://arxiv.org/abs/2511.10391v1
- Date: Fri, 14 Nov 2025 01:48:48 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-14 22:53:22.843783
- Title: GrounDiff: Diffusion-Based Ground Surface Generation from Digital Surface Models
- Title(参考訳): GrounDiff:デジタル表面モデルによる拡散型地表面生成
- Authors: Oussema Dhaouadi, Johannes Meier, Jacques Kaiser, Daniel Cremers,
- Abstract要約: グラウンド拡散(GrounDiff)は、非グラウンド構造を反復的に除去する最初の拡散ベースのフレームワークである。
本稿では,DSM-to-DTM翻訳タスクにおける多種多様なデータセットを対象とした手法について検討する。
提案手法は,GeRoDベンチマークの特殊手法と比較して最大81%低い距離誤差を実現する。
- 参考スコア(独自算出の注目度): 42.398429909141306
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Digital Terrain Models (DTMs) represent the bare-earth elevation and are important in numerous geospatial applications. Such data models cannot be directly measured by sensors and are typically generated from Digital Surface Models (DSMs) derived from LiDAR or photogrammetry. Traditional filtering approaches rely on manually tuned parameters, while learning-based methods require well-designed architectures, often combined with post-processing. To address these challenges, we introduce Ground Diffusion (GrounDiff), the first diffusion-based framework that iteratively removes non-ground structures by formulating the problem as a denoising task. We incorporate a gated design with confidence-guided generation that enables selective filtering. To increase scalability, we further propose Prior-Guided Stitching (PrioStitch), which employs a downsampled global prior automatically generated using GrounDiff to guide local high-resolution predictions. We evaluate our method on the DSM-to-DTM translation task across diverse datasets, showing that GrounDiff consistently outperforms deep learning-based state-of-the-art methods, reducing RMSE by up to 93% on ALS2DTM and up to 47% on USGS benchmarks. In the task of road reconstruction, which requires both high precision and smoothness, our method achieves up to 81% lower distance error compared to specialized techniques on the GeRoD benchmark, while maintaining competitive surface smoothness using only DSM inputs, without task-specific optimization. Our variant for road reconstruction, GrounDiff+, is specifically designed to produce even smoother surfaces, further surpassing state-of-the-art methods. The project page is available at https://deepscenario.github.io/GrounDiff/.
- Abstract(参考訳): Digital Terrain Models (DTM) はベアアース標高を表し、多くの地理空間的応用において重要である。
このようなデータモデルは、センサーによって直接測定することはできず、通常、LiDARやフォトグラムから派生したDSM(Digital Surface Models)から生成される。
従来のフィルタリング手法は手動で調整されたパラメータに依存するが、学習ベースの手法ではよく設計されたアーキテクチャが必要であり、後処理と組み合わせることが多い。
これらの課題に対処するため,我々は,非基底構造を反復的に除去する最初の拡散基盤フレームワークであるグラウンド拡散(GrounDiff)を導入する。
我々は、選択的フィルタリングを可能にする信頼誘導生成を備えたゲート設計を組み込んだ。
拡張性を高めるために,GrounDiff を用いて局所的な高分解能予測を導出するために,ダウンサンプリングされた大域的事前生成を利用するPrioStitchを提案する。
我々は,多種多様なデータセットを対象としたDSM-to-DTM翻訳タスクの評価を行い,GrounDiffが深層学習に基づく最先端手法を一貫して上回り,ALS2DTMでは最大93%,USGSベンチマークでは最大47%のRMSEを削減したことを示す。
高精度かつスムーズ性を要する道路再建作業では,タスク固有の最適化を伴わず,DSM入力のみを用いて競争面のスムーズ性を保ちながら,GeRoDベンチマークの特殊手法と比較して最大81%の誤差を達成できる。
道路再建のための派生案であるGrounDiff+は、よりスムーズな表面を作り出すために特別に設計されており、最先端の手法をはるかに超えています。
プロジェクトページはhttps://deepscenario.github.io/GrounDiff/.comで公開されている。
関連論文リスト
- GauSSmart: Enhanced 3D Reconstruction through 2D Foundation Models and Geometric Filtering [50.675710727721786]
2次元基礎モデルと3次元ガウススプラッティング再構成をブリッジするハイブリッド手法であるGauSSmartを提案する。
提案手法は,凸フィルタリングや意味的特徴監視など,確立した2次元コンピュータビジョン技術を統合している。
GauSSmartは既存のGaussian Splattingよりも一貫して優れています。
論文 参考訳(メタデータ) (2025-10-16T03:38:26Z) - DEPTHOR++: Robust Depth Enhancement from a Real-World Lightweight dToF and RGB Guidance [14.818201604060144]
DEPTHOR++は実用的で斬新な深度補完フレームワークである。
3つの重要な側面からのdToF入力に頑健さを増す。
ZJU-L5データセットと実世界のサンプルに基づいて、トレーニング戦略は既存の深度補完モデルを大幅に強化する。
論文 参考訳(メタデータ) (2025-09-30T16:41:11Z) - DONOD: Efficient and Generalizable Instruction Fine-Tuning for LLMs via Model-Intrinsic Dataset Pruning [22.704995231753397]
大規模言語モデル(LLM)のアドホック命令の微調整は、ドメイン固有の適応に広く採用されている。
本研究では,軽量なモデル固有データ解析手法であるDONODを提案する。
データセット全体の70%をフィルタリングすることで、ターゲットドメインの精度を14.90%、クロスドメインの精度を5.67%向上させる。
論文 参考訳(メタデータ) (2025-04-21T02:25:03Z) - DEPTHOR: Depth Enhancement from a Practical Light-Weight dToF Sensor and RGB Image [8.588871458005114]
本稿では,コンピュータビジョンにおける深度向上のための新しい補完方式DEPTHORを提案する。
まず、合成データセットの正確な基底真理から実世界のdToFデータをシミュレートし、ノイズロバストトレーニングを可能にする。
第2に,グローバルな深度関係と文脈情報を利用して,単眼深度推定(MDE)を組み込んだ新しいネットワークを設計し,課題領域の予測を改善する。
論文 参考訳(メタデータ) (2025-04-02T11:02:21Z) - GeoWizard: Unleashing the Diffusion Priors for 3D Geometry Estimation from a Single Image [94.56927147492738]
単一画像から幾何学的属性を推定するための新しい生成基盤モデルであるGeoWizardを紹介する。
拡散前処理の活用は,資源利用における一般化,詳細な保存,効率性を著しく向上させることが示唆された。
本稿では,様々なシーンの複雑なデータ分布を,個別のサブディストリビューションに分離する,シンプルかつ効果的な戦略を提案する。
論文 参考訳(メタデータ) (2024-03-18T17:50:41Z) - ZARTS: On Zero-order Optimization for Neural Architecture Search [94.41017048659664]
微分可能なアーキテクチャサーチ (DARTS) は、NASの高効率性のため、一般的なワンショットパラダイムである。
この作業はゼロオーダーの最適化に変わり、上記の近似を強制せずに探索するための新しいNASスキームであるZARTSを提案する。
特に、12ベンチマークの結果は、DARTSの性能が低下するZARTSの顕著な堅牢性を検証する。
論文 参考訳(メタデータ) (2021-10-10T09:35:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。