論文の概要: ZeD-MAP: Bundle Adjustment Guided Zero-Shot Depth Maps for Real-Time Aerial Imaging
- arxiv url: http://arxiv.org/abs/2604.04667v1
- Date: Mon, 06 Apr 2026 13:21:17 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-07 15:49:19.200966
- Title: ZeD-MAP: Bundle Adjustment Guided Zero-Shot Depth Maps for Real-Time Aerial Imaging
- Title(参考訳): ZeD-MAP:実時間空中イメージングのためのバンドル調整ガイドゼロショット深度マップ
- Authors: Selim Ahmet Iz, Francesco Nex, Norman Kerle, Henry Meissner, Ralf Berger,
- Abstract要約: ZeD-MAPは、テスト時間拡散深さモデルをメトリック一貫性のあるSLAMのようなマッピングパイプラインに変換する、クラスタレベルのフレームワークである。
本手法は,水平(XY)平面で約0.87m,垂直(Z)方向で約0.12mの誤差で,サブメーター精度を実現する。
結果は手動のポイントクラウドアノテーションから小さなノイズを受けます。
- 参考スコア(独自算出の注目度): 1.9247157750972368
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Real-time depth reconstruction from ultra-high-resolution UAV imagery is essential for time-critical geospatial tasks such as disaster response, yet remains challenging due to wide-baseline parallax, large image sizes, low-texture or specular surfaces, occlusions, and strict computational constraints. Recent zero-shot diffusion models offer fast per-image dense predictions without task-specific retraining, and require fewer labelled datasets than transformer-based predictors while avoiding the rigid capture geometry requirement of classical multi-view stereo. However, their probabilistic inference prevents reliable metric accuracy and temporal consistency across sequential frames and overlapping tiles. We present ZeD-MAP, a cluster-level framework that converts a test-time diffusion depth model into a metrically consistent, SLAM-like mapping pipeline by integrating incremental cluster-based bundle adjustment (BA). Streamed UAV frames are grouped into overlapping clusters; periodic BA produces metrically consistent poses and sparse 3D tie-points, which are reprojected into selected frames and used as metric guidance for diffusion-based depth estimation. Validation on ground-marker flights captured at approximately 50 m altitude (GSD is approximately 0.85 cm/px, corresponding to 2,650 square meters ground coverage per frame) with the DLR Modular Aerial Camera System (MACS) shows that our method achieves sub-meter accuracy, with approximately 0.87 m error in the horizontal (XY) plane and 0.12 m in the vertical (Z) direction, while maintaining per-image runtimes between 1.47 and 4.91 seconds. Results are subject to minor noise from manual point-cloud annotation. These findings show that BA-based metric guidance provides consistency comparable to classical photogrammetric methods while significantly accelerating processing, enabling real-time 3D map generation.
- Abstract(参考訳): 超高解像度UAV画像からのリアルタイム深度再構成は、災害応答などの時間クリティカルな地理空間課題には不可欠であるが、広帯域パララックス、大きな画像サイズ、低テクスチャまたはスペキュラ面、オクルージョン、厳密な計算制約により、依然として困難である。
最近のゼロショット拡散モデルは、タスク固有のリトレーニングなしで高速な画像毎の高密度予測を提供し、古典的なマルチビューステレオの厳密な捕獲幾何学的要求を回避しながら、トランスフォーマーベースの予測器よりもラベル付きデータセットを少なくする。
しかし、確率的推論は、シーケンシャルフレームと重なり合うタイル間の信頼性の高い計量精度と時間的一貫性を妨げている。
段階的クラスタベースバンドル調整(BA)を統合することで,テスト時間拡散深度モデルをメトリック一貫性のあるSLAMライクなマッピングパイプラインに変換するクラスタレベルのフレームワークであるZeD-MAPを提案する。
ストリームされたUAVフレームは重なり合うクラスタにグループ化され、周期的BAはメートル法的に一貫したポーズとスパース3Dタイポイントを生成し、選択されたフレームに再投影され、拡散に基づく深さ推定のためのメートル法ガイダンスとして使用される。
DLR Modular Aerial Camera System (MACS) による約50m高度(GSDは約0.85cm/px、フレームあたり2,650m2の地表面積)で捕獲された地中マーカー飛行の検証により,水平(XY)平面で約0.87m,垂直(Z)方向に約0.12mの誤差で,画像間ランタイムを1.47~4.91秒で維持しながら,サブメーター精度が得られた。
結果は手動のポイントクラウドアノテーションから小さなノイズを受けます。
これらの結果から,BAを用いた測位法は,従来のフォトグラム法に匹敵する一貫性を示しながら,処理を著しく高速化し,リアルタイム3Dマップ生成を可能にした。
関連論文リスト
- Interp3R: Continuous-time 3D Geometry Estimation with Frames and Events [19.851795807287633]
Interp3Rを導入し、任意のタイミングで奥行きとカメラのポーズを推定するために、ポイントマップベースのモデルを強化する。
我々は、Interp3Rを合成データセットにのみトレーニングするが、広範囲の合成および実世界のベンチマークで強力な一般化を実証する。
論文 参考訳(メタデータ) (2026-03-15T18:10:05Z) - Super4DR: 4D Radar-centric Self-supervised Odometry and Gaussian-based Map Optimization [13.79944715452315]
そこで我々は,4次元レーダー中心のフレームワークであるSuper4DRを提案する。
Super4DRは、従来の自己監督手法よりも67%の性能向上を実現し、オードメトリーとほぼ一致し、LiDARとの地図品質格差を狭める。
実験の結果,Super4DRは従来の自己監督法に比べて67%の性能向上を達成し,オードメトリーとほぼ一致し,LiDARとの地図品質格差を狭めることがわかった。
論文 参考訳(メタデータ) (2025-12-10T12:55:05Z) - Real-Time Bundle Adjustment for Ultra-High-Resolution UAV Imagery Using Adaptive Patch-Based Feature Tracking [1.9247157750972368]
ダウンサンプリングなしで全解像度UAV画像を直接操作する新しいリアルタイムBAフレームワークを提案する。
当社の軽量でオンボード互換のアプローチでは、各イメージをユーザ定義のパッチに分割し、フレーム間で追跡しています。
UAVナビゲーションシステムを用いて画像間の重なり合う関係をリアルタイムで決定する。
提案アルゴリズムは,DLR Modular Aerial Camera System へのシームレスな統合のために設計されている。
論文 参考訳(メタデータ) (2025-11-08T22:09:32Z) - Loc$^2$: Interpretable Cross-View Localization via Depth-Lifted Local Feature Matching [80.57282092735991]
本稿では,高精度かつ解釈可能なクロスビューローカライズ手法を提案する。
地上画像の3自由度(DoF)のポーズを、その局所的な特徴と基準空中画像とをマッチングすることによって推定する。
実験では、クロスエリアテストや未知の向きといった挑戦的なシナリオにおいて、最先端の精度を示す。
論文 参考訳(メタデータ) (2025-09-11T18:52:16Z) - Pseudo Depth Meets Gaussian: A Feed-forward RGB SLAM Baseline [64.42938561167402]
本稿では,3次元ガウス型SLAMとフィードフォワードリカレント予測モジュールを組み合わせたオンライン3次元再構成手法を提案する。
このアプローチは、遅いテスト時間の最適化を高速なネットワーク推論に置き換え、トラッキング速度を大幅に改善する。
提案手法は,最先端のSplaTAMと同等の性能を示しながら,追跡時間を90%以上削減する。
論文 参考訳(メタデータ) (2025-08-06T16:16:58Z) - SiLVR: Scalable Lidar-Visual Radiance Field Reconstruction with Uncertainty Quantification [0.6445605125467574]
本稿では,ライダーと視覚データを融合したNeRFを用いた大規模再構成システムを提案する。
我々のシステムはライダーを組み込むために最先端のNeRF表現を採用する。
ライダーデータを追加すると、深さと表面の正規値に強い幾何学的制約が加わる。
論文 参考訳(メタデータ) (2025-02-04T19:00:49Z) - A Large Scale Homography Benchmark [52.55694707744518]
1DSfMデータセットから10万枚の画像から約1000個の平面が観測された3D, Pi3Dの平面の大規模データセットを示す。
また,Pi3Dを利用した大規模ホモグラフィ推定ベンチマークであるHEBを提案する。
論文 参考訳(メタデータ) (2023-02-20T14:18:09Z) - Shakes on a Plane: Unsupervised Depth Estimation from Unstabilized
Photography [54.36608424943729]
2秒で取得した12メガピクセルのRAWフレームの「長バースト」では,自然手震動のみからの視差情報で高品質のシーン深度を回復できることが示されている。
我々は、長時間バーストデータにニューラルRGB-D表現を適合させるテスト時間最適化手法を考案し、シーン深度とカメラモーションを同時に推定する。
論文 参考訳(メタデータ) (2022-12-22T18:54:34Z) - Few-shot Non-line-of-sight Imaging with Signal-surface Collaborative
Regularization [18.466941045530408]
非視線イメージング技術は、多重反射光からターゲットを再構成することを目的としている。
最小限の測定回数でノイズロバストを再現する信号表面の協調正規化フレームワークを提案する。
我々のアプローチは、救助活動や自律運転といったリアルタイム非視線画像アプリケーションにおいて大きな可能性を秘めている。
論文 参考訳(メタデータ) (2022-11-21T11:19:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。