論文の概要: GeoDiff: Geometry-Guided Diffusion for Metric Depth Estimation
- arxiv url: http://arxiv.org/abs/2510.18291v1
- Date: Tue, 21 Oct 2025 04:47:36 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-25 03:08:12.923717
- Title: GeoDiff: Geometry-Guided Diffusion for Metric Depth Estimation
- Title(参考訳): GeoDiff: 距離深さ推定のための幾何誘導拡散
- Authors: Tuan Pham, Thanh-Tung Le, Xiaohui Xie, Stephan Mandt,
- Abstract要約: 本稿では,立体視誘導を用いた拡散型単分子深度推定(DB-MDE)モデルの改良を目的とした,距離深度推定のための新しいフレームワークを提案する。
トレーニングフリーのソリューションは既存のDB-MDEフレームワークとシームレスに統合され、屋内、屋外、複雑な環境にまたがって一般化されます。
- 参考スコア(独自算出の注目度): 25.50613737995557
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We introduce a novel framework for metric depth estimation that enhances pretrained diffusion-based monocular depth estimation (DB-MDE) models with stereo vision guidance. While existing DB-MDE methods excel at predicting relative depth, estimating absolute metric depth remains challenging due to scale ambiguities in single-image scenarios. To address this, we reframe depth estimation as an inverse problem, leveraging pretrained latent diffusion models (LDMs) conditioned on RGB images, combined with stereo-based geometric constraints, to learn scale and shift for accurate depth recovery. Our training-free solution seamlessly integrates into existing DB-MDE frameworks and generalizes across indoor, outdoor, and complex environments. Extensive experiments demonstrate that our approach matches or surpasses state-of-the-art methods, particularly in challenging scenarios involving translucent and specular surfaces, all without requiring retraining.
- Abstract(参考訳): 本稿では,立体視誘導を用いた拡散型単分子深度推定(DB-MDE)モデルの改良を目的とした,距離深度推定のための新しいフレームワークを提案する。
既存のDB-MDE法は相対的な深度予測に優れるが、単一画像シナリオにおけるスケールのあいまいさのため、絶対的なメートル法深度の推定は依然として困難である。
そこで我々は,RGB画像に規定された事前学習遅延拡散モデル(LDM)とステレオベースの幾何学的制約を併用した逆問題として深度推定を再構成し,精度の高い深度回復のためのスケールとシフトを学習する。
トレーニングフリーのソリューションは既存のDB-MDEフレームワークとシームレスに統合され、屋内、屋外、複雑な環境にまたがって一般化されます。
大規模な実験により、我々のアプローチは最先端の手法、特に半透明な表面と特異な表面を含む挑戦的なシナリオにおいて、再トレーニングを必要とせず、一致または超越していることが示される。
関連論文リスト
- Intrinsic Image Decomposition for Robust Self-supervised Monocular Depth Estimation on Reflective Surfaces [10.557788087220509]
自己教師付き単分子深度推定(SSMDE)は深層学習の分野で注目を集めている。
固有画像分解をSSMDEに組み込んだ新しいフレームワークを提案する。
本手法は単眼深度推定と内在画像分解の両方を相乗的に訓練する。
論文 参考訳(メタデータ) (2025-03-28T07:56:59Z) - Multi-view Reconstruction via SfM-guided Monocular Depth Estimation [92.89227629434316]
マルチビュー幾何再構成のための新しい手法を提案する。
深度推定プロセスに、より強力なマルチビューであるSfM情報を組み込む。
本手法は, 従来の単分子深度推定法と比較して, 深度推定の精度を著しく向上させる。
論文 参考訳(メタデータ) (2025-03-18T17:54:06Z) - Relative Pose Estimation through Affine Corrections of Monocular Depth Priors [69.59216331861437]
本研究では,独立なアフィン(スケールとシフト)のあいまいさを明示的に考慮した相対ポーズ推定のための3つの解法を開発した。
提案する解法と古典的点ベース解法とエピポーラ制約を組み合わせたハイブリッド推定パイプラインを提案する。
論文 参考訳(メタデータ) (2025-01-09T18:58:30Z) - Marigold-DC: Zero-Shot Monocular Depth Completion with Guided Diffusion [57.08169927189237]
奥行き完了のための既存の手法は、厳密に制約された設定で動作する。
単眼深度推定の進歩に触発されて,画像条件の深度マップ生成として深度補完を再構成した。
Marigold-DCは、単分子深度推定のための事前訓練された潜伏拡散モデルを構築し、試験時間ガイダンスとして深度観測を注入する。
論文 参考訳(メタデータ) (2024-12-18T00:06:41Z) - MetricGold: Leveraging Text-To-Image Latent Diffusion Models for Metric Depth Estimation [9.639797094021988]
MetricGoldは、生成拡散モデルの豊富な先行値を利用して、メートル法深さ推定を改善する新しいアプローチである。
我々の実験は、多様なデータセットをまたいだ堅牢な一般化を実証し、よりシャープで高品質なメートル法深さ推定を導出する。
論文 参考訳(メタデータ) (2024-11-16T20:59:01Z) - TanDepth: Leveraging Global DEMs for Metric Monocular Depth Estimation in UAVs [5.6168844664788855]
本研究は,推定時間における相対的推定から距離深度を求めるための実用的スケール回復手法であるTanDepthを提示する。
提案手法は,GDEM(Global Digital Elevation Models)のスパース計測をカメラビューに投影することで活用する。
推定深度マップから接地点を選択して、投影された基準点と相関するクラスフィルタシミュレーションへの適応を示す。
論文 参考訳(メタデータ) (2024-09-08T15:54:43Z) - ScaleDepth: Decomposing Metric Depth Estimation into Scale Prediction and Relative Depth Estimation [62.600382533322325]
本研究では,新しい単分子深度推定法であるScaleDepthを提案する。
提案手法は,距離深度をシーンスケールと相対深度に分解し,セマンティック・アウェア・スケール予測モジュールを用いて予測する。
本手法は,室内と屋外の両方のシーンを統一した枠組みで距離推定する。
論文 参考訳(メタデータ) (2024-07-11T05:11:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。