論文の概要: Learning Image-Adaptive Scale Fields for Metric Depth Recovery
- arxiv url: http://arxiv.org/abs/2605.07418v1
- Date: Fri, 08 May 2026 08:13:02 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-11 19:43:38.916034
- Title: Learning Image-Adaptive Scale Fields for Metric Depth Recovery
- Title(参考訳): メトリクス深度回復のための画像適応型スケールフィールドの学習
- Authors: Yuanyan Li, Matthias Althoff,
- Abstract要約: 我々は、画像適応型スケール場モデリングとしてメートル法深度復元を定式化する。
深度を直接補正する代わりに、画像適応基底写像の低次元線形結合として補正を再構成する。
この定式化により、測定深度精度の向上、極端アンカー間隔下での強靭性、空間スケール変動の解釈可能な分解が得られる。
- 参考スコア(独自算出の注目度): 13.22167540260594
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Monocular depth estimation (MDE) typically produces depth estimations that are defined up to an unknown scale or shift. When only sparse metric anchors are available, recovering accurate metric depth becomes challenging yet necessary for practical applications. We address this problem by formulating metric depth recovery as image-adaptive scale field modeling. Instead of directly correcting the depth, we reformulate the correction as a low-dimensional linear combination of image-adaptive basis maps. These maps are derived from semantic and geometric cues encoded in the MDE estimations and intermediate representations. The weights of basis maps are efficiently determined from sparse metric anchors via a least-squares problem. This formulation yields improved metric depth accuracy, strong robustness under extreme anchor sparsity, and an interpretable decomposition of spatial scale variations. Extensive experiments across multiple datasets and representative MDE models demonstrate the effectiveness and general applicability of our approach.
- Abstract(参考訳): 単眼深度推定(MDE)は通常、未知のスケールやシフトまで定義される深さ推定を生成する。
疎いメートル法アンカーのみが利用できる場合、正確なメートル法深さの復元は実用上は困難である。
我々は、画像適応型スケール場モデリングとしてメートル法深度復元を定式化することで、この問題に対処する。
深度を直接補正する代わりに、画像適応基底写像の低次元線形結合として補正を再構成する。
これらの写像は、MDE推定と中間表現に符号化された意味的および幾何学的手がかりから導かれる。
基底写像の重みは、最小二乗問題を介してスパース計量アンカーから効率的に決定される。
この定式化により、測定深度精度が向上し、極端アンカー間隔下での強靭性が向上し、空間スケールの変動の解釈可能な分解がもたらされる。
複数のデータセットおよび代表的MDEモデルにまたがる広範囲な実験は、我々のアプローチの有効性と汎用性を実証している。
関連論文リスト
- StarryGazer: Leveraging Monocular Depth Estimation Models for Domain-Agnostic Single Depth Image Completion [56.28564075246147]
StarryGazerは、単一のスパース深度画像とRGB画像から高密度深度画像を予測するフレームワークである。
我々は、相対深度画像を生成するために、事前訓練されたMDEモデルを用いる。
モデルの精度とロバスト性を改善するために、相対深度マップとRGBイメージを組み込んだ合成ペアを用いて改良ネットワークを訓練する。
論文 参考訳(メタデータ) (2025-12-15T09:56:09Z) - GeoDiff: Geometry-Guided Diffusion for Metric Depth Estimation [25.50613737995557]
本稿では,立体視誘導を用いた拡散型単分子深度推定(DB-MDE)モデルの改良を目的とした,距離深度推定のための新しいフレームワークを提案する。
トレーニングフリーのソリューションは既存のDB-MDEフレームワークとシームレスに統合され、屋内、屋外、複雑な環境にまたがって一般化されます。
論文 参考訳(メタデータ) (2025-10-21T04:47:36Z) - Metric-Solver: Sliding Anchored Metric Depth Estimation from a Single Image [51.689871870692194]
Metric-rはスライディングアンカーを用いた新しい距離深さ推定法である。
我々の設計は多様な環境にまたがって統一的かつ適応的な深度表現を可能にする。
論文 参考訳(メタデータ) (2025-04-16T14:12:25Z) - Radar-Guided Polynomial Fitting for Metric Depth Estimation [10.901638730547452]
POLARはレーダー誘導深度推定法である。
スケールレス深度予測を、事前訓練された単眼深度推定(MDE)モデルからメートル法深度マップに変換する。
3つのデータセットにわたる最先端のパフォーマンスを実現する。
論文 参考訳(メタデータ) (2025-03-21T14:29:42Z) - Relative Pose Estimation through Affine Corrections of Monocular Depth Priors [69.59216331861437]
本研究では,独立なアフィン(スケールとシフト)のあいまいさを明示的に考慮した相対ポーズ推定のための3つの解法を開発した。
提案する解法と古典的点ベース解法とエピポーラ制約を組み合わせたハイブリッド推定パイプラインを提案する。
論文 参考訳(メタデータ) (2025-01-09T18:58:30Z) - TanDepth: Leveraging Global DEMs for Metric Monocular Depth Estimation in UAVs [5.6168844664788855]
本研究は,推定時間における相対的推定から距離深度を求めるための実用的スケール回復手法であるTanDepthを提示する。
提案手法は,GDEM(Global Digital Elevation Models)のスパース計測をカメラビューに投影することで活用する。
推定深度マップから接地点を選択して、投影された基準点と相関するクラスフィルタシミュレーションへの適応を示す。
論文 参考訳(メタデータ) (2024-09-08T15:54:43Z) - ScaleDepth: Decomposing Metric Depth Estimation into Scale Prediction and Relative Depth Estimation [62.600382533322325]
本研究では,新しい単分子深度推定法であるScaleDepthを提案する。
提案手法は,距離深度をシーンスケールと相対深度に分解し,セマンティック・アウェア・スケール予測モジュールを用いて予測する。
本手法は,室内と屋外の両方のシーンを統一した枠組みで距離推定する。
論文 参考訳(メタデータ) (2024-07-11T05:11:56Z) - Balanced Depth Completion between Dense Depth Inference and Sparse Range
Measurements via KISS-GP [14.158132769768578]
密集した正確な深度マップを推定することは、自動運転とロボット工学にとって重要な要件である。
近年のディープラーニングの進歩により、単一の画像から全解像度での深度推定が可能になった。
この驚くべき結果にもかかわらず、多くのディープラーニングベースの単眼深度推定アルゴリズムは、その精度をメーターレベルの推定誤差に保たない。
論文 参考訳(メタデータ) (2020-08-12T08:07:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。