論文の概要: AnchorD: Metric Grounding of Monocular Depth Using Factor Graphs
- arxiv url: http://arxiv.org/abs/2605.02667v1
- Date: Mon, 04 May 2026 14:48:52 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-05 20:33:50.345559
- Title: AnchorD: Metric Grounding of Monocular Depth Using Factor Graphs
- Title(参考訳): AnchorD:因子グラフを用いた単眼深度計測
- Authors: Simon Dorer, Martin Büchner, Nick Heppert, Abhinav Valada,
- Abstract要約: 現在利用可能な深度センサーは、透明、スペクトル、一般のランベルト面の誤差を生じやすい。
本研究では,深度基礎モデルから単分子深度推定の先行値をアンカーする学習自由深度接地フレームワークを提案する。
本手法はパッチワイドアフィンアライメントを行い,実世界深度で局所的に単分子予測を行う。
- 参考スコア(独自算出の注目度): 16.622717763906262
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Dense and accurate depth estimation is essential for robotic manipulation, grasping, and navigation, yet currently available depth sensors are prone to errors on transparent, specular, and general non-Lambertian surfaces. To mitigate these errors, large-scale monocular depth estimation approaches provide strong structural priors, but their predictions can be potentially skewed or mis-scaled in metric units, limiting their direct use in robotics. Thus, in this work, we propose a training-free depth grounding framework that anchors monocular depth estimation priors from a depth foundation model in raw sensor depth through factor graph optimization. Our method performs a patch-wise affine alignment, locally grounding monocular predictions in metric real-world depth while preserving fine-grained geometric structure and discontinuities. To facilitate evaluation in challenging real-world conditions, we introduce a benchmark dataset with dense scene-wide ground truth depth in the presence of non-Lambertian objects. Ground truth is obtained via matte reflection spray and multi-camera fusion, overcoming the reliance on object-only CAD-based annotations used in prior datasets. Extensive evaluations across diverse sensors and domains demonstrate consistent improvements in depth performance without any (re-)training. We make our implementation publicly available at https://anchord.cs.uni-freiburg.de.
- Abstract(参考訳): 精密で正確な深度推定はロボットの操作、把握、ナビゲーションに不可欠であるが、現在利用可能な深度センサーは透明で特異で一般的な非ランベルト面の誤差を生じやすい。
これらの誤差を軽減するために、大規模な単分子深度推定手法は強い構造的先行性を提供するが、その予測は計量単位で歪んだり、誤スケールしたりすることができ、ロボット工学における直接の使用を制限することができる。
そこで本研究では,要素グラフの最適化により,センサ深度モデルから単眼深度推定の先行値をアンカーする学習自由深度グラウンドディングフレームワークを提案する。
提案手法はパッチワイドアフィンアライメントを行い,粒度の細かい幾何学的構造と不連続性を保ちながら,局所的に実世界深度での単分子予測を行う。
実世界の状況に挑戦する際の評価を容易にするため,非ランベルト的物体の存在下で,シーン全体の真理深度が密集したベンチマークデータセットを提案する。
地上の真実は、マット反射噴霧とマルチカメラ融合によって得られ、以前のデータセットで使用されるオブジェクトのみのCADベースのアノテーションに依存していることを克服する。
多様なセンサーやドメインにわたる広範囲な評価は、(再)トレーニングなしでの深度性能が一貫した改善を示している。
私たちは実装をhttps://anchord.cs.uni-freiburg.deで公開しています。
関連論文リスト
- OASIS-DC: Generalizable Depth Completion via Output-level Alignment of Sparse-Integrated Monocular Pseudo Depth [1.4896509623302834]
最近の基礎モデルはゼロショット深度推定で優れているが、その出力はメートル法よりも本質的に相対的である。
比較的深度が大域的なレイアウトや境界を保っているという事実を活用し, 疎範囲測定で校正する。
精度の低いラベル付きサンプルから精度の高い測定値の予測が可能となるように,事前の信頼性に追従する改良ネットワークを設計する。
論文 参考訳(メタデータ) (2026-02-01T14:57:33Z) - Depth Anything with Any Prior [64.39991799606146]
Prior Depth Anythingは、深さ測定における不完全だが正確な計量情報と深さ予測における相対的だが完全な幾何学的構造を組み合わせたフレームワークである。
本研究では, 単眼深度推定(MDE)モデルを構築し, 深度推定の固有ノイズを改良する。
われわれのモデルは、7つの現実世界のデータセットにまたがる深度補完、超高解像度、インパインティングという、印象的なゼロショットの一般化を見せている。
論文 参考訳(メタデータ) (2025-05-15T17:59:50Z) - Metrically Scaled Monocular Depth Estimation through Sparse Priors for
Underwater Robots [0.0]
三角特徴量からのスパース深度測定を融合して深度予測を改善する深度学習モデルを定式化する。
このネットワークは、前方に見える水中データセットFLSeaで教師ありの方法で訓練されている。
この方法は、ラップトップGPUで160FPS、単一のCPUコアで7FPSで実行することで、リアルタイムのパフォーマンスを実現する。
論文 参考訳(メタデータ) (2023-10-25T16:32:31Z) - Self-Supervised Learning based Depth Estimation from Monocular Images [0.0]
単色深度推定の目標は、入力として2次元単色RGB画像が与えられた深度マップを予測することである。
我々は、トレーニング中に固有のカメラパラメータを実行し、我々のモデルをさらに一般化するために天気増悪を適用することを計画している。
論文 参考訳(メタデータ) (2023-04-14T07:14:08Z) - Mind The Edge: Refining Depth Edges in Sparsely-Supervised Monocular Depth Estimation [42.19770683222846]
単眼深度推定(MDE)はコンピュータビジョンの基本的な問題であり、多くの応用がある。
本稿では,密集した合成データから深度エッジの位置を検出することを提案する。
いくつかの挑戦的データセットに対して,画素ごとの深度精度を比較検討することにより,深度エッジの精度が著しく向上したことを示す。
論文 参考訳(メタデータ) (2022-12-10T14:49:24Z) - Probabilistic and Geometric Depth: Detecting Objects in Perspective [78.00922683083776]
3次元物体検出は、運転支援システムなどの様々な実用用途で必要とされる重要な機能である。
双眼視やLiDARに頼っている従来の設定に比べて、経済的な解決策として単眼3D検出が注目されているが、それでも満足のいく結果が得られていない。
本稿ではまず,この問題に関する系統的研究を行い,現在の単分子3次元検出問題をインスタンス深度推定問題として単純化できることを考察する。
論文 参考訳(メタデータ) (2021-07-29T16:30:33Z) - Virtual Normal: Enforcing Geometric Constraints for Accurate and Robust
Depth Prediction [87.08227378010874]
深度予測における高次3次元幾何学的制約の重要性を示す。
単純な幾何学的制約を強制する損失項を設計することにより、単眼深度推定の精度とロバスト性を大幅に改善する。
The-of-the-art results of learning metric depth on NYU Depth-V2 and KITTI。
論文 参考訳(メタデータ) (2021-03-07T00:08:21Z) - Occlusion-Aware Depth Estimation with Adaptive Normal Constraints [85.44842683936471]
カラービデオから多フレーム深度を推定する新しい学習手法を提案する。
本手法は深度推定精度において最先端の手法より優れる。
論文 参考訳(メタデータ) (2020-04-02T07:10:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。