論文の概要: Error Diagnosis of Deep Monocular Depth Estimation Models
- arxiv url: http://arxiv.org/abs/2112.05533v1
- Date: Mon, 15 Nov 2021 22:13:28 GMT
- ステータス: 処理完了
- システム内更新日: 2021-12-19 12:53:59.136045
- Title: Error Diagnosis of Deep Monocular Depth Estimation Models
- Title(参考訳): 深部単眼深度推定モデルの誤差診断
- Authors: Jagpreet Chawla, Nikhil Thakurdesai, Anuj Godase, Md Reza, David
Crandall and Soon-Heung Jung
- Abstract要約: 室内シーンにおける現状のモノクル深度推定モデルを分析し,これらのモデルの限界と誤差パターンを理解する。
深度推定における誤りに対処するために,空間的に誤深度予測を識別する新しい深度誤差検出ネットワーク(DEDN)を導入する。
我々のモジュールは柔軟で、任意の単分子深度予測ネットワークに簡単に接続でき、その結果の診断に役立ちます。
- 参考スコア(独自算出の注目度): 0.2770822269241973
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Estimating depth from a monocular image is an ill-posed problem: when the
camera projects a 3D scene onto a 2D plane, depth information is inherently and
permanently lost. Nevertheless, recent work has shown impressive results in
estimating 3D structure from 2D images using deep learning. In this paper, we
put on an introspective hat and analyze state-of-the-art monocular depth
estimation models in indoor scenes to understand these models' limitations and
error patterns. To address errors in depth estimation, we introduce a novel
Depth Error Detection Network (DEDN) that spatially identifies erroneous depth
predictions in the monocular depth estimation models. By experimenting with
multiple state-of-the-art monocular indoor depth estimation models on multiple
datasets, we show that our proposed depth error detection network can identify
a significant number of errors in the predicted depth maps. Our module is
flexible and can be readily plugged into any monocular depth prediction network
to help diagnose its results. Additionally, we propose a simple yet effective
Depth Error Correction Network (DECN) that iteratively corrects errors based on
our initial error diagnosis.
- Abstract(参考訳): カメラが3dシーンを2d平面に投影すると、深度情報は本質的に永久に失われる。
しかし,近年の研究では,ディープラーニングを用いて2次元画像から3次元構造を推定する素晴らしい結果が得られている。
本稿では,イントロスペクティブ・ハットを装着し,室内シーンにおける現状のモノクル深度推定モデルを分析し,これらのモデルの限界とエラーパターンを理解する。
深度推定における誤りに対処するため,単眼深度推定モデルにおける誤深度予測を空間的に識別する新しい深度誤差検出ネットワーク(DEDN)を導入する。
本研究では,複数のデータセット上での室内深度推定モデルについて実験を行い,提案する深さ誤差検出ネットワークにより,予測された深さマップに有意な誤差を識別できることを示す。
我々のモジュールは柔軟で、どんな単眼深度予測ネットワークにも簡単に接続でき、結果の診断に役立ちます。
さらに,初期誤り診断に基づいて誤りを反復的に補正する簡易で効果的な深さ誤差補正ネットワーク(DECN)を提案する。
関連論文リスト
- GUPNet++: Geometry Uncertainty Propagation Network for Monocular 3D
Object Detection [95.8940731298518]
我々はGUPNet++(Geometry Uncertainty Propagation Network)を提案する。
トレーニング中の幾何射影の不確実性伝播関係をモデル化し、エンドツーエンドのモデル学習の安定性と効率を向上させる。
実験により,提案手法は画像ベースモノクロ3次元検出におけるSOTA性能を得るだけでなく,簡易なフレームワークで有効性を示す。
論文 参考訳(メタデータ) (2023-10-24T08:45:15Z) - Boosting Monocular 3D Object Detection with Object-Centric Auxiliary
Depth Supervision [13.593246617391266]
本稿では,RGB画像に基づく3D検出器を,深度推定タスクに類似した深度予測損失で共同でトレーニングすることにより,RGB画像に基づく3D検出器の強化手法を提案する。
新たな物体中心深度予測損失は,3次元物体検出において重要な前景物体周辺の深度に焦点をあてる。
我々の深度回帰モデルは、物体の3次元信頼度を表すために、深度の不確かさを予測するためにさらに訓練される。
論文 参考訳(メタデータ) (2022-10-29T11:32:28Z) - Towards Accurate Reconstruction of 3D Scene Shape from A Single
Monocular Image [91.71077190961688]
まず、未知のスケールまで深さを予測し、単一の単眼画像からシフトする2段階のフレームワークを提案する。
次に、3Dポイントの雲のデータを利用して、奥行きの変化とカメラの焦点距離を予測し、3Dシーンの形状を復元します。
我々は9つの未知のデータセットで深度モデルを検証し、ゼロショット評価で最先端のパフォーマンスを達成する。
論文 参考訳(メタデータ) (2022-08-28T16:20:14Z) - RA-Depth: Resolution Adaptive Self-Supervised Monocular Depth Estimation [27.679479140943503]
本研究では,シーン深さのスケール不変性を学習し,自己教師付き単眼深度推定法(RA-Depth)を提案する。
RA-Depthは最先端の性能を達成し、解像度適応の優れた能力を示す。
論文 参考訳(メタデータ) (2022-07-25T08:49:59Z) - Learning Occlusion-Aware Coarse-to-Fine Depth Map for Self-supervised
Monocular Depth Estimation [11.929584800629673]
自己教師付き単眼深度推定のためのOcclusion-aware Coarse-to-Fine Depth Mapを学習するための新しいネットワークを提案する。
提案したOCFD-Netは,粗度深度マップの学習に離散深度制約を用いるだけでなく,シーン深度残差の学習にも連続深度制約を用いる。
論文 参考訳(メタデータ) (2022-03-21T12:43:42Z) - Probabilistic and Geometric Depth: Detecting Objects in Perspective [78.00922683083776]
3次元物体検出は、運転支援システムなどの様々な実用用途で必要とされる重要な機能である。
双眼視やLiDARに頼っている従来の設定に比べて、経済的な解決策として単眼3D検出が注目されているが、それでも満足のいく結果が得られていない。
本稿ではまず,この問題に関する系統的研究を行い,現在の単分子3次元検出問題をインスタンス深度推定問題として単純化できることを考察する。
論文 参考訳(メタデータ) (2021-07-29T16:30:33Z) - Learning Geometry-Guided Depth via Projective Modeling for Monocular 3D Object Detection [70.71934539556916]
射影モデルを用いて幾何学誘導深度推定を学習し, モノクル3次元物体検出を推し進める。
具体的には,モノクロ3次元物体検出ネットワークにおける2次元および3次元深度予測の投影モデルを用いた原理的幾何式を考案した。
本手法は, 適度なテスト設定において, 余分なデータを2.80%も加えることなく, 最先端単分子法の検出性能を著しく向上させる。
論文 参考訳(メタデータ) (2021-07-29T12:30:39Z) - Learning to Recover 3D Scene Shape from a Single Image [98.20106822614392]
まず,未知のスケールまで深さを予測し,単一の単眼画像からシフトする2段階フレームワークを提案する。
そして、3dポイントクラウドエンコーダを使って深度シフトと焦点距離を予測し、リアルな3dシーンの形状を復元します。
論文 参考訳(メタデータ) (2020-12-17T02:35:13Z) - Variational Monocular Depth Estimation for Reliability Prediction [12.951621755732544]
教師付き学習手法の代替として,単眼深度推定のための自己教師付き学習が広く研究されている。
従来はモデル構造の変更による深度推定の精度向上に成功している。
本稿では, 単眼深度推定のための変分モデルを理論的に定式化し, 推定深度画像の信頼性を推定する。
論文 参考訳(メタデータ) (2020-11-24T06:23:51Z) - Occlusion-Aware Depth Estimation with Adaptive Normal Constraints [85.44842683936471]
カラービデオから多フレーム深度を推定する新しい学習手法を提案する。
本手法は深度推定精度において最先端の手法より優れる。
論文 参考訳(メタデータ) (2020-04-02T07:10:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。