論文の概要: Direct Depth Learning Network for Stereo Matching
- arxiv url: http://arxiv.org/abs/2012.05570v1
- Date: Thu, 10 Dec 2020 10:33:57 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-15 06:23:48.578496
- Title: Direct Depth Learning Network for Stereo Matching
- Title(参考訳): ステレオマッチングのための直接深度学習ネットワーク
- Authors: Hong Zhang and Haojie Li and Shenglun Chen and Tiantian Yan and Zhihui
Wang and Guo Lu and Wanli Ouyang
- Abstract要約: ステレオマッチングのための新しいダイレクトディープス学習ネットワーク(DDL-Net)が設計されている。
DDL-Netは、粗度推定段階と適応勾配深度補正段階の2段階からなる。
我々は,DDL-NetがSceneFlowデータセットで25%,DrivingStereoデータセットで12%の平均的な改善を実現していることを示す。
- 参考スコア(独自算出の注目度): 79.3665881702387
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Being a crucial task of autonomous driving, Stereo matching has made great
progress in recent years. Existing stereo matching methods estimate disparity
instead of depth. They treat the disparity errors as the evaluation metric of
the depth estimation errors, since the depth can be calculated from the
disparity according to the triangulation principle. However, we find that the
error of the depth depends not only on the error of the disparity but also on
the depth range of the points. Therefore, even if the disparity error is low,
the depth error is still large, especially for the distant points. In this
paper, a novel Direct Depth Learning Network (DDL-Net) is designed for stereo
matching. DDL-Net consists of two stages: the Coarse Depth Estimation stage and
the Adaptive-Grained Depth Refinement stage, which are all supervised by depth
instead of disparity. Specifically, Coarse Depth Estimation stage uniformly
samples the matching candidates according to depth range to construct cost
volume and output coarse depth. Adaptive-Grained Depth Refinement stage
performs further matching near the coarse depth to correct the imprecise
matching and wrong matching. To make the Adaptive-Grained Depth Refinement
stage robust to the coarse depth and adaptive to the depth range of the points,
the Granularity Uncertainty is introduced to Adaptive-Grained Depth Refinement
stage. Granularity Uncertainty adjusts the matching range and selects the
candidates' features according to coarse prediction confidence and depth range.
We verify the performance of DDL-Net on SceneFlow dataset and DrivingStereo
dataset by different depth metrics. Results show that DDL-Net achieves an
average improvement of 25% on the SceneFlow dataset and $12\%$ on the
DrivingStereo dataset comparing the classical methods. More importantly, we
achieve state-of-the-art accuracy at a large distance.
- Abstract(参考訳): ステレオマッチングは、自動運転の重要なタスクであり、近年は大きな進歩を遂げている。
既存のステレオマッチング法は、深さの代わりに差を推定する。
三角法則に従って深度から深度を算出できるため, 深度推定誤差の評価基準として不一致誤差を扱い, 深度推定誤差を評価する。
しかし, 深さの誤差は, 差の誤差だけでなく, 点の深さ範囲にも依存することがわかった。
したがって、たとえ差分誤差が低いとしても、特に遠点の場合、深さ誤差は大きい。
本稿では,ステレオマッチングのための新しい直接深層学習ネットワーク(ddl-net)を提案する。
DDL-Netは、粗度推定段階と適応勾配深度補正段階の2段階で構成されており、これらは全て不均一性ではなく深さによって監督されている。
特に、粗深さ推定段階は、対応する候補を深さ範囲に応じて均一にサンプリングし、コストボリュームを構築し、粗深さを出力する。
適応細粒度微細化ステージは粗深さ付近でさらなるマッチングを行い、不正確な一致と誤一致を補正する。
粗い深さに頑健で、各点の深さ範囲に適応させるために、アダプティブグラインドデプスリファインメントステージにグラニュラリティ不確実性を導入する。
粒度不確かさはマッチング範囲を調整し、粗い予測信頼度と深さ範囲に応じて候補の特徴を選択する。
SceneFlowデータセットとDrivingStereoデータセットにおけるDDL-Netの性能を、異なる深さのメトリクスで検証する。
その結果、DDL-NetはSceneFlowデータセットで25%、DrivingStereoデータセットで12.%の平均的な改善を実現していることがわかった。
さらに重要なことは,大距離で最先端の精度を実現することだ。
関連論文リスト
- ARAI-MVSNet: A multi-view stereo depth estimation network with adaptive
depth range and depth interval [19.28042366225802]
マルチビューステレオ(MVS)は幾何学的コンピュータビジョンの基本的な問題である。
適応的な全画素深度範囲と深度間隔を実現するために,新しい多段粗大化フレームワークを提案する。
我々のモデルは最先端の性能を達成し、競争一般化能力を得る。
論文 参考訳(メタデータ) (2023-08-17T14:52:11Z) - Depth Refinement for Improved Stereo Reconstruction [13.941756438712382]
立体画像からの深度推定の現在の技術は、なおも内蔵の欠点に悩まされている。
簡単な解析により、深度誤差は物体の距離に2乗比例することが明らかになった。
本研究では,深度推定に改良ネットワークを用いた簡易かつ効果的な手法を提案する。
論文 参考訳(メタデータ) (2021-12-15T12:21:08Z) - Robust Depth Completion with Uncertainty-Driven Loss Functions [60.9237639890582]
本研究では,不確実性による損失関数を導入し,深度補修の堅牢性を改善し,深度補修の不確実性に対処する。
提案手法は,KITTI深度評価ベンチマークでテストされ,MAE, IMAE, IRMSEの計測値を用いて最先端のロバスト性性能を達成した。
論文 参考訳(メタデータ) (2021-12-15T05:22:34Z) - Depth Completion using Plane-Residual Representation [84.63079529738924]
深度情報を最も近い深度平面ラベル$p$と残値$r$で解釈する新しい方法を紹介し,これをPlane-Residual (PR)表現と呼ぶ。
PR表現で深度情報を解釈し,それに対応する深度補完網を用いて,高速な計算により深度補完性能を向上させることができた。
論文 参考訳(メタデータ) (2021-04-15T10:17:53Z) - PLADE-Net: Towards Pixel-Level Accuracy for Self-Supervised Single-View
Depth Estimation with Neural Positional Encoding and Distilled Matting Loss [49.66736599668501]
PLADE-Netと呼ばれる自己監視型単視点画素レベルの高精度深度推定ネットワークを提案する。
提案手法は,KITTIデータセットの$delta1$測定値の95%を超え,前例のない精度を示す。
論文 参考訳(メタデータ) (2021-03-12T15:54:46Z) - Boundary-induced and scene-aggregated network for monocular depth
prediction [20.358133522462513]
本稿では,1枚のRGB画像の深度を推定するための境界誘導・Scene-aggregated Network (BS-Net)を提案する。
NYUD v2データセットとxffthe iBims-1データセットに関するいくつかの実験結果は、提案手法の最先端性能を示している。
論文 参考訳(メタデータ) (2021-02-26T01:43:17Z) - Deep Multi-view Depth Estimation with Predicted Uncertainty [11.012201499666503]
我々は、高密度光フローネットワークを用いて対応を計算し、点雲を三角測量して初期深度マップを得る。
三角測量の精度をさらに高めるため,画像の文脈に基づく初期深度マップを最適化する深度補正ネットワーク(DRN)を導入する。
論文 参考訳(メタデータ) (2020-11-19T00:22:09Z) - Faster Depth-Adaptive Transformers [71.20237659479703]
深さ適応型ニューラルネットワークは入力単語の硬さに応じて動的に深さを調整することができる。
従来の作業は一般的に、計算が各レイヤで続行するか停止するかを決定するために停止ユニットを構築する。
本稿では,停止ユニットを除去し,必要な深さを事前に推定し,より高速な深度適応モデルを生成する。
論文 参考訳(メタデータ) (2020-04-27T15:08:10Z) - Occlusion-Aware Depth Estimation with Adaptive Normal Constraints [85.44842683936471]
カラービデオから多フレーム深度を推定する新しい学習手法を提案する。
本手法は深度推定精度において最先端の手法より優れる。
論文 参考訳(メタデータ) (2020-04-02T07:10:45Z) - DELTAS: Depth Estimation by Learning Triangulation And densification of
Sparse points [14.254472131009653]
多視点ステレオ (MVS) は, 能動深度センシングの精度と単眼深度推定の実用性の間の黄金平均値である。
3次元畳み込みニューラルネットワーク(CNN)を用いたコストボリュームベースのアプローチにより、MVSシステムの精度が大幅に向上した。
まず、(a)興味点の記述子を検出して評価し、次に(b)興味点の小さな集合をマッチングして三角測量し、最後に(c)CNNを用いてこのスパースな3D点の集合を密度化することで、効率的な深さ推定手法を提案する。
論文 参考訳(メタデータ) (2020-03-19T17:56:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。