論文の概要: Depth Completion using Plane-Residual Representation
- arxiv url: http://arxiv.org/abs/2104.07350v1
- Date: Thu, 15 Apr 2021 10:17:53 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-16 14:55:43.134231
- Title: Depth Completion using Plane-Residual Representation
- Title(参考訳): 平面再現表現を用いた奥行き補完
- Authors: Byeong-Uk Lee, Kyunghyun Lee, In So Kweon
- Abstract要約: 深度情報を最も近い深度平面ラベル$p$と残値$r$で解釈する新しい方法を紹介し,これをPlane-Residual (PR)表現と呼ぶ。
PR表現で深度情報を解釈し,それに対応する深度補完網を用いて,高速な計算により深度補完性能を向上させることができた。
- 参考スコア(独自算出の注目度): 84.63079529738924
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The basic framework of depth completion is to predict a pixel-wise dense
depth map using very sparse input data. In this paper, we try to solve this
problem in a more effective way, by reformulating the regression-based depth
estimation problem into a combination of depth plane classification and
residual regression. Our proposed approach is to initially densify sparse depth
information by figuring out which plane a pixel should lie among a number of
discretized depth planes, and then calculate the final depth value by
predicting the distance from the specified plane. This will help the network to
lessen the burden of directly regressing the absolute depth information from
none, and to effectively obtain more accurate depth prediction result with less
computation power and inference time. To do so, we firstly introduce a novel
way of interpreting depth information with the closest depth plane label $p$
and a residual value $r$, as we call it, Plane-Residual (PR) representation. We
also propose a depth completion network utilizing PR representation consisting
of a shared encoder and two decoders, where one classifies the pixel's depth
plane label, while the other one regresses the normalized distance from the
classified depth plane. By interpreting depth information in PR representation
and using our corresponding depth completion network, we were able to acquire
improved depth completion performance with faster computation, compared to
previous approaches.
- Abstract(参考訳): 深度補完の基本的な枠組みは、非常にスパースな入力データを用いてピクセル単位の深度マップを予測することである。
本稿では,回帰に基づく深さ推定問題を深度平面分類と回帰回帰の組合せに再構成することにより,この問題をより効果的に解決しようとする。
提案手法は,複数の離散した深度面の間にある画素がどの面にあるべきかを見極め,その距離を予測して最終深さ値を計算することで,まずスパース深度情報を密度化する。
これにより、ネットワークは絶対深度情報をどこからでも直接退避させる負担を軽減し、より正確な深度予測結果をより少ない計算力と推論時間で効果的に得ることができる。
まず、最も近い深度平面ラベル$p$と残値$r$で深度情報を解釈する新しい方法、Plane-Residual (PR)表現を導入する。
また、共有エンコーダと2つのデコーダからなるPR表現を利用して、画素の深度平面ラベルを分類し、一方は分類された深度平面から正規化距離を回帰する深度完備化ネットワークを提案する。
PR表現で深度情報を解釈し,それに対応する深度補完網を用いて,より高速な計算により深度補完性能を向上させることができた。
関連論文リスト
- Temporal Lidar Depth Completion [0.08192907805418582]
PENetは, 再発の恩恵を受けるために, 最新の手法であるPENetをどう修正するかを示す。
提案アルゴリズムは,KITTI深度補完データセットの最先端結果を実現する。
論文 参考訳(メタデータ) (2024-06-17T08:25:31Z) - Progressive Depth Decoupling and Modulating for Flexible Depth Completion [28.693100885012008]
画像誘導深度補正は、疎LiDARデータとRGB画像から高密度深度マップを生成することを目的としている。
近年の手法では,2つのサブタスク(深度離散化と確率予測)で分類問題として再検討し,有望な性能を示した。
本研究では, 深度範囲をビンに漸進的に分離し, マルチスケールの深度マップを適応的に生成するプログレッシブ・ディープ・デカップリング・変調ネットワークを提案する。
論文 参考訳(メタデータ) (2024-05-15T13:45:33Z) - P3Depth: Monocular Depth Estimation with a Piecewise Planarity Prior [133.76192155312182]
本研究では,コプラナー画素からの情報を選択的に活用して予測深度を改善する手法を提案する。
本手法の広範な評価により, 教師付き単分子深度推定法において, 新たな手法の確立が期待できる。
論文 参考訳(メタデータ) (2022-04-05T10:03:52Z) - Sparse Auxiliary Networks for Unified Monocular Depth Prediction and
Completion [56.85837052421469]
コスト効率のよいセンサで得られたデータからシーン形状を推定することは、ロボットや自動運転車にとって鍵となる。
本稿では,1枚のRGB画像から,低コストな能動深度センサによるスパース計測により,深度を推定する問題について検討する。
sparse networks (sans) は,深さ予測と完了という2つのタスクをmonodepthネットワークで実行可能にする,新しいモジュールである。
論文 参考訳(メタデータ) (2021-03-30T21:22:26Z) - CodeVIO: Visual-Inertial Odometry with Learned Optimizable Dense Depth [83.77839773394106]
本稿では,軽量で密結合の深い深度ネットワークと視覚慣性オドメトリーシステムを提案する。
我々は、初期深度予測の精度を高めるために、以前にVIOから切り離されたスパース特徴を持つネットワークを提供する。
本稿では,ネットワークとコードヤコビアンでのみGPUアクセラレーションを活用しながら,シングルスレッド実行でリアルタイムに動作可能であることを示す。
論文 参考訳(メタデータ) (2020-12-18T09:42:54Z) - Efficient Depth Completion Using Learned Bases [94.0808155168311]
深度補正のための新しい大域的幾何制約を提案する。
低次元部分空間上によく配置される深さ写像を仮定することにより、高密度深度写像は全解像度の主深度基底の重み付け和で近似することができる。
論文 参考訳(メタデータ) (2020-12-02T11:57:37Z) - Attention Aware Cost Volume Pyramid Based Multi-view Stereo Network for
3D Reconstruction [12.728154351588053]
マルチビュー画像から3次元再構成を行うための効率的なマルチビューステレオ(MVS)ネットワークを提案する。
高分解能深度を実現するために粗粒度深度推論戦略を導入する。
論文 参考訳(メタデータ) (2020-11-25T13:34:11Z) - Deep Multi-view Depth Estimation with Predicted Uncertainty [11.012201499666503]
我々は、高密度光フローネットワークを用いて対応を計算し、点雲を三角測量して初期深度マップを得る。
三角測量の精度をさらに高めるため,画像の文脈に基づく初期深度マップを最適化する深度補正ネットワーク(DRN)を導入する。
論文 参考訳(メタデータ) (2020-11-19T00:22:09Z) - Occlusion-Aware Depth Estimation with Adaptive Normal Constraints [85.44842683936471]
カラービデオから多フレーム深度を推定する新しい学習手法を提案する。
本手法は深度推定精度において最先端の手法より優れる。
論文 参考訳(メタデータ) (2020-04-02T07:10:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。