論文の概要: Depth Map Decomposition for Monocular Depth Estimation
- arxiv url: http://arxiv.org/abs/2208.10762v1
- Date: Tue, 23 Aug 2022 06:49:54 GMT
- ステータス: 処理完了
- システム内更新日: 2022-08-24 13:19:55.005543
- Title: Depth Map Decomposition for Monocular Depth Estimation
- Title(参考訳): 単眼深度推定のための深度マップ分解
- Authors: Jinyoung Jun, Jae-Han Lee, Chul Lee, and Chang-Su Kim
- Abstract要約: 本稿では,メートル法深度マップを正規化深度マップとスケール特徴に分解する,単眼深度推定のための新しいアルゴリズムを提案する。
提案するネットワークは,G-Net,N-Net,M-Netと呼ばれる共有エンコーダと3つのデコーダで構成され,それぞれ勾配マップ,正規化深度マップ,計量深度マップを推定する。
- 参考スコア(独自算出の注目度): 40.022879582211786
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We propose a novel algorithm for monocular depth estimation that decomposes a
metric depth map into a normalized depth map and scale features. The proposed
network is composed of a shared encoder and three decoders, called G-Net,
N-Net, and M-Net, which estimate gradient maps, a normalized depth map, and a
metric depth map, respectively. M-Net learns to estimate metric depths more
accurately using relative depth features extracted by G-Net and N-Net. The
proposed algorithm has the advantage that it can use datasets without metric
depth labels to improve the performance of metric depth estimation.
Experimental results on various datasets demonstrate that the proposed
algorithm not only provides competitive performance to state-of-the-art
algorithms but also yields acceptable results even when only a small amount of
metric depth data is available for its training.
- Abstract(参考訳): 本稿では,メートル法深度マップを正規化深度マップとスケール特徴に分解する単眼深度推定アルゴリズムを提案する。
提案するネットワークは,G-Net,N-Net,M-Netと呼ばれる共有エンコーダと3つのデコーダで構成され,それぞれ勾配マップ,正規化深度マップ,計量深度マップを推定する。
M-Netは、G-NetとN-Netによって抽出された相対深度特徴を用いて、より正確にメートル法深さを推定することを学ぶ。
提案アルゴリズムは,距離深度ラベルのないデータセットを用いて距離深度推定の性能を向上させることができるという利点がある。
種々のデータセットに対する実験結果から,提案アルゴリズムは最先端のアルゴリズムと競合する性能を提供するだけでなく,少量のメートル法深度データしか取得できない場合でも許容できる結果が得られることが示された。
関連論文リスト
- Temporal Lidar Depth Completion [0.08192907805418582]
PENetは, 再発の恩恵を受けるために, 最新の手法であるPENetをどう修正するかを示す。
提案アルゴリズムは,KITTI深度補完データセットの最先端結果を実現する。
論文 参考訳(メタデータ) (2024-06-17T08:25:31Z) - Monocular Visual-Inertial Depth Estimation [66.71452943981558]
単眼深度推定と視覚慣性計測を統合した視覚慣性深度推定パイプラインを提案する。
提案手法は, 疎度度に対する大域的スケールとシフトアライメントを行い, 続いて学習に基づく高密度アライメントを行う。
本研究では,TartanAir と VOID のデータセットを用いて,密集したスケールアライメントによるRMSE の最大30%の削減を観測した。
論文 参考訳(メタデータ) (2023-03-21T18:47:34Z) - 3DVNet: Multi-View Depth Prediction and Volumetric Refinement [68.68537312256144]
3DVNetは、新しいマルチビューステレオ(MVS)深度予測法である。
私たちのキーとなるアイデアは、粗い深度予測を反復的に更新する3Dシーンモデリングネットワークを使用することです。
本手法は, 深度予測と3次元再構成の両指標において, 最先端の精度を超えることを示す。
論文 参考訳(メタデータ) (2021-12-01T00:52:42Z) - CodeVIO: Visual-Inertial Odometry with Learned Optimizable Dense Depth [83.77839773394106]
本稿では,軽量で密結合の深い深度ネットワークと視覚慣性オドメトリーシステムを提案する。
我々は、初期深度予測の精度を高めるために、以前にVIOから切り離されたスパース特徴を持つネットワークを提供する。
本稿では,ネットワークとコードヤコビアンでのみGPUアクセラレーションを活用しながら,シングルスレッド実行でリアルタイムに動作可能であることを示す。
論文 参考訳(メタデータ) (2020-12-18T09:42:54Z) - Efficient Depth Completion Using Learned Bases [94.0808155168311]
深度補正のための新しい大域的幾何制約を提案する。
低次元部分空間上によく配置される深さ写像を仮定することにより、高密度深度写像は全解像度の主深度基底の重み付け和で近似することができる。
論文 参考訳(メタデータ) (2020-12-02T11:57:37Z) - Attention Aware Cost Volume Pyramid Based Multi-view Stereo Network for
3D Reconstruction [12.728154351588053]
マルチビュー画像から3次元再構成を行うための効率的なマルチビューステレオ(MVS)ネットワークを提案する。
高分解能深度を実現するために粗粒度深度推論戦略を導入する。
論文 参考訳(メタデータ) (2020-11-25T13:34:11Z) - Learning a Geometric Representation for Data-Efficient Depth Estimation
via Gradient Field and Contrastive Loss [29.798579906253696]
本研究では、コンブネットがラベルのない画像で幾何学的情報を抽出するのを支援するために、運動量差の少ない勾配に基づく自己教師付き学習アルゴリズムを提案する。
提案手法は,従来の自己教師付き学習アルゴリズムよりも優れ,ラベル付きデータの効率を3倍に向上させる。
論文 参考訳(メタデータ) (2020-11-06T06:47:19Z) - Balanced Depth Completion between Dense Depth Inference and Sparse Range
Measurements via KISS-GP [14.158132769768578]
密集した正確な深度マップを推定することは、自動運転とロボット工学にとって重要な要件である。
近年のディープラーニングの進歩により、単一の画像から全解像度での深度推定が可能になった。
この驚くべき結果にもかかわらず、多くのディープラーニングベースの単眼深度推定アルゴリズムは、その精度をメーターレベルの推定誤差に保たない。
論文 参考訳(メタデータ) (2020-08-12T08:07:55Z) - Occlusion-Aware Depth Estimation with Adaptive Normal Constraints [85.44842683936471]
カラービデオから多フレーム深度を推定する新しい学習手法を提案する。
本手法は深度推定精度において最先端の手法より優れる。
論文 参考訳(メタデータ) (2020-04-02T07:10:45Z) - DELTAS: Depth Estimation by Learning Triangulation And densification of
Sparse points [14.254472131009653]
多視点ステレオ (MVS) は, 能動深度センシングの精度と単眼深度推定の実用性の間の黄金平均値である。
3次元畳み込みニューラルネットワーク(CNN)を用いたコストボリュームベースのアプローチにより、MVSシステムの精度が大幅に向上した。
まず、(a)興味点の記述子を検出して評価し、次に(b)興味点の小さな集合をマッチングして三角測量し、最後に(c)CNNを用いてこのスパースな3D点の集合を密度化することで、効率的な深さ推定手法を提案する。
論文 参考訳(メタデータ) (2020-03-19T17:56:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。