論文の概要: Monocular Depth Estimation with Sharp Boundary
- arxiv url: http://arxiv.org/abs/2110.05885v1
- Date: Tue, 12 Oct 2021 10:55:12 GMT
- ステータス: 処理完了
- システム内更新日: 2021-10-13 20:56:00.515685
- Title: Monocular Depth Estimation with Sharp Boundary
- Title(参考訳): シャープ境界を用いた単眼深度推定
- Authors: Xin Yang, Qingling Chang, Xinlin Liu, and Yan Cui
- Abstract要約: 境界のぼかし問題は、まず、境界情報と構造情報を含む低レベルな特徴が、畳み込み過程の間、より深いネットワークで失われる、という2つの要因によって引き起こされる。
第2に、バックプロパゲーションにおいて、境界領域のわずかな部分による境界領域の誤差を無視する。
本研究では,境界の深さ値の影響に注意を払うために,境界対応深度損失関数を提案する。
- 参考スコア(独自算出の注目度): 4.873879696568641
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Monocular depth estimation is the base task in computer vision. It has a
tremendous development in the decade with the development of deep learning. But
the boundary blur of the depth map is still a serious problem. Research finds
the boundary blur problem is mainly caused by two factors, first, the low-level
features containing boundary and structure information may loss in deeper
networks during the convolution process., second, the model ignores the errors
introduced by the boundary area due to the few portions of the boundary in the
whole areas during the backpropagation. In order to mitigate the boundary blur
problem, we focus on the above two impact factors. Firstly, we design a scene
understanding module to learn the global information with low- and high-level
features, and then to transform the global information to different scales with
our proposed scale transform module according to the different phases in the
decoder. Secondly, we propose a boundary-aware depth loss function to pay
attention to the effects of the boundary's depth value. The extensive
experiments show that our method can predict the depth maps with clearer
boundaries, and the performance of the depth accuracy base on NYU-depth v2 and
SUN RGB-D is competitive.
- Abstract(参考訳): 単眼深度推定はコンピュータビジョンにおける基本課題である。
ディープラーニングの開発によって、この10年間で大きな発展を遂げています。
しかし、深度マップの境界線はいまだに深刻な問題である。
まず、境界情報と構造情報を含む低レベル特徴は、畳み込みの過程でより深いネットワークで失われる可能性がある。
第二に、モデルでは、バックプロパゲーション中の領域全体の境界のわずかな部分のため、境界領域によってもたらされる誤差を無視する。
境界ぼけ問題を緩和するために,上記の2つの影響因子に着目した。
まず,低レベル・高レベルの特徴を持つグローバル情報を学習するためのシーン理解モジュールを設計し,デコーダの異なるフェーズに応じて,提案したスケール変換モジュールを用いてグローバル情報を異なるスケールに変換する。
次に,境界を認識できる深さ損失関数を提案し,境界の深さ値の影響に注意する。
広範に実験した結果,より明確な境界を持つ深度マップの予測が可能であり,NYU-deepth v2およびSUN RGB-Dにおける深度精度ベースの性能は競争力が高いことがわかった。
関連論文リスト
- Deep Neural Networks for Accurate Depth Estimation with Latent Space Features [0.0]
本研究では,深部畳み込みニューラルネットワークにおける潜時空間特徴を利用した新しい深度推定フレームワークを提案する。
提案モデルでは,2つのエンコーダ・デコーダアーキテクチャを特徴とし,色から深度への変換と深度への変換が可能である。
フレームワークはNYU Depth V2データセットを使用して徹底的にテストされている。
論文 参考訳(メタデータ) (2025-02-17T13:11:35Z) - DepthLab: From Partial to Complete [80.58276388743306]
不足する値は、幅広いアプリケーションにわたる深度データにとって共通の課題である。
この作業は、イメージ拡散プリエントを利用した基礎深度塗装モデルであるDepthLabと、このギャップを埋めるものだ。
提案手法は,3Dシーンのインペイント,テキストから3Dシーン生成,DUST3Rによるスパースビュー再構成,LiDAR深度補完など,様々なダウンストリームタスクにおいて有用であることを示す。
論文 参考訳(メタデータ) (2024-12-24T04:16:38Z) - Pyramid Feature Attention Network for Monocular Depth Prediction [8.615717738037823]
本稿では,高レベルな文脈特徴と低レベルな空間特徴を改善するために,ピラミッド特徴注意ネットワーク(PFANet)を提案する。
提案手法は,KITTIデータセット上での最先端の手法よりも優れている。
論文 参考訳(メタデータ) (2024-03-03T08:33:23Z) - Non-parametric Depth Distribution Modelling based Depth Inference for
Multi-view Stereo [43.415242967722804]
最近のコストボリュームピラミッドに基づくディープニューラルネットワークは、多視点ステレオからの深度推論に高解像度の画像を効率的に活用する可能性を解き放った。
一般に、これらのアプローチは各ピクセルの深さが一様分布に従うと仮定する。
本研究では,非パラメトリック深度分布モデルを用いて,一様および多モード分布の画素を扱うコストボリュームを構築することを提案する。
論文 参考訳(メタデータ) (2022-05-08T05:13:04Z) - RGB-Depth Fusion GAN for Indoor Depth Completion [29.938869342958125]
本稿では,RGBと不完全深度画像のペアを入力として,高密度で完成度の高い深度マップを推定する,新しい2分岐エンドツーエンド融合ネットワークを設計する。
あるブランチでは、RGB画像を微細なテクスチャ化深度マップに転送するRGB深度融合GANを提案する。
他方のブランチでは、W-AdaINという名前の適応核融合モジュールを採用し、2つのブランチにまたがる特徴を伝播させます。
論文 参考訳(メタデータ) (2022-03-21T10:26:38Z) - BridgeNet: A Joint Learning Network of Depth Map Super-Resolution and
Monocular Depth Estimation [60.34562823470874]
本稿では,DSR(Deep Map Super- resolution)とMDE(Monocular depth Estimation)の併用学習ネットワークを提案する。
1つは特徴符号化プロセスのために設計された高周波アテンションブリッジ(HABdg)で、これはDSRタスクを誘導するMDEタスクの高周波情報を学ぶ。
もう一つは、深度マップ再構築プロセス用に設計されたコンテンツガイダンスブリッジ(CGBdg)であり、MDEタスクのためにDSRタスクから学んだコンテンツガイダンスを提供する。
論文 参考訳(メタデータ) (2021-07-27T01:28:23Z) - Deep Two-View Structure-from-Motion Revisited [83.93809929963969]
2次元構造移動(SfM)は3次元再構成と視覚SLAMの基礎となる。
古典パイプラインの適切性を活用することで,深部2視点sfmの問題を再検討することを提案する。
本手法は,1)2つのフレーム間の密対応を予測する光フロー推定ネットワーク,2)2次元光フロー対応から相対カメラポーズを計算する正規化ポーズ推定モジュール,3)エピポーラ幾何を利用して探索空間を縮小し,密対応を洗練し,相対深度マップを推定するスケール不変深さ推定ネットワークからなる。
論文 参考訳(メタデータ) (2021-04-01T15:31:20Z) - Boundary-induced and scene-aggregated network for monocular depth
prediction [20.358133522462513]
本稿では,1枚のRGB画像の深度を推定するための境界誘導・Scene-aggregated Network (BS-Net)を提案する。
NYUD v2データセットとxffthe iBims-1データセットに関するいくつかの実験結果は、提案手法の最先端性能を示している。
論文 参考訳(メタデータ) (2021-02-26T01:43:17Z) - Accurate RGB-D Salient Object Detection via Collaborative Learning [101.82654054191443]
RGB-Dサリエンシ検出は、いくつかの課題シナリオにおいて素晴らしい能力を示している。
本稿では,エッジ,深度,塩分濃度をより効率的に活用する新しい協調学習フレームワークを提案する。
論文 参考訳(メタデータ) (2020-07-23T04:33:36Z) - Occlusion-Aware Depth Estimation with Adaptive Normal Constraints [85.44842683936471]
カラービデオから多フレーム深度を推定する新しい学習手法を提案する。
本手法は深度推定精度において最先端の手法より優れる。
論文 参考訳(メタデータ) (2020-04-02T07:10:45Z) - DPANet: Depth Potentiality-Aware Gated Attention Network for RGB-D
Salient Object Detection [107.96418568008644]
そこで我々は,DPANetという新しいネットワークを提案し,深度マップの可能性を明確にモデル化し,モーダル間の相補性を効果的に統合する。
深度ポテンシャル知覚を導入することにより、ネットワークは深度情報のポテンシャルを学習ベースで知覚することができる。
論文 参考訳(メタデータ) (2020-03-19T07:27:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。