論文の概要: Hierarchical Normalization for Robust Monocular Depth Estimation
- arxiv url: http://arxiv.org/abs/2210.09670v1
- Date: Tue, 18 Oct 2022 08:18:29 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-19 14:56:51.560907
- Title: Hierarchical Normalization for Robust Monocular Depth Estimation
- Title(参考訳): ロバスト単眼深度推定のための階層正規化
- Authors: Chi Zhang, Wei Yin, Zhibin Wang, Gang Yu, Bin Fu, Chunhua Shen
- Abstract要約: 本研究では,空間情報と深度に基づいて,階層的に深度表現を正規化する新しいマルチスケール深度正規化手法を提案する。
実験の結果,提案手法は従来の正規化手法よりも著しく優れていた。
- 参考スコア(独自算出の注目度): 85.2304122536962
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In this paper, we address monocular depth estimation with deep neural
networks. To enable training of deep monocular estimation models with various
sources of datasets, state-of-the-art methods adopt image-level normalization
strategies to generate affine-invariant depth representations. However,
learning with image-level normalization mainly emphasizes the relations of
pixel representations with the global statistic in the images, such as the
structure of the scene, while the fine-grained depth difference may be
overlooked. In this paper, we propose a novel multi-scale depth normalization
method that hierarchically normalizes the depth representations based on
spatial information and depth distributions. Compared with previous
normalization strategies applied only at the holistic image level, the proposed
hierarchical normalization can effectively preserve the fine-grained details
and improve accuracy. We present two strategies that define the hierarchical
normalization contexts in the depth domain and the spatial domain,
respectively. Our extensive experiments show that the proposed normalization
strategy remarkably outperforms previous normalization methods, and we set new
state-of-the-art on five zero-shot transfer benchmark datasets.
- Abstract(参考訳): 本稿では,ディープニューラルネットワークを用いた単眼深度推定について述べる。
データセットの様々なソースを用いた深部単分子推定モデルのトレーニングを可能にするため、最先端の手法では画像レベルの正規化戦略を採用してアフィン不変深度表現を生成する。
しかし,画像レベルの正規化による学習は,画像中の画素表現と,シーンの構造などの大域的統計量との関係を主に重視する一方で,きめ細かい深度差は見過ごされる可能性がある。
本稿では,空間情報と深度分布に基づいて,階層的に深度表現を正規化する,新しいマルチスケール深度正規化手法を提案する。
全体像レベルでのみ適用される従来の正規化戦略と比較して,提案手法は細粒度を効果的に保存し,精度を向上させることができる。
深度領域と空間領域における階層的正規化コンテキストを定義する2つの戦略を提案する。
提案手法は,従来の正規化手法を著しく上回っており,ゼロショット転送ベンチマークデータセットを5つに設定した。
関連論文リスト
- Scale Propagation Network for Generalizable Depth Completion [16.733495588009184]
入力から出力までのスケールを伝搬する新しいスケール伝搬正規化法(SP-Norm)を提案する。
また,SP-NormとConvNeXt V2のバックボーンをベースとした新しいネットワークアーキテクチャを開発した。
我々のモデルは、最先端の手法と比較して、高速かつ低メモリで常に最高の精度を達成している。
論文 参考訳(メタデータ) (2024-10-24T03:53:06Z) - GeoWizard: Unleashing the Diffusion Priors for 3D Geometry Estimation from a Single Image [94.56927147492738]
単一画像から幾何学的属性を推定するための新しい生成基盤モデルであるGeoWizardを紹介する。
拡散前処理の活用は,資源利用における一般化,詳細な保存,効率性を著しく向上させることが示唆された。
本稿では,様々なシーンの複雑なデータ分布を,個別のサブディストリビューションに分離する,シンプルかつ効果的な戦略を提案する。
論文 参考訳(メタデータ) (2024-03-18T17:50:41Z) - DELAD: Deep Landweber-guided deconvolution with Hessian and sparse prior [0.22940141855172028]
本稿では,古典的反復法をディープラーニングアプリケーションに組み込んだ非盲検画像デコンボリューションモデルを提案する。
このアルゴリズムは、トレーニング可能な畳み込み層と統合され、復元された画像構造と詳細を強化する。
論文 参考訳(メタデータ) (2022-09-30T11:15:03Z) - Deep Recursive Embedding for High-Dimensional Data [9.611123249318126]
本稿では,DNN(Deep Neural Network)と高次元データ埋め込みのための数学誘導埋め込みルールを組み合わせることを提案する。
本稿では,高次元空間から低次元空間へのパラメトリックマッピングを学習可能な汎用ディープ埋め込みネットワーク(DEN)フレームワークを提案する。
論文 参考訳(メタデータ) (2021-10-31T23:22:33Z) - VolumeFusion: Deep Depth Fusion for 3D Scene Reconstruction [71.83308989022635]
本稿では、ディープニューラルネットワークを用いた従来の2段階フレームワークの複製により、解釈可能性と結果の精度が向上することを提唱する。
ネットワークは,1)深部MVS技術を用いた局所深度マップの局所計算,2)深部マップと画像の特徴を融合させて単一のTSDFボリュームを構築する。
異なる視点から取得した画像間のマッチング性能を改善するために,PosedConvと呼ばれる回転不変な3D畳み込みカーネルを導入する。
論文 参考訳(メタデータ) (2021-08-19T11:33:58Z) - Deep Reparametrization of Multi-Frame Super-Resolution and Denoising [167.42453826365434]
本稿では,多フレーム画像復元作業によく用いられる最大後部定式化の深部再パラメータ化を提案する。
提案手法は,学習された誤差メトリックと,対象画像の潜在表現を導入することによって導かれる。
我々は、バースト復調およびバースト超解像データセットに関する包括的な実験を通して、我々のアプローチを検証する。
論文 参考訳(メタデータ) (2021-08-18T17:57:02Z) - Semantic-Guided Representation Enhancement for Self-supervised Monocular
Trained Depth Estimation [39.845944724079814]
自己教師付き深度推定は,画像列のみを入力として,高品質の深度マップを作成する上で大きな効果を示した。
しかし、その性能は通常、限界深度表現能力のために境界領域や細い構造を持つ物体を推定する際に低下する。
局所的および大域的な深度特徴表現を促進する意味誘導深度表現拡張法を提案する。
論文 参考訳(メタデータ) (2020-12-15T02:24:57Z) - Depth image denoising using nuclear norm and learning graph model [107.51199787840066]
グループベース画像復元法は,パッチ間の類似性収集に有効である。
各パッチに対して、検索ウィンドウ内で最もよく似たパッチを見つけ、グループ化する。
提案手法は, 主観的, 客観的両面において, 最先端の復調法よりも優れている。
論文 参考訳(メタデータ) (2020-08-09T15:12:16Z) - Deformable spatial propagation network for depth completion [2.5306673456895306]
本稿では,各画素に対して異なる受容場と親和性行列を適応的に生成する変形可能な空間伝搬ネットワーク(DSPN)を提案する。
これにより、ネットワークは伝播のためのより少ないがより関連性の高い情報を得ることができる。
論文 参考訳(メタデータ) (2020-07-08T16:39:50Z) - Optimization Theory for ReLU Neural Networks Trained with Normalization
Layers [82.61117235807606]
ディープニューラルネットワークの成功は、部分的には正規化レイヤの使用によるものだ。
我々の分析は、正規化の導入がランドスケープをどのように変化させ、より高速なアクティベーションを実現するかを示している。
論文 参考訳(メタデータ) (2020-06-11T23:55:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。