論文の概要: LocalBins: Improving Depth Estimation by Learning Local Distributions
- arxiv url: http://arxiv.org/abs/2203.15132v1
- Date: Mon, 28 Mar 2022 22:40:16 GMT
- ステータス: 処理完了
- システム内更新日: 2022-03-31 09:44:27.934173
- Title: LocalBins: Improving Depth Estimation by Learning Local Distributions
- Title(参考訳): LocalBins: 局所分布学習による深さ推定の改善
- Authors: Shariq Farooq Bhat, Ibraheem Alhashim, Peter Wonka
- Abstract要約: 我々は,入力画像の深さ値のグローバル分布を推定するAdaBins上に構築する。
我々は各画素における局所地区の深度分布を推定する。
結果は、NYU-Depth V2データセットのすべてのメトリクスにおいて、最先端よりも明確に改善されていることを示している。
- 参考スコア(独自算出の注目度): 43.07310038858445
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We propose a novel architecture for depth estimation from a single image. The
architecture itself is based on the popular encoder-decoder architecture that
is frequently used as a starting point for all dense regression tasks. We build
on AdaBins which estimates a global distribution of depth values for the input
image and evolve the architecture in two ways. First, instead of predicting
global depth distributions, we predict depth distributions of local
neighborhoods at every pixel. Second, instead of predicting depth distributions
only towards the end of the decoder, we involve all layers of the decoder. We
call this new architecture LocalBins. Our results demonstrate a clear
improvement over the state-of-the-art in all metrics on the NYU-Depth V2
dataset. Code and pretrained models will be made publicly available.
- Abstract(参考訳): 単一画像からの深度推定のための新しいアーキテクチャを提案する。
アーキテクチャ自体は、すべての高密度回帰タスクの出発点として頻繁に使用される一般的なエンコーダ・デコーダアーキテクチャに基づいている。
我々は,入力画像の深さ値のグローバル分布を推定するAdaBins上に構築し,アーキテクチャを2つの方法で進化させる。
まず,グローバルな深度分布を予測する代わりに,各画素の局所的な深度分布を予測する。
第二に、デコーダの端にのみ深さ分布を予測する代わりに、デコーダのすべての層を巻き込みます。
この新しいアーキテクチャをLocalBinsと呼びます。
以上の結果から,NYU-Depth V2データセットのすべての指標において,最先端よりも明確な改善が示された。
コードと事前訓練されたモデルは公開されます。
関連論文リスト
- Scale Propagation Network for Generalizable Depth Completion [16.733495588009184]
入力から出力までのスケールを伝搬する新しいスケール伝搬正規化法(SP-Norm)を提案する。
また,SP-NormとConvNeXt V2のバックボーンをベースとした新しいネットワークアーキテクチャを開発した。
我々のモデルは、最先端の手法と比較して、高速かつ低メモリで常に最高の精度を達成している。
論文 参考訳(メタデータ) (2024-10-24T03:53:06Z) - Progressive Depth Decoupling and Modulating for Flexible Depth Completion [28.693100885012008]
画像誘導深度補正は、疎LiDARデータとRGB画像から高密度深度マップを生成することを目的としている。
近年の手法では,2つのサブタスク(深度離散化と確率予測)で分類問題として再検討し,有望な性能を示した。
本研究では, 深度範囲をビンに漸進的に分離し, マルチスケールの深度マップを適応的に生成するプログレッシブ・ディープ・デカップリング・変調ネットワークを提案する。
論文 参考訳(メタデータ) (2024-05-15T13:45:33Z) - SCALAR-NeRF: SCAlable LARge-scale Neural Radiance Fields for Scene
Reconstruction [66.69049158826677]
本稿では,スケーラブルな大規模ニューラルシーン再構築に適した新しいフレームワークであるSCALAR-NeRFを紹介する。
ニューラル表現をエンコーダ・デコーダアーキテクチャとして構成し、そこではエンコーダが3次元点座標を処理してエンコーダ化された特徴を生成する。
そこで本研究では,これらの局所モデルから出力を抽出し,最終的な再構築を実現するための効率的かつ効率的な手法を提案する。
論文 参考訳(メタデータ) (2023-11-28T10:18:16Z) - Transferring to Real-World Layouts: A Depth-aware Framework for Scene Adaptation [34.786268652516355]
教師なしドメイン適応(UDA)によるシーンセグメンテーションは、ソース合成データから取得した知識を現実のターゲットデータに転送することを可能にする。
深度推定を明示的に活用してカテゴリを混合し,2つの補完的タスク,すなわちセグメンテーションと深度学習を促進するための奥行き認識フレームワークを提案する。
特に、このフレームワークには、DCF(Depth-guided Contextual Filter)フォーンデータ拡張と、コンテキスト学習のためのクロスタスクエンコーダが含まれている。
論文 参考訳(メタデータ) (2023-11-21T15:39:21Z) - Rethinking Bayesian Deep Learning Methods for Semi-Supervised Volumetric
Medical Image Segmentation [83.47693725782457]
医用画像セグメンテーションのための新しい生成ベイズディープラーニング(GBDL)アーキテクチャを提案する。
GBDLは,入力医療ボリュームと対応するラベルの同時分布を推定することを目的とした生成モデルに属する。
我々のGBDLは、3つの公開医療データセットで一般的に使用される4つの評価指標において、従来の最先端手法よりも優れています。
論文 参考訳(メタデータ) (2022-06-18T23:07:04Z) - P3Depth: Monocular Depth Estimation with a Piecewise Planarity Prior [133.76192155312182]
本研究では,コプラナー画素からの情報を選択的に活用して予測深度を改善する手法を提案する。
本手法の広範な評価により, 教師付き単分子深度推定法において, 新たな手法の確立が期待できる。
論文 参考訳(メタデータ) (2022-04-05T10:03:52Z) - Towards Comprehensive Monocular Depth Estimation: Multiple Heads Are
Better Than One [32.01675089157679]
本稿では,複数の弱い深度予測器の強度を統合し,包括的かつ正確な深度予測器を構築することを提案する。
具体的には、異なるTransformerベースおよび畳み込みニューラルネットワーク(CNN)ベースのアーキテクチャを用いて、複数のベース(弱)深さ予測器を構築する。
その結果、トランスフォーマー支援深度アンサンブル(TEDepth)と呼ばれるモデルでは、従来の最先端手法よりも優れた結果が得られる。
論文 参考訳(メタデータ) (2021-11-16T09:09:05Z) - S2R-DepthNet: Learning a Generalizable Depth-specific Structural
Representation [63.58891781246175]
人間はリアルなイメージではなくスケッチからシーンの3次元幾何学を推測することができ、空間構造がシーンの深さを理解する上で基本的な役割を果たすことを示す。
我々は,深度推定に不可欠な特徴を捉え,無関係なスタイル情報を無視する,深度特異的な構造表現の学習を初めて行う。
当社のS2R-DepthNetは、合成データでのみ訓練されているにもかかわらず、目に見えない実際のデータに直接一般化できます。
論文 参考訳(メタデータ) (2021-04-02T03:55:41Z) - AdaBins: Depth Estimation using Adaptive Bins [43.07310038858445]
本稿では,画像毎の中心値が適応的に推定されるビンに深さ範囲を分割するトランスフォーマーアーキテクチャブロックを提案する。
以上の結果から,いくつかの一般的な深度データセットの最先端性に対する決定的な改善が得られた。
論文 参考訳(メタデータ) (2020-11-28T14:40:45Z) - Occlusion-Aware Depth Estimation with Adaptive Normal Constraints [85.44842683936471]
カラービデオから多フレーム深度を推定する新しい学習手法を提案する。
本手法は深度推定精度において最先端の手法より優れる。
論文 参考訳(メタデータ) (2020-04-02T07:10:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。