論文の概要: LocalBins: Improving Depth Estimation by Learning Local Distributions
- arxiv url: http://arxiv.org/abs/2203.15132v1
- Date: Mon, 28 Mar 2022 22:40:16 GMT
- ステータス: 処理完了
- システム内更新日: 2022-03-31 09:44:27.934173
- Title: LocalBins: Improving Depth Estimation by Learning Local Distributions
- Title(参考訳): LocalBins: 局所分布学習による深さ推定の改善
- Authors: Shariq Farooq Bhat, Ibraheem Alhashim, Peter Wonka
- Abstract要約: 我々は,入力画像の深さ値のグローバル分布を推定するAdaBins上に構築する。
我々は各画素における局所地区の深度分布を推定する。
結果は、NYU-Depth V2データセットのすべてのメトリクスにおいて、最先端よりも明確に改善されていることを示している。
- 参考スコア(独自算出の注目度): 43.07310038858445
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We propose a novel architecture for depth estimation from a single image. The
architecture itself is based on the popular encoder-decoder architecture that
is frequently used as a starting point for all dense regression tasks. We build
on AdaBins which estimates a global distribution of depth values for the input
image and evolve the architecture in two ways. First, instead of predicting
global depth distributions, we predict depth distributions of local
neighborhoods at every pixel. Second, instead of predicting depth distributions
only towards the end of the decoder, we involve all layers of the decoder. We
call this new architecture LocalBins. Our results demonstrate a clear
improvement over the state-of-the-art in all metrics on the NYU-Depth V2
dataset. Code and pretrained models will be made publicly available.
- Abstract(参考訳): 単一画像からの深度推定のための新しいアーキテクチャを提案する。
アーキテクチャ自体は、すべての高密度回帰タスクの出発点として頻繁に使用される一般的なエンコーダ・デコーダアーキテクチャに基づいている。
我々は,入力画像の深さ値のグローバル分布を推定するAdaBins上に構築し,アーキテクチャを2つの方法で進化させる。
まず,グローバルな深度分布を予測する代わりに,各画素の局所的な深度分布を予測する。
第二に、デコーダの端にのみ深さ分布を予測する代わりに、デコーダのすべての層を巻き込みます。
この新しいアーキテクチャをLocalBinsと呼びます。
以上の結果から,NYU-Depth V2データセットのすべての指標において,最先端よりも明確な改善が示された。
コードと事前訓練されたモデルは公開されます。
関連論文リスト
- SCALAR-NeRF: SCAlable LARge-scale Neural Radiance Fields for Scene
Reconstruction [66.69049158826677]
本稿では,スケーラブルな大規模ニューラルシーン再構築に適した新しいフレームワークであるSCALAR-NeRFを紹介する。
ニューラル表現をエンコーダ・デコーダアーキテクチャとして構成し、そこではエンコーダが3次元点座標を処理してエンコーダ化された特徴を生成する。
そこで本研究では,これらの局所モデルから出力を抽出し,最終的な再構築を実現するための効率的かつ効率的な手法を提案する。
論文 参考訳(メタデータ) (2023-11-28T10:18:16Z) - Transferring to Real-World Layouts: A Depth-aware Framework for Scene
Adaptation [39.09627986402352]
教師なしドメイン適応(UDA)によるシーンセグメンテーションは、ソース合成データから取得した知識を現実のターゲットデータに転送することを可能にする。
深度推定を明示的に活用してカテゴリを混合し,2つの補完的タスク,すなわちセグメンテーションと深度学習を促進するための奥行き認識フレームワークを提案する。
特に、このフレームワークには、DCF(Depth-guided Contextual Filter)フォーンデータ拡張と、コンテキスト学習のためのクロスタスクエンコーダが含まれている。
論文 参考訳(メタデータ) (2023-11-21T15:39:21Z) - Towards Domain-agnostic Depth Completion [96.67020906681175]
既存の深度補完法は、しばしば特定のスパース深度型を目標とし、タスク領域間での一般化が不十分である。
各種センサで得られたスパース/セミデンス,ノイズ,および低分解能深度マップを完備する手法を提案する。
本手法は,最先端の深度補完法に対して優れたクロスドメイン一般化能力を示す。
論文 参考訳(メタデータ) (2022-07-29T04:10:22Z) - Rethinking Bayesian Deep Learning Methods for Semi-Supervised Volumetric
Medical Image Segmentation [83.47693725782457]
医用画像セグメンテーションのための新しい生成ベイズディープラーニング(GBDL)アーキテクチャを提案する。
GBDLは,入力医療ボリュームと対応するラベルの同時分布を推定することを目的とした生成モデルに属する。
我々のGBDLは、3つの公開医療データセットで一般的に使用される4つの評価指標において、従来の最先端手法よりも優れています。
論文 参考訳(メタデータ) (2022-06-18T23:07:04Z) - P3Depth: Monocular Depth Estimation with a Piecewise Planarity Prior [133.76192155312182]
本研究では,コプラナー画素からの情報を選択的に活用して予測深度を改善する手法を提案する。
本手法の広範な評価により, 教師付き単分子深度推定法において, 新たな手法の確立が期待できる。
論文 参考訳(メタデータ) (2022-04-05T10:03:52Z) - BinsFormer: Revisiting Adaptive Bins for Monocular Depth Estimation [46.678016537618845]
本稿では,分類回帰に基づく深度推定に適したBinsFormerという新しいフレームワークを提案する。
1)適応的なビンの適切な生成、2)確率分布とビン予測の間の十分な相互作用である。
KITTI、NYU、SUN RGB-Dデータセットの実験は、BinsFormerが最先端のモノクル深度推定法をはるかに上回っていることを示している。
論文 参考訳(メタデータ) (2022-04-03T04:38:02Z) - Monocular Depth Distribution Alignment with Low Computation [15.05244258071472]
我々は、軽量ネットワークと重軽量ネットワークの精度コントラストの大部分をモデル化する。
DANetは2つの領域ごとに深度の特徴の違いを知覚することにより、合理的なシーン構造を予測する傾向にある。
DANetは、深さ分布形状とシーン深度範囲のアライメントにより、分布のドリフトを著しく軽減し、従来の重み付け手法と同等の性能を達成する。
論文 参考訳(メタデータ) (2022-03-09T06:18:26Z) - Towards Comprehensive Monocular Depth Estimation: Multiple Heads Are
Better Than One [32.01675089157679]
本稿では,複数の弱い深度予測器の強度を統合し,包括的かつ正確な深度予測器を構築することを提案する。
具体的には、異なるTransformerベースおよび畳み込みニューラルネットワーク(CNN)ベースのアーキテクチャを用いて、複数のベース(弱)深さ予測器を構築する。
その結果、トランスフォーマー支援深度アンサンブル(TEDepth)と呼ばれるモデルでは、従来の最先端手法よりも優れた結果が得られる。
論文 参考訳(メタデータ) (2021-11-16T09:09:05Z) - AdaBins: Depth Estimation using Adaptive Bins [43.07310038858445]
本稿では,画像毎の中心値が適応的に推定されるビンに深さ範囲を分割するトランスフォーマーアーキテクチャブロックを提案する。
以上の結果から,いくつかの一般的な深度データセットの最先端性に対する決定的な改善が得られた。
論文 参考訳(メタデータ) (2020-11-28T14:40:45Z) - Occlusion-Aware Depth Estimation with Adaptive Normal Constraints [85.44842683936471]
カラービデオから多フレーム深度を推定する新しい学習手法を提案する。
本手法は深度推定精度において最先端の手法より優れる。
論文 参考訳(メタデータ) (2020-04-02T07:10:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。