Fugu-MT 論文翻訳(概要): LocalBins: Improving Depth Estimation by Learning Local Distributions

論文の概要: LocalBins: Improving Depth Estimation by Learning Local Distributions

arxiv url: http://arxiv.org/abs/2203.15132v1
Date: Mon, 28 Mar 2022 22:40:16 GMT
ステータス: 翻訳完了
システム内更新日: 2022-03-31 09:44:27.934173
Title: LocalBins: Improving Depth Estimation by Learning Local Distributions
Title（参考訳）: LocalBins: 局所分布学習による深さ推定の改善
Authors: Shariq Farooq Bhat, Ibraheem Alhashim, Peter Wonka
Abstract要約: 我々は,入力画像の深さ値のグローバル分布を推定するAdaBins上に構築する。我々は各画素における局所地区の深度分布を推定する。結果は、NYU-Depth V2データセットのすべてのメトリクスにおいて、最先端よりも明確に改善されていることを示している。
参考スコア（独自算出の注目度）: 43.07310038858445
License: http://creativecommons.org/licenses/by/4.0/
Abstract: We propose a novel architecture for depth estimation from a single image. The architecture itself is based on the popular encoder-decoder architecture that is frequently used as a starting point for all dense regression tasks. We build on AdaBins which estimates a global distribution of depth values for the input image and evolve the architecture in two ways. First, instead of predicting global depth distributions, we predict depth distributions of local neighborhoods at every pixel. Second, instead of predicting depth distributions only towards the end of the decoder, we involve all layers of the decoder. We call this new architecture LocalBins. Our results demonstrate a clear improvement over the state-of-the-art in all metrics on the NYU-Depth V2 dataset. Code and pretrained models will be made publicly available.
Abstract（参考訳）: 単一画像からの深度推定のための新しいアーキテクチャを提案する。アーキテクチャ自体は、すべての高密度回帰タスクの出発点として頻繁に使用される一般的なエンコーダ・デコーダアーキテクチャに基づいている。我々は,入力画像の深さ値のグローバル分布を推定するAdaBins上に構築し,アーキテクチャを2つの方法で進化させる。まず,グローバルな深度分布を予測する代わりに,各画素の局所的な深度分布を予測する。第二に、デコーダの端にのみ深さ分布を予測する代わりに、デコーダのすべての層を巻き込みます。この新しいアーキテクチャをLocalBinsと呼びます。以上の結果から,NYU-Depth V2データセットのすべての指標において,最先端よりも明確な改善が示された。コードと事前訓練されたモデルは公開されます。

関連論文リスト

Propagating Sparse Depth via Depth Foundation Model for Out-of-Distribution Depth Completion [33.854696587141355]
本研究では,大規模トレーニングを伴わずに,深度基礎モデルを利用して顕著な堅牢性を実現する新しい深度補修フレームワークを提案する。具体的には、深度基盤モデルを用いて、RGB画像から構造的・意味的文脈を含む環境条件を抽出し、疎度情報の欠落領域への伝播を誘導する。我々のフレームワークはOODシナリオにおいて非常によく機能し、既存の最先端の深度補完手法よりも優れています。
論文参考訳（メタデータ） (2025-08-07T02:38:24Z)
PacGDC: Label-Efficient Generalizable Depth Completion with Projection Ambiguity and Consistency [63.74016242995453]
PacGDCは、一般化可能な深度補完のための最小限のアノテーションでデータ多様性を向上させるラベル効率のよい手法である。本稿では,複数の深度基礎モデルをスケールマニピュレータとして利用する新しいデータ合成パイプラインを提案する。実験により、PacGDCは複数のベンチマークで顕著に一般化可能であることが示された。
論文参考訳（メタデータ） (2025-07-10T01:56:30Z)
Depth Anything with Any Prior [64.39991799606146]
Prior Depth Anythingは、深さ測定における不完全だが正確な計量情報と深さ予測における相対的だが完全な幾何学的構造を組み合わせたフレームワークである。本研究では, 単眼深度推定(MDE)モデルを構築し, 深度推定の固有ノイズを改良する。われわれのモデルは、7つの現実世界のデータセットにまたがる深度補完、超高解像度、インパインティングという、印象的なゼロショットの一般化を見せている。
論文参考訳（メタデータ） (2025-05-15T17:59:50Z)
Scale Propagation Network for Generalizable Depth Completion [16.733495588009184]
入力から出力までのスケールを伝搬する新しいスケール伝搬正規化法(SP-Norm)を提案する。また,SP-NormとConvNeXt V2のバックボーンをベースとした新しいネットワークアーキテクチャを開発した。我々のモデルは、最先端の手法と比較して、高速かつ低メモリで常に最高の精度を達成している。
論文参考訳（メタデータ） (2024-10-24T03:53:06Z)
Progressive Depth Decoupling and Modulating for Flexible Depth Completion [28.693100885012008]
画像誘導深度補正は、疎LiDARデータとRGB画像から高密度深度マップを生成することを目的としている。近年の手法では,2つのサブタスク(深度離散化と確率予測)で分類問題として再検討し,有望な性能を示した。本研究では, 深度範囲をビンに漸進的に分離し, マルチスケールの深度マップを適応的に生成するプログレッシブ・ディープ・デカップリング・変調ネットワークを提案する。
論文参考訳（メタデータ） (2024-05-15T13:45:33Z)
SCALAR-NeRF: SCAlable LARge-scale Neural Radiance Fields for Scene Reconstruction [66.69049158826677]
本稿では,スケーラブルな大規模ニューラルシーン再構築に適した新しいフレームワークであるSCALAR-NeRFを紹介する。ニューラル表現をエンコーダ・デコーダアーキテクチャとして構成し、そこではエンコーダが3次元点座標を処理してエンコーダ化された特徴を生成する。そこで本研究では,これらの局所モデルから出力を抽出し,最終的な再構築を実現するための効率的かつ効率的な手法を提案する。
論文参考訳（メタデータ） (2023-11-28T10:18:16Z)
Transferring to Real-World Layouts: A Depth-aware Framework for Scene Adaptation [34.786268652516355]
教師なしドメイン適応(UDA)によるシーンセグメンテーションは、ソース合成データから取得した知識を現実のターゲットデータに転送することを可能にする。深度推定を明示的に活用してカテゴリを混合し,2つの補完的タスク,すなわちセグメンテーションと深度学習を促進するための奥行き認識フレームワークを提案する。特に、このフレームワークには、DCF(Depth-guided Contextual Filter)フォーンデータ拡張と、コンテキスト学習のためのクロスタスクエンコーダが含まれている。
論文参考訳（メタデータ） (2023-11-21T15:39:21Z)
Rethinking Bayesian Deep Learning Methods for Semi-Supervised Volumetric Medical Image Segmentation [83.47693725782457]
医用画像セグメンテーションのための新しい生成ベイズディープラーニング(GBDL)アーキテクチャを提案する。 GBDLは,入力医療ボリュームと対応するラベルの同時分布を推定することを目的とした生成モデルに属する。我々のGBDLは、3つの公開医療データセットで一般的に使用される4つの評価指標において、従来の最先端手法よりも優れています。
論文参考訳（メタデータ） (2022-06-18T23:07:04Z)
P3Depth: Monocular Depth Estimation with a Piecewise Planarity Prior [133.76192155312182]
本研究では,コプラナー画素からの情報を選択的に活用して予測深度を改善する手法を提案する。本手法の広範な評価により, 教師付き単分子深度推定法において, 新たな手法の確立が期待できる。
論文参考訳（メタデータ） (2022-04-05T10:03:52Z)
Towards Comprehensive Monocular Depth Estimation: Multiple Heads Are Better Than One [32.01675089157679]
本稿では,複数の弱い深度予測器の強度を統合し,包括的かつ正確な深度予測器を構築することを提案する。具体的には、異なるTransformerベースおよび畳み込みニューラルネットワーク(CNN)ベースのアーキテクチャを用いて、複数のベース(弱)深さ予測器を構築する。その結果、トランスフォーマー支援深度アンサンブル(TEDepth)と呼ばれるモデルでは、従来の最先端手法よりも優れた結果が得られる。
論文参考訳（メタデータ） (2021-11-16T09:09:05Z)
S2R-DepthNet: Learning a Generalizable Depth-specific Structural Representation [63.58891781246175]
人間はリアルなイメージではなくスケッチからシーンの3次元幾何学を推測することができ、空間構造がシーンの深さを理解する上で基本的な役割を果たすことを示す。我々は,深度推定に不可欠な特徴を捉え,無関係なスタイル情報を無視する,深度特異的な構造表現の学習を初めて行う。当社のS2R-DepthNetは、合成データでのみ訓練されているにもかかわらず、目に見えない実際のデータに直接一般化できます。
論文参考訳（メタデータ） (2021-04-02T03:55:41Z)
AdaBins: Depth Estimation using Adaptive Bins [43.07310038858445]
本稿では,画像毎の中心値が適応的に推定されるビンに深さ範囲を分割するトランスフォーマーアーキテクチャブロックを提案する。以上の結果から,いくつかの一般的な深度データセットの最先端性に対する決定的な改善が得られた。
論文参考訳（メタデータ） (2020-11-28T14:40:45Z)
Occlusion-Aware Depth Estimation with Adaptive Normal Constraints [85.44842683936471]
カラービデオから多フレーム深度を推定する新しい学習手法を提案する。本手法は深度推定精度において最先端の手法より優れる。
論文参考訳（メタデータ） (2020-04-02T07:10:45Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。