論文の概要: From 2D to 3D: Re-thinking Benchmarking of Monocular Depth Prediction
- arxiv url: http://arxiv.org/abs/2203.08122v1
- Date: Tue, 15 Mar 2022 17:50:54 GMT
- ステータス: 処理完了
- システム内更新日: 2022-03-16 16:13:26.304446
- Title: From 2D to 3D: Re-thinking Benchmarking of Monocular Depth Prediction
- Title(参考訳): 2Dから3Dへ:単眼深度予測のベンチマーク再考
- Authors: Evin P{\i}nar \"Ornek, Shristi Mudgal, Johanna Wald, Yida Wang, Nassir
Navab and Federico Tombari
- Abstract要約: 我々は,MDPが現在,3Dアプリケーションにおける予測の有用性を評価するのに有効な指標に頼っていることを論じる。
これにより、2Dベースの距離を最適化するのではなく、シーンの3D構造を正確に認識し、推定に向けて改善する新しい手法の設計と開発が制限される。
本稿では,MDP手法の3次元幾何評価に適した指標セットと,提案手法に不可欠な室内ベンチマークRIO-D3Dを提案する。
- 参考スコア(独自算出の注目度): 80.67873933010783
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: There have been numerous recently proposed methods for monocular depth
prediction (MDP) coupled with the equally rapid evolution of benchmarking
tools. However, we argue that MDP is currently witnessing benchmark
over-fitting and relying on metrics that are only partially helpful to gauge
the usefulness of the predictions for 3D applications. This limits the design
and development of novel methods that are truly aware of - and improving
towards estimating - the 3D structure of the scene rather than optimizing
2D-based distances. In this work, we aim to bring structural awareness to MDP,
an inherently 3D task, by exhibiting the limits of evaluation metrics towards
assessing the quality of the 3D geometry. We propose a set of metrics well
suited to evaluate the 3D geometry of MDP approaches and a novel indoor
benchmark, RIO-D3D, crucial for the proposed evaluation methodology. Our
benchmark is based on a real-world dataset featuring high-quality rendered
depth maps obtained from RGB-D reconstructions. We further demonstrate this to
help benchmark the closely-tied task of 3D scene completion.
- Abstract(参考訳): 近年,単分子深度予測法(MDP)とベンチマークツールの急速な進化が相まって提案されている。
しかし、MDPは現在ベンチマークの過剰適合を目撃しており、3Dアプリケーションにおける予測の有用性を評価するのに有効な指標に頼っていると論じる。
これにより、2Dベースの距離を最適化するのではなく、シーンの3D構造を正確に認識し、推定に向けて改善する新しい手法の設計と開発が制限される。
本研究の目的は,3次元形状の質を評価するための評価基準の限界を示すことにより,mdpの構造的認識を提供することである。
本稿では,MDP手法の3次元幾何評価に適した指標セットと,提案手法に不可欠な室内ベンチマークRIO-D3Dを提案する。
我々のベンチマークは、RGB-D再構成から得られた高品質な深度マップを特徴とする実世界のデータセットに基づいている。
さらに、これを3Dシーン補完の密接な作業のベンチマークに役立てる。
関連論文リスト
- TAPVid-3D: A Benchmark for Tracking Any Point in 3D [63.060421798990845]
我々は,3Dにおける任意の点の追跡作業を評価するための新しいベンチマークTAPVid-3Dを導入する。
このベンチマークは、モノクロビデオから正確な3Dの動きと表面の変形を理解する能力を改善するためのガイドポストとして機能する。
論文 参考訳(メタデータ) (2024-07-08T13:28:47Z) - UPose3D: Uncertainty-Aware 3D Human Pose Estimation with Cross-View and Temporal Cues [55.69339788566899]
UPose3Dは多視点人間のポーズ推定のための新しいアプローチである。
直接的な3Dアノテーションを必要とせずに、堅牢性と柔軟性を向上させる。
論文 参考訳(メタデータ) (2024-04-23T00:18:00Z) - Volumetric Semantically Consistent 3D Panoptic Mapping [77.13446499924977]
非構造環境における自律エージェントに適したセマンティック3Dマップを生成することを目的としたオンライン2次元から3次元のセマンティック・インスタンスマッピングアルゴリズムを提案する。
マッピング中にセマンティック予測の信頼性を統合し、セマンティックおよびインスタンス一貫性のある3D領域を生成する新しい方法を導入する。
提案手法は,パブリックな大規模データセット上での最先端の精度を実現し,多くの広く使用されているメトリクスを改善した。
論文 参考訳(メタデータ) (2023-09-26T08:03:10Z) - MDS-Net: A Multi-scale Depth Stratification Based Monocular 3D Object
Detection Algorithm [4.958840734249869]
本論文では,マルチスケール深度層構造に基づく1段モノクロ3次元物体検出アルゴリズムを提案する。
KITTIベンチマークの実験では、MDS-Netは既存のモノクル3D検出方法よりも3D検出やBEV検出タスクに優れていた。
論文 参考訳(メタデータ) (2022-01-12T07:11:18Z) - Learning Geometry-Guided Depth via Projective Modeling for Monocular 3D Object Detection [70.71934539556916]
射影モデルを用いて幾何学誘導深度推定を学習し, モノクル3次元物体検出を推し進める。
具体的には,モノクロ3次元物体検出ネットワークにおける2次元および3次元深度予測の投影モデルを用いた原理的幾何式を考案した。
本手法は, 適度なテスト設定において, 余分なデータを2.80%も加えることなく, 最先端単分子法の検出性能を著しく向上させる。
論文 参考訳(メタデータ) (2021-07-29T12:30:39Z) - Weakly-supervised Cross-view 3D Human Pose Estimation [16.045255544594625]
弱教師付きクロスビュー3次元ポーズ推定のための簡易かつ効果的なパイプラインを提案する。
本手法は,最先端の性能を弱い教師付きで達成することができる。
本手法を標準ベンチマークデータセットHuman3.6Mで評価する。
論文 参考訳(メタデータ) (2021-05-23T08:16:25Z) - Soft Expectation and Deep Maximization for Image Feature Detection [68.8204255655161]
質問をひっくり返し、まず繰り返し可能な3Dポイントを探し、次に検出器を訓練して画像空間にローカライズする、反復的半教師付き学習プロセスSEDMを提案する。
以上の結果から,sdmを用いてトレーニングした新しいモデルでは,シーン内の下位3dポイントのローカライズが容易になった。
論文 参考訳(メタデータ) (2021-04-21T00:35:32Z) - SMOKE: Single-Stage Monocular 3D Object Detection via Keypoint
Estimation [3.1542695050861544]
3Dの向きとオブジェクトの変換を推定することは、インフラストラクチャレスの自律走行と運転に不可欠である。
SMOKEと呼ばれる新しい3次元オブジェクト検出手法を提案する。
構造的単純さにもかかわらず、提案するSMOKEネットワークは、KITTIデータセット上の既存のモノクル3D検出方法よりも優れている。
論文 参考訳(メタデータ) (2020-02-24T08:15:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。