論文の概要: Delving into Localization Errors for Monocular 3D Object Detection
- arxiv url: http://arxiv.org/abs/2103.16237v1
- Date: Tue, 30 Mar 2021 10:38:01 GMT
- ステータス: 処理完了
- システム内更新日: 2021-03-31 14:55:32.172969
- Title: Delving into Localization Errors for Monocular 3D Object Detection
- Title(参考訳): 単眼3次元物体検出における位置推定誤差の検討
- Authors: Xinzhu Ma, Yinmin Zhang, Dan Xu, Dongzhan Zhou, Shuai Yi, Haojie Li,
Wanli Ouyang
- Abstract要約: 単眼画像から3Dバウンディングボックスを推定することは、自動運転に不可欠な要素です。
本研究では, 各サブタスクがもたらす影響を定量化し, 局所化誤差を求めることが, モノクロ3次元検出の抑制に欠かせない要因である。
- 参考スコア(独自算出の注目度): 85.77319416168362
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Estimating 3D bounding boxes from monocular images is an essential component
in autonomous driving, while accurate 3D object detection from this kind of
data is very challenging. In this work, by intensive diagnosis experiments, we
quantify the impact introduced by each sub-task and found the `localization
error' is the vital factor in restricting monocular 3D detection. Besides, we
also investigate the underlying reasons behind localization errors, analyze the
issues they might bring, and propose three strategies. First, we revisit the
misalignment between the center of the 2D bounding box and the projected center
of the 3D object, which is a vital factor leading to low localization accuracy.
Second, we observe that accurately localizing distant objects with existing
technologies is almost impossible, while those samples will mislead the learned
network. To this end, we propose to remove such samples from the training set
for improving the overall performance of the detector. Lastly, we also propose
a novel 3D IoU oriented loss for the size estimation of the object, which is
not affected by `localization error'. We conduct extensive experiments on the
KITTI dataset, where the proposed method achieves real-time detection and
outperforms previous methods by a large margin. The code will be made available
at: https://github.com/xinzhuma/monodle.
- Abstract(参考訳): モノクロ画像から3D境界ボックスを推定することは、自動運転に不可欠な要素であり、この種のデータから正確な3Dオブジェクト検出は非常に難しい。
本研究では, 集中診断実験により, 各サブタスクが与える影響を定量化し, 「局所化誤差」 が単眼的3次元検出を制限する重要な要因であることを確認した。
さらに,ローカライズエラーの背後にある根本的な原因を調査し,それらの問題を分析し,三つの戦略を提案する。
まず,2Dバウンディングボックスの中心と3Dオブジェクトの投影中心との間の不一致を再考し,位置決め精度の低下につながる重要な要因について述べる。
第2に、既存の技術で遠くの物体を正確にローカライズすることはほぼ不可能であり、これらのサンプルは学習したネットワークを誤解させる。
そこで本研究では,検出器の全体的な性能を向上させるためのトレーニングセットから,そのようなサンプルを除去することを提案する。
最後に, 「局所化誤差」 の影響を受けない, 物体の大きさ推定のための新しい3次元IoU配向損失を提案する。
提案手法は,提案手法がリアルタイムに検出され,従来の手法を大差で上回る,kittiデータセットの広範な実験を行う。
コードは、https://github.com/xinzhuma/monodle.comから入手できる。
関連論文リスト
- Uncertainty Estimation for 3D Object Detection via Evidential Learning [63.61283174146648]
本稿では,3次元検出器における鳥の視線表示における明らかな学習損失を利用して,3次元物体検出の不確かさを定量化するためのフレームワークを提案する。
本研究では,これらの不確実性評価の有効性と重要性を,分布外シーンの特定,局所化の不十分な物体の発見,および(偽陰性)検出の欠如について示す。
論文 参考訳(メタデータ) (2024-10-31T13:13:32Z) - Homography Loss for Monocular 3D Object Detection [54.04870007473932]
ホログラフィーロス(Homography Loss)と呼ばれる,2次元情報と3次元情報の両方を利用する識別可能なロス関数を提案する。
提案手法は,KITTI 3Dデータセットにおいて,他の最先端技術と比較して高い性能を示す。
論文 参考訳(メタデータ) (2022-04-02T03:48:03Z) - Progressive Coordinate Transforms for Monocular 3D Object Detection [52.00071336733109]
本稿では,学習座標表現を容易にするために,PCT(Em Progressive Coordinate Transforms)と呼ばれる,新しい軽量なアプローチを提案する。
本稿では,学習座標表現を容易にするために,PCT(Em Progressive Coordinate Transforms)と呼ばれる,新しい軽量なアプローチを提案する。
論文 参考訳(メタデータ) (2021-08-12T15:22:33Z) - Categorical Depth Distribution Network for Monocular 3D Object Detection [7.0405916639906785]
モノラル3D検出の重要な課題は、物体の深度を正確に予測することです。
多くの手法は3次元検出を支援するために直接深度を推定しようとするが、深度不正確な結果、限られた性能を示す。
Categorical Depth Distribution Network (CADDN) を提案し、3次元空間の適切な深さ間隔にリッチなコンテキスト特徴情報を投影する。
提案手法をkitti 3d object detection benchmarkで検証し, 単項法のうち1位にランク付けした。
論文 参考訳(メタデータ) (2021-03-01T16:08:29Z) - PLUME: Efficient 3D Object Detection from Stereo Images [95.31278688164646]
既存の手法では、2つのステップでこの問題に対処する: 第一深度推定を行い、その深さ推定から擬似LiDAR点雲表現を計算し、3次元空間で物体検出を行う。
この2つのタスクを同一のメトリック空間で統一するモデルを提案する。
提案手法は,既存の手法と比較して推定時間を大幅に削減し,挑戦的なKITTIベンチマークの最先端性能を実現する。
論文 参考訳(メタデータ) (2021-01-17T05:11:38Z) - Reinforced Axial Refinement Network for Monocular 3D Object Detection [160.34246529816085]
モノクロ3次元物体検出は、2次元入力画像から物体の位置と特性を抽出することを目的としている。
従来のアプローチでは、空間から3D境界ボックスをサンプリングし、対象オブジェクトと各オブジェクトの関係を推定するが、有効サンプルの確率は3D空間で比較的小さい。
我々は,まず最初の予測から始めて,各ステップで1つの3dパラメータだけを変えて,基礎的真理に向けて徐々に洗練することを提案する。
これは、いくつかのステップの後に報酬を得るポリシーを設計する必要があるため、最適化するために強化学習を採用します。
論文 参考訳(メタデータ) (2020-08-31T17:10:48Z) - SMOKE: Single-Stage Monocular 3D Object Detection via Keypoint
Estimation [3.1542695050861544]
3Dの向きとオブジェクトの変換を推定することは、インフラストラクチャレスの自律走行と運転に不可欠である。
SMOKEと呼ばれる新しい3次元オブジェクト検出手法を提案する。
構造的単純さにもかかわらず、提案するSMOKEネットワークは、KITTIデータセット上の既存のモノクル3D検出方法よりも優れている。
論文 参考訳(メタデータ) (2020-02-24T08:15:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。