論文の概要: Categorical Depth Distribution Network for Monocular 3D Object Detection
- arxiv url: http://arxiv.org/abs/2103.01100v1
- Date: Mon, 1 Mar 2021 16:08:29 GMT
- ステータス: 処理完了
- システム内更新日: 2021-03-04 22:22:46.111819
- Title: Categorical Depth Distribution Network for Monocular 3D Object Detection
- Title(参考訳): モノクロ3次元物体検出のためのカテゴリー深度分布ネットワーク
- Authors: Cody Reading, Ali Harakeh, Julia Chae, and Steven L. Waslander
(University of Toronto)
- Abstract要約: モノラル3D検出の重要な課題は、物体の深度を正確に予測することです。
多くの手法は3次元検出を支援するために直接深度を推定しようとするが、深度不正確な結果、限られた性能を示す。
Categorical Depth Distribution Network (CADDN) を提案し、3次元空間の適切な深さ間隔にリッチなコンテキスト特徴情報を投影する。
提案手法をkitti 3d object detection benchmarkで検証し, 単項法のうち1位にランク付けした。
- 参考スコア(独自算出の注目度): 7.0405916639906785
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Monocular 3D object detection is a key problem for autonomous vehicles, as it
provides a solution with simple configuration compared to typical multi-sensor
systems. The main challenge in monocular 3D detection lies in accurately
predicting object depth, which must be inferred from object and scene cues due
to the lack of direct range measurement. Many methods attempt to directly
estimate depth to assist in 3D detection, but show limited performance as a
result of depth inaccuracy. Our proposed solution, Categorical Depth
Distribution Network (CaDDN), uses a predicted categorical depth distribution
for each pixel to project rich contextual feature information to the
appropriate depth interval in 3D space. We then use the computationally
efficient bird's-eye-view projection and single-stage detector to produce the
final output bounding boxes. We design CaDDN as a fully differentiable
end-to-end approach for joint depth estimation and object detection. We
validate our approach on the KITTI 3D object detection benchmark, where we rank
1st among published monocular methods. We also provide the first monocular 3D
detection results on the newly released Waymo Open Dataset. The source code for
CaDDN will be made publicly available before publication.
- Abstract(参考訳): 単眼3D物体検出は、一般的なマルチセンサーシステムと比較してシンプルな構成のソリューションを提供するため、自動運転車にとって重要な問題です。
単眼的3次元検出の主な課題は、物体の深さを正確に予測することであり、それは直接距離測定の欠如のために物体とシーンの手がかりから推測されなければならない。
多くの手法は3次元検出を支援するために直接深度を推定しようとするが、深度不正確な結果、限られた性能を示す。
提案手法であるCategorical Depth Distribution Network (CaDDN) は,各画素に予測されたカテゴリの深さ分布を用いて,3次元空間の適切な深さ間隔にリッチなコンテキスト特徴情報を投影する。
次に、計算効率の良いバードズ・アイ・ビュー投影と単段検出器を用いて最終的な出力バウンディングボックスを生成する。
結合深さ推定と物体検出のための完全微分可能なエンドツーエンドアプローチとしてCaDDNを設計する。
提案手法をkitti 3d object detection benchmarkで検証し, 単項法のうち1位にランク付けした。
また、新しくリリースされたWaymo Open Datasetで最初のモノラル3D検出結果も提供します。
CaDDNのソースコードは公開前に公開される予定だ。
関連論文リスト
- OPA-3D: Occlusion-Aware Pixel-Wise Aggregation for Monocular 3D Object
Detection [51.153003057515754]
OPA-3Dは、Occlusion-Aware Pixel-Wise Aggregationネットワークである。
密集した風景深度と、奥行きのある箱残量と物の境界箱を共同で推定する。
メインカーのカテゴリーでは最先端の手法よりも優れています。
論文 参考訳(メタデータ) (2022-11-02T14:19:13Z) - MDS-Net: A Multi-scale Depth Stratification Based Monocular 3D Object
Detection Algorithm [4.958840734249869]
本論文では,マルチスケール深度層構造に基づく1段モノクロ3次元物体検出アルゴリズムを提案する。
KITTIベンチマークの実験では、MDS-Netは既存のモノクル3D検出方法よりも3D検出やBEV検出タスクに優れていた。
論文 参考訳(メタデータ) (2022-01-12T07:11:18Z) - Probabilistic and Geometric Depth: Detecting Objects in Perspective [78.00922683083776]
3次元物体検出は、運転支援システムなどの様々な実用用途で必要とされる重要な機能である。
双眼視やLiDARに頼っている従来の設定に比べて、経済的な解決策として単眼3D検出が注目されているが、それでも満足のいく結果が得られていない。
本稿ではまず,この問題に関する系統的研究を行い,現在の単分子3次元検出問題をインスタンス深度推定問題として単純化できることを考察する。
論文 参考訳(メタデータ) (2021-07-29T16:30:33Z) - MonoGRNet: A General Framework for Monocular 3D Object Detection [23.59839921644492]
幾何学的推論によるモノクロ画像からのアモーダル3次元物体検出のためのMonoGRNetを提案する。
MonoGRNetは、モノラル3Dオブジェクト検出タスクを2Dオブジェクト検出、インスタンスレベルの深さ推定、投影された3Dセンター推定、ローカルコーナー回帰を含む4つのサブタスクに分解する。
KITTI、Cityscapes、MS COCOデータセットで実験が行われた。
論文 参考訳(メタデータ) (2021-04-18T10:07:52Z) - Delving into Localization Errors for Monocular 3D Object Detection [85.77319416168362]
単眼画像から3Dバウンディングボックスを推定することは、自動運転に不可欠な要素です。
本研究では, 各サブタスクがもたらす影響を定量化し, 局所化誤差を求めることが, モノクロ3次元検出の抑制に欠かせない要因である。
論文 参考訳(メタデータ) (2021-03-30T10:38:01Z) - M3DSSD: Monocular 3D Single Stage Object Detector [82.25793227026443]
特徴アライメントと非対称非局所的注意を有するモノクロ3次元単段物体検出器(M3DSSD)を提案する。
提案したM3DSSDは,KITTIデータセット上のモノラルな3Dオブジェクト検出手法よりも大幅に性能が向上する。
論文 参考訳(メタデータ) (2021-03-24T13:09:11Z) - Reinforced Axial Refinement Network for Monocular 3D Object Detection [160.34246529816085]
モノクロ3次元物体検出は、2次元入力画像から物体の位置と特性を抽出することを目的としている。
従来のアプローチでは、空間から3D境界ボックスをサンプリングし、対象オブジェクトと各オブジェクトの関係を推定するが、有効サンプルの確率は3D空間で比較的小さい。
我々は,まず最初の予測から始めて,各ステップで1つの3dパラメータだけを変えて,基礎的真理に向けて徐々に洗練することを提案する。
これは、いくつかのステップの後に報酬を得るポリシーを設計する必要があるため、最適化するために強化学習を採用します。
論文 参考訳(メタデータ) (2020-08-31T17:10:48Z) - DOPS: Learning to Detect 3D Objects and Predict their 3D Shapes [54.239416488865565]
LIDARデータに対する高速な1段3次元物体検出法を提案する。
我々の手法の中核となる新規性は高速かつシングルパスアーキテクチャであり、どちらも3次元の物体を検出し、それらの形状を推定する。
提案手法は,ScanNetシーンのオブジェクト検出で5%,オープンデータセットでは3.4%の精度で結果が得られた。
論文 参考訳(メタデータ) (2020-04-02T17:48:50Z) - SMOKE: Single-Stage Monocular 3D Object Detection via Keypoint
Estimation [3.1542695050861544]
3Dの向きとオブジェクトの変換を推定することは、インフラストラクチャレスの自律走行と運転に不可欠である。
SMOKEと呼ばれる新しい3次元オブジェクト検出手法を提案する。
構造的単純さにもかかわらず、提案するSMOKEネットワークは、KITTIデータセット上の既存のモノクル3D検出方法よりも優れている。
論文 参考訳(メタデータ) (2020-02-24T08:15:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。