論文の概要: Confidence Guided Stereo 3D Object Detection with Split Depth Estimation
- arxiv url: http://arxiv.org/abs/2003.05505v1
- Date: Wed, 11 Mar 2020 20:00:11 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-24 14:48:28.093138
- Title: Confidence Guided Stereo 3D Object Detection with Split Depth Estimation
- Title(参考訳): スプリット深さ推定による信頼度誘導ステレオ3次元物体検出
- Authors: Chengyao Li, Jason Ku and Steven L. Waslander
- Abstract要約: CG-Stereoは信頼性誘導型ステレオ3Dオブジェクト検出パイプラインである。
深度推定の際には、前景と背景の画素に別個のデコーダを使用する。
提案手法は, KITTIベンチマークにおいて, 最先端のステレオベース3D検出器よりも優れている。
- 参考スコア(独自算出の注目度): 10.64859537162938
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Accurate and reliable 3D object detection is vital to safe autonomous
driving. Despite recent developments, the performance gap between stereo-based
methods and LiDAR-based methods is still considerable. Accurate depth
estimation is crucial to the performance of stereo-based 3D object detection
methods, particularly for those pixels associated with objects in the
foreground. Moreover, stereo-based methods suffer from high variance in the
depth estimation accuracy, which is often not considered in the object
detection pipeline. To tackle these two issues, we propose CG-Stereo, a
confidence-guided stereo 3D object detection pipeline that uses separate
decoders for foreground and background pixels during depth estimation, and
leverages the confidence estimation from the depth estimation network as a soft
attention mechanism in the 3D object detector. Our approach outperforms all
state-of-the-art stereo-based 3D detectors on the KITTI benchmark.
- Abstract(参考訳): 正確な3Dオブジェクト検出は、安全な自動運転に不可欠である。
近年の進歩にもかかわらず、ステレオ法とLiDAR法のパフォーマンス差は依然として大きい。
高精度深度推定は, ステレオ3次元物体検出法, 特に前景の物体に関連付けられた画素の性能に不可欠である。
さらに,ステレオベース手法では深度推定精度のばらつきがみられ,対象検出パイプラインでは考慮されないことが多い。
そこで本研究では,深度推定時に前景画素と背景画素の分離デコーダを用いた信頼度誘導ステレオ3次元物体検出パイプラインcg-stereoを提案し,深さ推定ネットワークからの信頼度推定を3次元物体検出装置のソフトアテンション機構として活用する。
提案手法は,KITTIベンチマークにおいて,最先端のステレオベース3D検出器よりも優れている。
関連論文リスト
- OPEN: Object-wise Position Embedding for Multi-view 3D Object Detection [102.0744303467713]
OPENと呼ばれる新しい多視点3Dオブジェクト検出器を提案する。
我々の主目的は、提案したオブジェクト指向位置埋め込みを通して、オブジェクトワイド情報をネットワークに効果的に注入することである。
OPENは、nuScenesテストベンチマークで64.4%のNDSと56.7%のmAPで、最先端の新たなパフォーマンスを実現している。
論文 参考訳(メタデータ) (2024-07-15T14:29:15Z) - SVDM: Single-View Diffusion Model for Pseudo-Stereo 3D Object Detection [0.0]
Pseudo-Stereoに基づくモノクル3D検出のためのフレームワークが最近提案され、コミュニティで注目されている。
本研究では,単一視点拡散モデルを導入することで,エンドツーエンドで効率的な擬似ステレオ3D検出フレームワークを提案する。
SVDMは擬似ステレオ3D検出パイプライン全体をエンドツーエンドで訓練することができ、ステレオ検出器の訓練の恩恵を受けることができる。
論文 参考訳(メタデータ) (2023-07-05T13:10:37Z) - Boosting Monocular 3D Object Detection with Object-Centric Auxiliary
Depth Supervision [13.593246617391266]
本稿では,RGB画像に基づく3D検出器を,深度推定タスクに類似した深度予測損失で共同でトレーニングすることにより,RGB画像に基づく3D検出器の強化手法を提案する。
新たな物体中心深度予測損失は,3次元物体検出において重要な前景物体周辺の深度に焦点をあてる。
我々の深度回帰モデルは、物体の3次元信頼度を表すために、深度の不確かさを予測するためにさらに訓練される。
論文 参考訳(メタデータ) (2022-10-29T11:32:28Z) - SIDE: Center-based Stereo 3D Detector with Structure-aware Instance
Depth Estimation [11.169586369931803]
構造認識型立体3D検出器(SIDE)と呼ばれる立体像に基づくアンカーフリー3D検出法を提案する。
各オブジェクトのRoIからコストボリュームを構築することで,インスタンスレベルの深度情報を探索する。
本手法は, 深度マップ管理のない既存手法と比較して, 最先端の性能を実現する。
論文 参考訳(メタデータ) (2021-08-22T08:09:38Z) - LIGA-Stereo: Learning LiDAR Geometry Aware Representations for
Stereo-based 3D Detector [80.7563981951707]
本稿では,LIGA-Stereoによるステレオ3次元検出器の学習について,LiDARに基づく検出モデルの高レベルな幾何認識表現の指導の下で提案する。
現状のステレオ検出器と比較して,車,歩行者,サイクリストの3次元検出性能は,それぞれ10.44%,5.69%,5.97%向上した。
論文 参考訳(メタデータ) (2021-08-18T17:24:40Z) - M3DSSD: Monocular 3D Single Stage Object Detector [82.25793227026443]
特徴アライメントと非対称非局所的注意を有するモノクロ3次元単段物体検出器(M3DSSD)を提案する。
提案したM3DSSDは,KITTIデータセット上のモノラルな3Dオブジェクト検出手法よりも大幅に性能が向上する。
論文 参考訳(メタデータ) (2021-03-24T13:09:11Z) - Stereo CenterNet based 3D Object Detection for Autonomous Driving [2.508414661327797]
ステレオ画像の幾何学的情報を用いた3次元物体検出手法Stereo CenterNetを提案する。
Stereo CenterNetは、空間内のオブジェクトの3D境界ボックスの4つの意味キーポイントを予測し、3D空間におけるオブジェクトのバウンディングボックスを復元するために、2D左の右ボックス、3D次元、向き、キーポイントを使用する。
KITTIデータセットを用いた実験により, ステレオ幾何に基づく最先端手法と比較して, 高速かつ高精度なトレードオフを実現することができた。
論文 参考訳(メタデータ) (2021-03-20T02:18:49Z) - PLUME: Efficient 3D Object Detection from Stereo Images [95.31278688164646]
既存の手法では、2つのステップでこの問題に対処する: 第一深度推定を行い、その深さ推定から擬似LiDAR点雲表現を計算し、3次元空間で物体検出を行う。
この2つのタスクを同一のメトリック空間で統一するモデルを提案する。
提案手法は,既存の手法と比較して推定時間を大幅に削減し,挑戦的なKITTIベンチマークの最先端性能を実現する。
論文 参考訳(メタデータ) (2021-01-17T05:11:38Z) - Expandable YOLO: 3D Object Detection from RGB-D Images [64.14512458954344]
本稿では,ステレオカメラから深度とカラー画像を入力する軽量物体検出器の構築を目的とする。
YOLOv3のネットワークアーキテクチャを中央から3Dに拡張することにより、深さ方向の出力が可能となる。
領域抽出結果の精度を確認するため、3次元空間におけるユニノン(IoU)の切断を導入する。
論文 参考訳(メタデータ) (2020-06-26T07:32:30Z) - DSGN: Deep Stereo Geometry Network for 3D Object Detection [79.16397166985706]
画像ベースとLiDARベースの3Dオブジェクト検出器の間には大きなパフォーマンスギャップがある。
我々の手法であるDeep Stereo Geometry Network (DSGN)は,このギャップを著しく低減する。
初めて、シンプルで効果的な1段ステレオベースの3D検出パイプラインを提供する。
論文 参考訳(メタデータ) (2020-01-10T11:44:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。