論文の概要: Stereo Frustums: A Siamese Pipeline for 3D Object Detection
- arxiv url: http://arxiv.org/abs/2010.14599v2
- Date: Sun, 8 Nov 2020 15:16:07 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-02 11:48:41.772854
- Title: Stereo Frustums: A Siamese Pipeline for 3D Object Detection
- Title(参考訳): stereo frustums: 3次元物体検出のためのsiameseパイプライン
- Authors: Xi Mo, Usman Sajid, Guanghui Wang
- Abstract要約: 本稿では,3次元物体検出のための軽量ステレオフラストラムマッチングモジュールを提案する。
提案フレームワークは高性能な2D検出器とポイントクラウドセグメンテーションネットワークを利用して,自律走行車用3Dバウンディングボックスを補強する。
- 参考スコア(独自算出の注目度): 20.443003989363916
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The paper proposes a light-weighted stereo frustums matching module for 3D
objection detection. The proposed framework takes advantage of a
high-performance 2D detector and a point cloud segmentation network to regress
3D bounding boxes for autonomous driving vehicles. Instead of performing
traditional stereo matching to compute disparities, the module directly takes
the 2D proposals from both the left and the right views as input. Based on the
epipolar constraints recovered from the well-calibrated stereo cameras, we
propose four matching algorithms to search for the best match for each proposal
between the stereo image pairs. Each matching pair proposes a segmentation of
the scene which is then fed into a 3D bounding box regression network. Results
of extensive experiments on KITTI dataset demonstrate that the proposed Siamese
pipeline outperforms the state-of-the-art stereo-based 3D bounding box
regression methods.
- Abstract(参考訳): 本稿では,3次元物体検出のための軽量ステレオフラストラムマッチングモジュールを提案する。
提案フレームワークは高性能な2D検出器とポイントクラウドセグメンテーションネットワークを利用して,自律走行車用3Dバウンディングボックスを補強する。
モジュールは、相違を計算するために従来のステレオマッチングを実行する代わりに、左右の両方のビューから2D提案を直接入力として受け取ります。
高度に調整されたステレオカメラから得られたエピポーラ制約に基づき、ステレオ画像ペア間の提案ごとに最適なマッチングを探索する4つのマッチングアルゴリズムを提案する。
各マッチングペアはシーンのセグメンテーションを提案し、それを3dバウンディングボックス回帰ネットワークに送信する。
KITTIデータセットの広範な実験結果から,提案したSiameseパイプラインは,最先端のステレオベース3Dバウンディングボックス回帰法よりも優れた性能を示した。
関連論文リスト
- MVD-Fusion: Single-view 3D via Depth-consistent Multi-view Generation [54.27399121779011]
本稿では,多視点RGB-D画像の生成モデルを用いて,単視点3次元推論を行うMVD-Fusionを提案する。
提案手法は,蒸留に基づく3D推論や先行多視点生成手法など,最近の最先端技術と比較して,より正確な合成を実現することができることを示す。
論文 参考訳(メタデータ) (2024-04-04T17:59:57Z) - Monocular 3D Object Detection with Bounding Box Denoising in 3D by
Perceiver [45.16079927526731]
モノクル3D物体検出の主な課題は、3D中心の正確な位置決めである。
本稿では,2次元から3次元への情報フローと3次元から2次元への情報フローを組み合わせた段階的アプローチを提案する。
提案手法はMonoXiverと命名され, 背骨単分子3D検出器に容易に適用可能である。
論文 参考訳(メタデータ) (2023-04-03T18:24:46Z) - OPA-3D: Occlusion-Aware Pixel-Wise Aggregation for Monocular 3D Object
Detection [51.153003057515754]
OPA-3Dは、Occlusion-Aware Pixel-Wise Aggregationネットワークである。
密集した風景深度と、奥行きのある箱残量と物の境界箱を共同で推定する。
メインカーのカテゴリーでは最先端の手法よりも優れています。
論文 参考訳(メタデータ) (2022-11-02T14:19:13Z) - DSGN++: Exploiting Visual-Spatial Relation forStereo-based 3D Detectors [60.88824519770208]
カメラベースの3Dオブジェクト検出器は、LiDARセンサーよりも広い展開と低価格のため歓迎されている。
我々は3次元幾何学と意味論の両方を表現するステレオボリューム構造について、以前のステレオモデリングDSGNを再考する。
本稿では,2次元から3次元のパイプラインを通しての情報フローを改善することを目的としたDSGN++を提案する。
論文 参考訳(メタデータ) (2022-04-06T18:43:54Z) - Multi-View Multi-Person 3D Pose Estimation with Plane Sweep Stereo [71.59494156155309]
既存のマルチビュー3Dポーズ推定手法は、複数のカメラビューからグループ2Dポーズ検出に対するクロスビュー対応を明確に確立する。
平面スイープステレオに基づくマルチビュー3Dポーズ推定手法を提案し、クロスビュー融合と3Dポーズ再構築を1ショットで共同で解決します。
論文 参考訳(メタデータ) (2021-04-06T03:49:35Z) - Stereo CenterNet based 3D Object Detection for Autonomous Driving [2.508414661327797]
ステレオ画像の幾何学的情報を用いた3次元物体検出手法Stereo CenterNetを提案する。
Stereo CenterNetは、空間内のオブジェクトの3D境界ボックスの4つの意味キーポイントを予測し、3D空間におけるオブジェクトのバウンディングボックスを復元するために、2D左の右ボックス、3D次元、向き、キーポイントを使用する。
KITTIデータセットを用いた実験により, ステレオ幾何に基づく最先端手法と比較して, 高速かつ高精度なトレードオフを実現することができた。
論文 参考訳(メタデータ) (2021-03-20T02:18:49Z) - Reinforced Axial Refinement Network for Monocular 3D Object Detection [160.34246529816085]
モノクロ3次元物体検出は、2次元入力画像から物体の位置と特性を抽出することを目的としている。
従来のアプローチでは、空間から3D境界ボックスをサンプリングし、対象オブジェクトと各オブジェクトの関係を推定するが、有効サンプルの確率は3D空間で比較的小さい。
我々は,まず最初の予測から始めて,各ステップで1つの3dパラメータだけを変えて,基礎的真理に向けて徐々に洗練することを提案する。
これは、いくつかのステップの後に報酬を得るポリシーを設計する必要があるため、最適化するために強化学習を採用します。
論文 参考訳(メタデータ) (2020-08-31T17:10:48Z) - Stereo RGB and Deeper LIDAR Based Network for 3D Object Detection [40.34710686994996]
3Dオブジェクト検出は、自動運転のシナリオにおいて新たな課題となっている。
以前の作業では、プロジェクションベースまたはボクセルベースのモデルを使用して3Dポイントクラウドを処理していた。
本稿では,意味情報と空間情報の同時利用が可能なStereo RGBおよびDeeper LIDARフレームワークを提案する。
論文 参考訳(メタデータ) (2020-06-09T11:19:24Z) - DOPS: Learning to Detect 3D Objects and Predict their 3D Shapes [54.239416488865565]
LIDARデータに対する高速な1段3次元物体検出法を提案する。
我々の手法の中核となる新規性は高速かつシングルパスアーキテクチャであり、どちらも3次元の物体を検出し、それらの形状を推定する。
提案手法は,ScanNetシーンのオブジェクト検出で5%,オープンデータセットでは3.4%の精度で結果が得られた。
論文 参考訳(メタデータ) (2020-04-02T17:48:50Z) - SMOKE: Single-Stage Monocular 3D Object Detection via Keypoint
Estimation [3.1542695050861544]
3Dの向きとオブジェクトの変換を推定することは、インフラストラクチャレスの自律走行と運転に不可欠である。
SMOKEと呼ばれる新しい3次元オブジェクト検出手法を提案する。
構造的単純さにもかかわらず、提案するSMOKEネットワークは、KITTIデータセット上の既存のモノクル3D検出方法よりも優れている。
論文 参考訳(メタデータ) (2020-02-24T08:15:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。