論文の概要: Gated3D: Monocular 3D Object Detection From Temporal Illumination Cues
- arxiv url: http://arxiv.org/abs/2102.03602v1
- Date: Sat, 6 Feb 2021 16:06:51 GMT
- ステータス: 処理完了
- システム内更新日: 2021-02-11 08:37:29.170760
- Title: Gated3D: Monocular 3D Object Detection From Temporal Illumination Cues
- Title(参考訳): Gated3D:一時照明キューからの単眼3D物体検出
- Authors: Frank Julca-Aguilar, Jason Taylor, Mario Bijelic, Fahim Mannan, Ethan
Tseng, Felix Heide
- Abstract要約: 低コストな単分子ゲート型画像処理装置から時間的照度を利用した新しい3次元物体検出法を提案する。
提案手法は,1万km以上の運転データから得られたゲート画像を含む新しい3次元検出データセットを用いて評価する。
- 参考スコア(独自算出の注目度): 28.806932489163888
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Today's state-of-the-art methods for 3D object detection are based on lidar,
stereo, or monocular cameras. Lidar-based methods achieve the best accuracy,
but have a large footprint, high cost, and mechanically-limited angular
sampling rates, resulting in low spatial resolution at long ranges. Recent
approaches based on low-cost monocular or stereo cameras promise to overcome
these limitations but struggle in low-light or low-contrast regions as they
rely on passive CMOS sensors. In this work, we propose a novel 3D object
detection modality that exploits temporal illumination cues from a low-cost
monocular gated imager. We propose a novel deep detector architecture, Gated3D,
that is tailored to temporal illumination cues from three gated images. Gated
images allow us to exploit mature 2D object feature extractors that guide the
3D predictions through a frustum segment estimation. We assess the proposed
method on a novel 3D detection dataset that includes gated imagery captured in
over 10,000 km of driving data. We validate that our method outperforms
state-of-the-art monocular and stereo approaches at long distances. We will
release our code and dataset, opening up a new sensor modality as an avenue to
replace lidar in autonomous driving.
- Abstract(参考訳): 今日の3dオブジェクト検出の最先端の方法は、lidar、ステレオ、単眼カメラに基づいている。
lidarベースの手法は、最も精度は高いが、足跡が大きく、コストが高く、機械的に制限された角サンプリングレートがあり、長距離での空間分解能は低い。
低コストの単眼またはステレオカメラに基づく最近のアプローチは、これらの制限を克服することを約束しますが、受動CMOSセンサーに依存するため、低照度または低コントラスト領域では苦労します。
本研究では、低コストの単眼ゲート画像から時間的照明キューを利用する新しい3次元物体検出モダリティを提案する。
本稿では,3つのゲート画像からの時間的照明手がかりに合わせた,新しい深層検出器アーキテクチャgated3dを提案する。
定格画像は、フラスタムセグメント推定を通じて3D予測を導く成熟した2Dオブジェクト特徴抽出器を利用することができます。
提案手法を1万km以上の走行データで撮影したゲート画像を含む新しい3D検出データセット上で評価する。
本手法が遠距離でのモノクロおよびステレオアプローチよりも優れていることを検証した。
私たちはコードとデータセットをリリースし、自動運転でライダーを置き換える手段として新しいセンサーモダリティを開放します。
関連論文リスト
- Sparse Points to Dense Clouds: Enhancing 3D Detection with Limited LiDAR Data [68.18735997052265]
単分子と点雲に基づく3次元検出の利点を組み合わせたバランスの取れたアプローチを提案する。
本手法では,低コストで低解像度のセンサから得られる3Dポイントを少数必要としている。
3次元検出の精度は最先端の単分子検出法と比較して20%向上する。
論文 参考訳(メタデータ) (2024-04-10T03:54:53Z) - Multi-Modal 3D Object Detection by Box Matching [109.43430123791684]
マルチモーダル3次元検出のためのボックスマッチング(FBMNet)による新しいフュージョンネットワークを提案する。
3Dオブジェクトと2Dオブジェクトの提案を学習することで、ROI特徴を組み合わせることで、検出のための融合を効果的に行うことができる。
論文 参考訳(メタデータ) (2023-05-12T18:08:51Z) - Is Pseudo-Lidar needed for Monocular 3D Object detection? [32.772699246216774]
我々は,擬似ライダー法のような深度事前学習の恩恵を受けることができるエンド・ツー・エンドの単分子3次元物体検出器DD3Dを提案する。
我々のアーキテクチャは、深度推定と3次元検出の効果的な情報伝達のために設計されており、ラベルなし事前学習データの量でスケールすることができる。
論文 参考訳(メタデータ) (2021-08-13T22:22:51Z) - Progressive Coordinate Transforms for Monocular 3D Object Detection [52.00071336733109]
本稿では,学習座標表現を容易にするために,PCT(Em Progressive Coordinate Transforms)と呼ばれる,新しい軽量なアプローチを提案する。
本稿では,学習座標表現を容易にするために,PCT(Em Progressive Coordinate Transforms)と呼ばれる,新しい軽量なアプローチを提案する。
論文 参考訳(メタデータ) (2021-08-12T15:22:33Z) - YOLOStereo3D: A Step Back to 2D for Efficient Stereo 3D Detection [6.5702792909006735]
YOLOStereo3Dは1つのGPUでトレーニングされ、10fps以上で動作する。
LiDARデータを使わずに、最先端のステレオ3D検出フレームワークに匹敵するパフォーマンスを示す。
論文 参考訳(メタデータ) (2021-03-17T03:43:54Z) - PLUME: Efficient 3D Object Detection from Stereo Images [95.31278688164646]
既存の手法では、2つのステップでこの問題に対処する: 第一深度推定を行い、その深さ推定から擬似LiDAR点雲表現を計算し、3次元空間で物体検出を行う。
この2つのタスクを同一のメトリック空間で統一するモデルを提案する。
提案手法は,既存の手法と比較して推定時間を大幅に削減し,挑戦的なKITTIベンチマークの最先端性能を実現する。
論文 参考訳(メタデータ) (2021-01-17T05:11:38Z) - Single-Shot 3D Detection of Vehicles from Monocular RGB Images via
Geometry Constrained Keypoints in Real-Time [6.82446891805815]
単眼RGB画像における車両検出のための新しい3次元単発物体検出法を提案する。
提案手法は,3次元空間への2次元検出を付加回帰および分類パラメータの予測により引き上げる。
KITTI 3D Object Detection と新しい nuScenes Object Detection ベンチマークを用いて,自律走行のための異なるデータセットに対するアプローチを検証し,その評価を行った。
論文 参考訳(メタデータ) (2020-06-23T15:10:19Z) - DOPS: Learning to Detect 3D Objects and Predict their 3D Shapes [54.239416488865565]
LIDARデータに対する高速な1段3次元物体検出法を提案する。
我々の手法の中核となる新規性は高速かつシングルパスアーキテクチャであり、どちらも3次元の物体を検出し、それらの形状を推定する。
提案手法は,ScanNetシーンのオブジェクト検出で5%,オープンデータセットでは3.4%の精度で結果が得られた。
論文 参考訳(メタデータ) (2020-04-02T17:48:50Z) - DSGN: Deep Stereo Geometry Network for 3D Object Detection [79.16397166985706]
画像ベースとLiDARベースの3Dオブジェクト検出器の間には大きなパフォーマンスギャップがある。
我々の手法であるDeep Stereo Geometry Network (DSGN)は,このギャップを著しく低減する。
初めて、シンプルで効果的な1段ステレオベースの3D検出パイプラインを提供する。
論文 参考訳(メタデータ) (2020-01-10T11:44:37Z) - RTM3D: Real-time Monocular 3D Detection from Object Keypoints for
Autonomous Driving [26.216609821525676]
最も成功した3D検出器は、3Dバウンディングボックスから2Dボックスへの投射制約を重要な構成要素としている。
画像空間における3次元境界ボックスの9つの視点キーポイントを予測し、3次元空間における3次元視点と2次元視点の幾何学的関係を利用して、次元、位置、方向を復元する。
提案手法は,KITTIベンチマークの最先端性能を達成しつつ,モノクロ画像の3次元検出を行う最初のリアルタイムシステムである。
論文 参考訳(メタデータ) (2020-01-10T08:29:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。