論文の概要: LIGA-Stereo: Learning LiDAR Geometry Aware Representations for
Stereo-based 3D Detector
- arxiv url: http://arxiv.org/abs/2108.08258v1
- Date: Wed, 18 Aug 2021 17:24:40 GMT
- ステータス: 処理完了
- システム内更新日: 2021-08-19 15:47:21.954210
- Title: LIGA-Stereo: Learning LiDAR Geometry Aware Representations for
Stereo-based 3D Detector
- Title(参考訳): LIGA-Stereo:ステレオ3D検出器におけるLiDAR幾何学の学習
- Authors: Xiaoyang Guo, Shaoshuai Shi, Xiaogang Wang, Hongsheng Li
- Abstract要約: 本稿では,LIGA-Stereoによるステレオ3次元検出器の学習について,LiDARに基づく検出モデルの高レベルな幾何認識表現の指導の下で提案する。
現状のステレオ検出器と比較して,車,歩行者,サイクリストの3次元検出性能は,それぞれ10.44%,5.69%,5.97%向上した。
- 参考スコア(独自算出の注目度): 80.7563981951707
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Stereo-based 3D detection aims at detecting 3D object bounding boxes from
stereo images using intermediate depth maps or implicit 3D geometry
representations, which provides a low-cost solution for 3D perception. However,
its performance is still inferior compared with LiDAR-based detection
algorithms. To detect and localize accurate 3D bounding boxes, LiDAR-based
models can encode accurate object boundaries and surface normal directions from
LiDAR point clouds. However, the detection results of stereo-based detectors
are easily affected by the erroneous depth features due to the limitation of
stereo matching. To solve the problem, we propose LIGA-Stereo (LiDAR Geometry
Aware Stereo Detector) to learn stereo-based 3D detectors under the guidance of
high-level geometry-aware representations of LiDAR-based detection models. In
addition, we found existing voxel-based stereo detectors failed to learn
semantic features effectively from indirect 3D supervisions. We attach an
auxiliary 2D detection head to provide direct 2D semantic supervisions.
Experiment results show that the above two strategies improved the geometric
and semantic representation capabilities. Compared with the state-of-the-art
stereo detector, our method has improved the 3D detection performance of cars,
pedestrians, cyclists by 10.44%, 5.69%, 5.97% mAP respectively on the official
KITTI benchmark. The gap between stereo-based and LiDAR-based 3D detectors is
further narrowed.
- Abstract(参考訳): ステレオベース3D検出は,立体画像からの3次元物体境界ボックスの検出を,中間深度マップや暗黙的な3次元形状表現を用いて行うことを目的としている。
しかし、その性能はLiDARベースの検出アルゴリズムと比較しても劣っている。
正確な3Dバウンディングボックスを検出およびローカライズするために、LiDARベースのモデルは、正確なオブジェクト境界とLiDAR点雲からの通常の方向をエンコードすることができる。
しかし,ステレオ式検出器の検出結果は,ステレオマッチングの限界により誤った深さ特徴の影響を受けやすい。
そこで本研究では,LIGA-Stereo (LiDAR Geometry Aware Stereo Detector)を提案する。
さらに,既存のvoxelベースのステレオ検出器では,間接的な3次元監視から意味的特徴を効果的に学習できなかった。
補助的な2D検出ヘッドを取り付け、直接2Dセマンティック監視を行う。
実験の結果,上記の2つの戦略により,幾何学的および意味的表現能力が改善された。
最新のステレオ検出器と比較すると,公式のKITTIベンチマークでは,車,歩行者,サイクリストの3次元検出性能が10.44%,5.69%,5.97%向上した。
ステレオベースとLiDARベースの3D検出器のギャップはさらに狭められている。
関連論文リスト
- DSGN++: Exploiting Visual-Spatial Relation forStereo-based 3D Detectors [60.88824519770208]
カメラベースの3Dオブジェクト検出器は、LiDARセンサーよりも広い展開と低価格のため歓迎されている。
我々は3次元幾何学と意味論の両方を表現するステレオボリューム構造について、以前のステレオモデリングDSGNを再考する。
本稿では,2次元から3次元のパイプラインを通しての情報フローを改善することを目的としたDSGN++を提案する。
論文 参考訳(メタデータ) (2022-04-06T18:43:54Z) - Pseudo-Stereo for Monocular 3D Object Detection in Autonomous Driving [14.582107328849473]
ステレオビューにおける画像-画像生成のギャップは、画像-画像-LiDAR生成のギャップよりもはるかに小さい。
そこで我々はPseudo-Stereo 3D検出フレームワークを3つの新しい仮想ビュー生成手法で提案する。
我々のフレームワークは、KITTI-3Dベンチマークで公表されたモノクラー3D検出器の中で、車、歩行者、サイクリストで1位にランクインしている。
論文 参考訳(メタデータ) (2022-03-04T03:00:34Z) - MonoDistill: Learning Spatial Features for Monocular 3D Object Detection [80.74622486604886]
本稿では,LiDAR信号からの空間情報を単分子3D検出器に導入するための簡易かつ効果的な手法を提案する。
得られたデータを用いて、ベースラインモデルと同じアーキテクチャで3D検出器をトレーニングする。
実験の結果,提案手法はベースラインモデルの性能を大幅に向上させることができることがわかった。
論文 参考訳(メタデータ) (2022-01-26T09:21:41Z) - EGFN: Efficient Geometry Feature Network for Fast Stereo 3D Object
Detection [51.52496693690059]
高速ステレオベース3Dオブジェクト検出器は高精度指向法よりもはるかに遅れている。
主な理由として,高速ステレオ法における3次元幾何学的特徴表現の欠如や不足があげられる。
提案された EGFN は、YOLOStsereo3D よりも5.16%向上し、mAP$_3d$ をわずか12msで上回った。
論文 参考訳(メタデータ) (2021-11-28T05:25:36Z) - Stereo CenterNet based 3D Object Detection for Autonomous Driving [2.508414661327797]
ステレオ画像の幾何学的情報を用いた3次元物体検出手法Stereo CenterNetを提案する。
Stereo CenterNetは、空間内のオブジェクトの3D境界ボックスの4つの意味キーポイントを予測し、3D空間におけるオブジェクトのバウンディングボックスを復元するために、2D左の右ボックス、3D次元、向き、キーポイントを使用する。
KITTIデータセットを用いた実験により, ステレオ幾何に基づく最先端手法と比較して, 高速かつ高精度なトレードオフを実現することができた。
論文 参考訳(メタデータ) (2021-03-20T02:18:49Z) - YOLOStereo3D: A Step Back to 2D for Efficient Stereo 3D Detection [6.5702792909006735]
YOLOStereo3Dは1つのGPUでトレーニングされ、10fps以上で動作する。
LiDARデータを使わずに、最先端のステレオ3D検出フレームワークに匹敵するパフォーマンスを示す。
論文 参考訳(メタデータ) (2021-03-17T03:43:54Z) - PLUME: Efficient 3D Object Detection from Stereo Images [95.31278688164646]
既存の手法では、2つのステップでこの問題に対処する: 第一深度推定を行い、その深さ推定から擬似LiDAR点雲表現を計算し、3次元空間で物体検出を行う。
この2つのタスクを同一のメトリック空間で統一するモデルを提案する。
提案手法は,既存の手法と比較して推定時間を大幅に削減し,挑戦的なKITTIベンチマークの最先端性能を実現する。
論文 参考訳(メタデータ) (2021-01-17T05:11:38Z) - DSGN: Deep Stereo Geometry Network for 3D Object Detection [79.16397166985706]
画像ベースとLiDARベースの3Dオブジェクト検出器の間には大きなパフォーマンスギャップがある。
我々の手法であるDeep Stereo Geometry Network (DSGN)は,このギャップを著しく低減する。
初めて、シンプルで効果的な1段ステレオベースの3D検出パイプラインを提供する。
論文 参考訳(メタデータ) (2020-01-10T11:44:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。