論文の概要: DSGN: Deep Stereo Geometry Network for 3D Object Detection
- arxiv url: http://arxiv.org/abs/2001.03398v3
- Date: Wed, 8 Apr 2020 03:30:28 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-12 23:15:28.277185
- Title: DSGN: Deep Stereo Geometry Network for 3D Object Detection
- Title(参考訳): DSGN:3次元物体検出のための深部ステレオ幾何ネットワーク
- Authors: Yilun Chen, Shu Liu, Xiaoyong Shen, Jiaya Jia
- Abstract要約: 画像ベースとLiDARベースの3Dオブジェクト検出器の間には大きなパフォーマンスギャップがある。
我々の手法であるDeep Stereo Geometry Network (DSGN)は,このギャップを著しく低減する。
初めて、シンプルで効果的な1段ステレオベースの3D検出パイプラインを提供する。
- 参考スコア(独自算出の注目度): 79.16397166985706
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Most state-of-the-art 3D object detectors heavily rely on LiDAR sensors
because there is a large performance gap between image-based and LiDAR-based
methods. It is caused by the way to form representation for the prediction in
3D scenarios. Our method, called Deep Stereo Geometry Network (DSGN),
significantly reduces this gap by detecting 3D objects on a differentiable
volumetric representation -- 3D geometric volume, which effectively encodes 3D
geometric structure for 3D regular space. With this representation, we learn
depth information and semantic cues simultaneously. For the first time, we
provide a simple and effective one-stage stereo-based 3D detection pipeline
that jointly estimates the depth and detects 3D objects in an end-to-end
learning manner. Our approach outperforms previous stereo-based 3D detectors
(about 10 higher in terms of AP) and even achieves comparable performance with
several LiDAR-based methods on the KITTI 3D object detection leaderboard. Our
code is publicly available at https://github.com/chenyilun95/DSGN.
- Abstract(参考訳): 多くの最先端の3Dオブジェクト検出器は、画像ベースとLiDARベースの方法の間に大きなパフォーマンスギャップがあるため、LiDARセンサーに大きく依存している。
これは、3dシナリオで予測のための表現を形成する方法によって引き起こされる。
本手法は,DSGN(Deep Stereo Geometry Network)と呼ばれ,3次元正規空間の3次元幾何構造を効果的にエンコードする,微分可能な体積表現上の3次元物体を検出することで,このギャップを著しく低減する。
この表現で深度情報と意味的手がかりを同時に学習する。
筆者らは初めて,深度を共同で推定し,エンドツーエンドの学習方法で3Dオブジェクトを検出する,シンプルで効果的な1段ステレオベース3D検出パイプラインを提供する。
提案手法は従来のステレオ3D検出器(APの約10倍)より優れており,KITTI3Dオブジェクト検出リーダボード上でのLiDAR法と同等の性能を実現している。
私たちのコードはhttps://github.com/chenyilun95/dsgnで公開されています。
関連論文リスト
- 3D Small Object Detection with Dynamic Spatial Pruning [62.72638845817799]
本稿では,3次元小物体検出のための効率的な特徴解析手法を提案する。
空間分解能の高いDSPDet3Dというマルチレベル3次元検出器を提案する。
ほぼ全ての物体を検知しながら、4500k以上のポイントからなる建物全体を直接処理するには2秒もかからない。
論文 参考訳(メタデータ) (2023-05-05T17:57:04Z) - DSGN++: Exploiting Visual-Spatial Relation forStereo-based 3D Detectors [60.88824519770208]
カメラベースの3Dオブジェクト検出器は、LiDARセンサーよりも広い展開と低価格のため歓迎されている。
我々は3次元幾何学と意味論の両方を表現するステレオボリューム構造について、以前のステレオモデリングDSGNを再考する。
本稿では,2次元から3次元のパイプラインを通しての情報フローを改善することを目的としたDSGN++を提案する。
論文 参考訳(メタデータ) (2022-04-06T18:43:54Z) - EGFN: Efficient Geometry Feature Network for Fast Stereo 3D Object
Detection [51.52496693690059]
高速ステレオベース3Dオブジェクト検出器は高精度指向法よりもはるかに遅れている。
主な理由として,高速ステレオ法における3次元幾何学的特徴表現の欠如や不足があげられる。
提案された EGFN は、YOLOStsereo3D よりも5.16%向上し、mAP$_3d$ をわずか12msで上回った。
論文 参考訳(メタデータ) (2021-11-28T05:25:36Z) - Voxel-based 3D Detection and Reconstruction of Multiple Objects from a
Single Image [22.037472446683765]
入力画像から3次元特徴持ち上げ演算子を用いて3次元シーン空間に整合した3次元ボクセル特徴の正規格子を学習する。
この3Dボクセルの特徴に基づき,新しいCenterNet-3D検出ヘッドは3D空間におけるキーポイント検出として3D検出を定式化する。
我々は、粗度ボキセル化や、新しい局所PCA-SDF形状表現を含む、効率的な粗度から細度の再構成モジュールを考案する。
論文 参考訳(メタデータ) (2021-11-04T18:30:37Z) - LIGA-Stereo: Learning LiDAR Geometry Aware Representations for
Stereo-based 3D Detector [80.7563981951707]
本稿では,LIGA-Stereoによるステレオ3次元検出器の学習について,LiDARに基づく検出モデルの高レベルな幾何認識表現の指導の下で提案する。
現状のステレオ検出器と比較して,車,歩行者,サイクリストの3次元検出性能は,それぞれ10.44%,5.69%,5.97%向上した。
論文 参考訳(メタデータ) (2021-08-18T17:24:40Z) - YOLOStereo3D: A Step Back to 2D for Efficient Stereo 3D Detection [6.5702792909006735]
YOLOStereo3Dは1つのGPUでトレーニングされ、10fps以上で動作する。
LiDARデータを使わずに、最先端のステレオ3D検出フレームワークに匹敵するパフォーマンスを示す。
論文 参考訳(メタデータ) (2021-03-17T03:43:54Z) - PLUME: Efficient 3D Object Detection from Stereo Images [95.31278688164646]
既存の手法では、2つのステップでこの問題に対処する: 第一深度推定を行い、その深さ推定から擬似LiDAR点雲表現を計算し、3次元空間で物体検出を行う。
この2つのタスクを同一のメトリック空間で統一するモデルを提案する。
提案手法は,既存の手法と比較して推定時間を大幅に削減し,挑戦的なKITTIベンチマークの最先端性能を実現する。
論文 参考訳(メタデータ) (2021-01-17T05:11:38Z) - RTS3D: Real-time Stereo 3D Detection from 4D Feature-Consistency
Embedding Space for Autonomous Driving [3.222802562733787]
RTS3Dというステレオ画像から効率的かつ高精度な3次元物体検出法を提案する。
KITTIベンチマークの実験は、RTS3Dがステレオ画像3D検出のための最初の真のリアルタイムシステムであることを示しています。
論文 参考訳(メタデータ) (2020-12-30T07:56:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。