論文の概要: Towards Safe, Real-Time Systems: Stereo vs Images and LiDAR for 3D
Object Detection
- arxiv url: http://arxiv.org/abs/2202.12773v1
- Date: Fri, 25 Feb 2022 15:41:58 GMT
- ステータス: 処理完了
- システム内更新日: 2022-02-28 15:03:54.743451
- Title: Towards Safe, Real-Time Systems: Stereo vs Images and LiDAR for 3D
Object Detection
- Title(参考訳): 安全・リアルタイムシステムに向けて:3次元物体検出のためのステレオ対画像とLiDAR
- Authors: Matthew Levine
- Abstract要約: 従来の格差アルゴリズムによるマルチモーダル学習は、パラメータの数を増やすことなく、画像ベースの結果を改善することができる。
ステレオエラーによる学習は,LiDARに類似した3Dローカライゼーション能力を付与できることを示す。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: As object detectors rapidly improve, attention has expanded past image-only
networks to include a range of 3D and multimodal frameworks, especially ones
that incorporate LiDAR. However, due to cost, logistics, and even some safety
considerations, stereo can be an appealing alternative. Towards understanding
the efficacy of stereo as a replacement for monocular input or LiDAR in object
detectors, we show that multimodal learning with traditional disparity
algorithms can improve image-based results without increasing the number of
parameters, and that learning over stereo error can impart similar 3D
localization power to LiDAR in certain contexts. Furthermore, doing so also has
calibration benefits with respect to image-only methods. We benchmark on the
public dataset KITTI, and in doing so, reveal a few small but common
algorithmic mistakes currently used in computing metrics on that set, and offer
efficient, provably correct alternatives.
- Abstract(参考訳): オブジェクト検出器が急速に改善するにつれて、画像のみのネットワークは3Dおよびマルチモーダルのフレームワーク、特にLiDARを組み込んだものを含むように拡張された。
しかし、コスト、物流、そしていくつかの安全上の考慮から、ステレオは魅力的な代替手段になり得る。
物体検出器における単分子入力やLiDARの代替としてステレオの有効性を理解するために,従来の異方性アルゴリズムを用いたマルチモーダル学習はパラメータ数を増やすことなく画像ベースの学習を向上でき,ステレオエラーによる学習は,LiDARに類似した3Dローカライゼーション力を付与できることを示した。
さらに、画像のみの方法に関してもキャリブレーションの利点がある。
私たちは公開データセットkittiでベンチマークを行い、その結果、現在そのセットのメトリクスの計算に使われている小さなが一般的なアルゴリズムミスをいくつか明らかにし、効率的で確実に正しい代替案を提供します。
関連論文リスト
- View-to-Label: Multi-View Consistency for Self-Supervised 3D Object
Detection [46.077668660248534]
本稿では,RGBシーケンスのみから,自己監督型3Dオブジェクト検出を行う手法を提案する。
KITTI 3Dデータセットを用いた実験では,最先端の自己管理手法と同等の性能を示した。
論文 参考訳(メタデータ) (2023-05-29T09:30:39Z) - Unleash the Potential of Image Branch for Cross-modal 3D Object
Detection [67.94357336206136]
画像分岐のポテンシャルを2つの側面から解き放つことを目的として,新しい3Dオブジェクト検出器UPIDetを提案する。
まず、UPIDetは正規化された局所座標写像推定と呼ばれる新しい2次元補助タスクを導入する。
第2に,イメージブランチのトレーニング目標から逆転する勾配によって,ポイントクラウドバックボーンの表現能力を向上できることを見出した。
論文 参考訳(メタデータ) (2023-01-22T08:26:58Z) - MonoDistill: Learning Spatial Features for Monocular 3D Object Detection [80.74622486604886]
本稿では,LiDAR信号からの空間情報を単分子3D検出器に導入するための簡易かつ効果的な手法を提案する。
得られたデータを用いて、ベースラインモデルと同じアーキテクチャで3D検出器をトレーニングする。
実験の結果,提案手法はベースラインモデルの性能を大幅に向上させることができることがわかった。
論文 参考訳(メタデータ) (2022-01-26T09:21:41Z) - SGM3D: Stereo Guided Monocular 3D Object Detection [62.11858392862551]
SGM3Dと呼ばれるステレオ誘導単分子物体検出ネットワークを提案する。
ステレオ画像から抽出したロバストな3次元特徴を利用して、モノクル画像から得られた特徴を強化する。
本手法は,余分な計算コストを伴わずに性能を向上させるために,他の多くの単分子的手法に統合することができる。
論文 参考訳(メタデータ) (2021-12-03T13:57:14Z) - LIGA-Stereo: Learning LiDAR Geometry Aware Representations for
Stereo-based 3D Detector [80.7563981951707]
本稿では,LIGA-Stereoによるステレオ3次元検出器の学習について,LiDARに基づく検出モデルの高レベルな幾何認識表現の指導の下で提案する。
現状のステレオ検出器と比較して,車,歩行者,サイクリストの3次元検出性能は,それぞれ10.44%,5.69%,5.97%向上した。
論文 参考訳(メタデータ) (2021-08-18T17:24:40Z) - Progressive Coordinate Transforms for Monocular 3D Object Detection [52.00071336733109]
本稿では,学習座標表現を容易にするために,PCT(Em Progressive Coordinate Transforms)と呼ばれる,新しい軽量なアプローチを提案する。
本稿では,学習座標表現を容易にするために,PCT(Em Progressive Coordinate Transforms)と呼ばれる,新しい軽量なアプローチを提案する。
論文 参考訳(メタデータ) (2021-08-12T15:22:33Z) - YOLOStereo3D: A Step Back to 2D for Efficient Stereo 3D Detection [6.5702792909006735]
YOLOStereo3Dは1つのGPUでトレーニングされ、10fps以上で動作する。
LiDARデータを使わずに、最先端のステレオ3D検出フレームワークに匹敵するパフォーマンスを示す。
論文 参考訳(メタデータ) (2021-03-17T03:43:54Z) - DSGN: Deep Stereo Geometry Network for 3D Object Detection [79.16397166985706]
画像ベースとLiDARベースの3Dオブジェクト検出器の間には大きなパフォーマンスギャップがある。
我々の手法であるDeep Stereo Geometry Network (DSGN)は,このギャップを著しく低減する。
初めて、シンプルで効果的な1段ステレオベースの3D検出パイプラインを提供する。
論文 参考訳(メタデータ) (2020-01-10T11:44:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。