Fugu-MT 論文翻訳(概要): Towards Safe, Real-Time Systems: Stereo vs Images and LiDAR for 3D Object Detection

論文の概要: Towards Safe, Real-Time Systems: Stereo vs Images and LiDAR for 3D Object Detection

arxiv url: http://arxiv.org/abs/2202.12773v1
Date: Fri, 25 Feb 2022 15:41:58 GMT
ステータス: 翻訳完了
システム内更新日: 2022-02-28 15:03:54.743451
Title: Towards Safe, Real-Time Systems: Stereo vs Images and LiDAR for 3D Object Detection
Title（参考訳）: 安全・リアルタイムシステムに向けて:3次元物体検出のためのステレオ対画像とLiDAR
Authors: Matthew Levine
Abstract要約: 従来の格差アルゴリズムによるマルチモーダル学習は、パラメータの数を増やすことなく、画像ベースの結果を改善することができる。ステレオエラーによる学習は,LiDARに類似した3Dローカライゼーション能力を付与できることを示す。
参考スコア（独自算出の注目度）: 0.0
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: As object detectors rapidly improve, attention has expanded past image-only networks to include a range of 3D and multimodal frameworks, especially ones that incorporate LiDAR. However, due to cost, logistics, and even some safety considerations, stereo can be an appealing alternative. Towards understanding the efficacy of stereo as a replacement for monocular input or LiDAR in object detectors, we show that multimodal learning with traditional disparity algorithms can improve image-based results without increasing the number of parameters, and that learning over stereo error can impart similar 3D localization power to LiDAR in certain contexts. Furthermore, doing so also has calibration benefits with respect to image-only methods. We benchmark on the public dataset KITTI, and in doing so, reveal a few small but common algorithmic mistakes currently used in computing metrics on that set, and offer efficient, provably correct alternatives.
Abstract（参考訳）: オブジェクト検出器が急速に改善するにつれて、画像のみのネットワークは3Dおよびマルチモーダルのフレームワーク、特にLiDARを組み込んだものを含むように拡張された。しかし、コスト、物流、そしていくつかの安全上の考慮から、ステレオは魅力的な代替手段になり得る。物体検出器における単分子入力やLiDARの代替としてステレオの有効性を理解するために,従来の異方性アルゴリズムを用いたマルチモーダル学習はパラメータ数を増やすことなく画像ベースの学習を向上でき,ステレオエラーによる学習は,LiDARに類似した3Dローカライゼーション力を付与できることを示した。さらに、画像のみの方法に関してもキャリブレーションの利点がある。私たちは公開データセットkittiでベンチマークを行い、その結果、現在そのセットのメトリクスの計算に使われている小さなが一般的なアルゴリズムミスをいくつか明らかにし、効率的で確実に正しい代替案を提供します。

関連論文リスト

Shelf-Supervised Cross-Modal Pre-Training for 3D Object Detection [52.66283064389691]
最先端の3Dオブジェクト検出器は、しばしば大量のラベル付きデータセットで訓練される。近年の研究では、ラベル付きデータによる自己教師付き事前学習が、ラベル付きラベルによる検出精度を向上させることが示されている。組合わせRGBとLiDARデータからゼロショット3Dバウンディングボックスを生成するためのシェルフ制御手法を提案する。
論文参考訳（メタデータ） (2024-06-14T15:21:57Z)
Sparse Points to Dense Clouds: Enhancing 3D Detection with Limited LiDAR Data [68.18735997052265]
単分子と点雲に基づく3次元検出の利点を組み合わせたバランスの取れたアプローチを提案する。本手法では,低コストで低解像度のセンサから得られる3Dポイントを少数必要としている。 3次元検出の精度は最先端の単分子検出法と比較して20%向上する。
論文参考訳（メタデータ） (2024-04-10T03:54:53Z)
View-to-Label: Multi-View Consistency for Self-Supervised 3D Object Detection [46.077668660248534]
本稿では,RGBシーケンスのみから,自己監督型3Dオブジェクト検出を行う手法を提案する。 KITTI 3Dデータセットを用いた実験では,最先端の自己管理手法と同等の性能を示した。
論文参考訳（メタデータ） (2023-05-29T09:30:39Z)
MonoDistill: Learning Spatial Features for Monocular 3D Object Detection [80.74622486604886]
本稿では,LiDAR信号からの空間情報を単分子3D検出器に導入するための簡易かつ効果的な手法を提案する。得られたデータを用いて、ベースラインモデルと同じアーキテクチャで3D検出器をトレーニングする。実験の結果,提案手法はベースラインモデルの性能を大幅に向上させることができることがわかった。
論文参考訳（メタデータ） (2022-01-26T09:21:41Z)
SGM3D: Stereo Guided Monocular 3D Object Detection [62.11858392862551]
SGM3Dと呼ばれるステレオ誘導単分子物体検出ネットワークを提案する。ステレオ画像から抽出したロバストな3次元特徴を利用して、モノクル画像から得られた特徴を強化する。本手法は,余分な計算コストを伴わずに性能を向上させるために,他の多くの単分子的手法に統合することができる。
論文参考訳（メタデータ） (2021-12-03T13:57:14Z)
LIGA-Stereo: Learning LiDAR Geometry Aware Representations for Stereo-based 3D Detector [80.7563981951707]
本稿では,LIGA-Stereoによるステレオ3次元検出器の学習について,LiDARに基づく検出モデルの高レベルな幾何認識表現の指導の下で提案する。現状のステレオ検出器と比較して,車,歩行者,サイクリストの3次元検出性能は,それぞれ10.44%,5.69%,5.97%向上した。
論文参考訳（メタデータ） (2021-08-18T17:24:40Z)
Progressive Coordinate Transforms for Monocular 3D Object Detection [52.00071336733109]
本稿では,学習座標表現を容易にするために,PCT(Em Progressive Coordinate Transforms)と呼ばれる,新しい軽量なアプローチを提案する。本稿では,学習座標表現を容易にするために,PCT(Em Progressive Coordinate Transforms)と呼ばれる,新しい軽量なアプローチを提案する。
論文参考訳（メタデータ） (2021-08-12T15:22:33Z)
YOLOStereo3D: A Step Back to 2D for Efficient Stereo 3D Detection [6.5702792909006735]
YOLOStereo3Dは1つのGPUでトレーニングされ、10fps以上で動作する。 LiDARデータを使わずに、最先端のステレオ3D検出フレームワークに匹敵するパフォーマンスを示す。
論文参考訳（メタデータ） (2021-03-17T03:43:54Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。