論文の概要: Accurate and Real-time Pseudo Lidar Detection: Is Stereo Neural Network
Really Necessary?
- arxiv url: http://arxiv.org/abs/2206.13858v1
- Date: Tue, 28 Jun 2022 09:53:00 GMT
- ステータス: 処理完了
- システム内更新日: 2022-06-29 13:35:29.242757
- Title: Accurate and Real-time Pseudo Lidar Detection: Is Stereo Neural Network
Really Necessary?
- Title(参考訳): 正確なリアルタイム擬似ライダー検出:ステレオニューラルネットワークは本当に必要か?
- Authors: Haitao Meng, Changcai Li, Gang Chen and Alois Knoll
- Abstract要約: 我々は,より強力なステレオマッチング予測器を備えたシステムを開発し,精度向上のための改良手法を提案する。
提案システムは23ミリ秒の計算で最先端のアプローチと競合する精度を達成し,実車用アプリケーションへのデプロイに適した候補であることを示す。
- 参考スコア(独自算出の注目度): 6.8067583993953775
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The proposal of Pseudo-Lidar representation has significantly narrowed the
gap between visual-based and active Lidar-based 3D object detection. However,
current researches exclusively focus on pushing the accuracy improvement of
Pseudo-Lidar by taking the advantage of complex and time-consuming neural
networks. Seldom explore the profound characteristics of Pseudo-Lidar
representation to obtain the promoting opportunities. In this paper, we dive
deep into the pseudo Lidar representation and argue that the performance of 3D
object detection is not fully dependent on the high precision stereo depth
estimation. We demonstrate that even for the unreliable depth estimation, with
proper data processing and refining, it can achieve comparable 3D object
detection accuracy. With this finding, we further show the possibility that
utilizing fast but inaccurate stereo matching algorithms in the Pseudo-Lidar
system to achieve low latency responsiveness. In the experiments, we develop a
system with a less powerful stereo matching predictor and adopt the proposed
refinement schemes to improve the accuracy. The evaluation on the KITTI
benchmark shows that the presented system achieves competitive accuracy to the
state-of-the-art approaches with only 23 ms computing, showing it is a suitable
candidate for deploying to real car-hold applications.
- Abstract(参考訳): Pseudo-Lidar表現の提案は、視覚ベースとアクティブなLidarベースの3Dオブジェクト検出のギャップを大幅に狭めた。
しかし、現在の研究は、複雑で時間を要するニューラルネットワークの利点を生かして、擬似ライダーの精度向上に重点を置いている。
Pseudo-Lidar表現の深い特徴を探求することはめったにない。
本稿では, 擬似ライダー表現を深く掘り下げ, 3次元物体検出の性能は高精度ステレオ深度推定に完全に依存していないと主張している。
信頼性の低い深度推定でも、適切なデータ処理と精錬によって、同等の3Dオブジェクト検出精度が得られることを示す。
そこで本研究では,疑似ライダーシステムにおいて,高速だが不正確なステレオマッチングアルゴリズムを用いて低レイテンシ応答性を実現する可能性を示す。
実験では,より強力なステレオマッチング予測器を用いたシステムを開発し,精度向上のための改良手法を提案する。
KITTIベンチマークの評価では,23msの計算量で最先端のアプローチと競合する精度が得られ,実車用アプリケーションへのデプロイに適した候補であることが示されている。
関連論文リスト
- SCIPaD: Incorporating Spatial Clues into Unsupervised Pose-Depth Joint Learning [17.99904937160487]
本研究では,教師なし深層学習のための空間的手がかりを取り入れた新しいアプローチであるSCIPaDを紹介する。
SCIPaDは平均翻訳誤差22.2%、カメラポーズ推定タスクの平均角誤差34.8%をKITTI Odometryデータセットで達成している。
論文 参考訳(メタデータ) (2024-07-07T06:52:51Z) - Rethinking Voxelization and Classification for 3D Object Detection [68.8204255655161]
LiDARポイントクラウドからの3Dオブジェクト検出の主な課題は、ネットワークの信頼性に影響を与えることなく、リアルタイムのパフォーマンスを実現することである。
本稿では,高速な動的ボキセラライザを実装することにより,ネットワークの推論速度と精度を同時に向上するソリューションを提案する。
さらに,予測対象を分類し,偽検出対象をフィルタリングする軽量検出サブヘッドモデルを提案する。
論文 参考訳(メタデータ) (2023-01-10T16:22:04Z) - 3D Harmonic Loss: Towards Task-consistent and Time-friendly 3D Object
Detection on Edge for Intelligent Transportation System [28.55894241049706]
本稿では,ポイントクラウドに基づく不整合予測を緩和する3次元高調波損失関数を提案する。
提案手法はベンチマークモデルよりも性能が大幅に向上する。
私たちのコードはオープンソースで公開されています。
論文 参考訳(メタデータ) (2022-11-07T10:11:48Z) - Self-Configurable Stabilized Real-Time Detection Learning for Autonomous
Driving Applications [15.689145350449737]
光フロー推定による物体検出ニューラルネットワークの性能向上を図る。
動的車両環境に合うように光の流れを使うかどうかを適応的に決定する。
実演では,提案フレームワークの精度が3.02%向上し,検出対象数が59.6%向上し,計算の待ち行列安定性が向上した。
論文 参考訳(メタデータ) (2022-09-29T03:11:33Z) - AGO-Net: Association-Guided 3D Point Cloud Object Detection Network [86.10213302724085]
ドメイン適応によるオブジェクトの無傷な特徴を関連付ける新しい3D検出フレームワークを提案する。
我々は,KITTIの3D検出ベンチマークにおいて,精度と速度の両面で最新の性能を実現する。
論文 参考訳(メタデータ) (2022-08-24T16:54:38Z) - PDC-Net+: Enhanced Probabilistic Dense Correspondence Network [161.76275845530964]
高度確率密度対応ネットワーク(PDC-Net+)は、精度の高い高密度対応を推定できる。
我々は、堅牢で一般化可能な不確実性予測に適したアーキテクチャと強化されたトレーニング戦略を開発する。
提案手法は,複数の挑戦的幾何マッチングと光学的フローデータセットに対して,最先端の結果を得る。
論文 参考訳(メタデータ) (2021-09-28T17:56:41Z) - Probabilistic and Geometric Depth: Detecting Objects in Perspective [78.00922683083776]
3次元物体検出は、運転支援システムなどの様々な実用用途で必要とされる重要な機能である。
双眼視やLiDARに頼っている従来の設定に比べて、経済的な解決策として単眼3D検出が注目されているが、それでも満足のいく結果が得られていない。
本稿ではまず,この問題に関する系統的研究を行い,現在の単分子3次元検出問題をインスタンス深度推定問題として単純化できることを考察する。
論文 参考訳(メタデータ) (2021-07-29T16:30:33Z) - Lite-FPN for Keypoint-based Monocular 3D Object Detection [18.03406686769539]
keypointベースのモノクロ3dオブジェクト検出は、非常に進歩し、高い速度精度のトレードオフを達成した。
マルチスケール機能融合を実現する軽量機能ピラミッドネットワークLite-FPNを提案します。
提案手法は,高い精度とフレームレートを同時に達成する。
論文 参考訳(メタデータ) (2021-05-01T14:44:31Z) - Multi-view Depth Estimation using Epipolar Spatio-Temporal Networks [87.50632573601283]
一つのビデオから多視点深度を推定する新しい手法を提案する。
提案手法は,新しいEpipolar Spatio-Temporal Transformer(EST)を用いて時間的コヒーレントな深度推定を行う。
最近のMixture-of-Expertsモデルにインスパイアされた計算コストを削減するため、我々はコンパクトなハイブリッドネットワークを設計する。
論文 参考訳(メタデータ) (2020-11-26T04:04:21Z) - A Smooth Representation of Belief over SO(3) for Deep Rotation Learning
with Uncertainty [33.627068152037815]
本稿では、3次元回転群の新しい対称行列表現 SO(3) と、学習モデルに特に適する2つの重要な性質について述べる。
我々は,2つのデータモダリティに基づいて深部神経回転回帰器を訓練することにより,定式化の利点を実証的に検証した。
この機能は、新しい入力を検出することで、学習したモデルの破滅的な失敗を防ぐ安全クリティカルなアプリケーションにとって鍵となる。
論文 参考訳(メタデータ) (2020-06-01T15:57:45Z) - Spatial-Spectral Residual Network for Hyperspectral Image
Super-Resolution [82.1739023587565]
ハイパースペクトル画像超解像のための新しいスペクトル空間残差ネットワーク(SSRNet)を提案する。
提案手法は,2次元畳み込みではなく3次元畳み込みを用いて空間スペクトル情報の探索を効果的に行うことができる。
各ユニットでは空間的・時間的分離可能な3次元畳み込みを用いて空間的・スペクトル的な情報を抽出する。
論文 参考訳(メタデータ) (2020-01-14T03:34:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。