論文の概要: 2nd Place Solution for Waymo Open Dataset Challenge - Real-time 2D
Object Detection
- arxiv url: http://arxiv.org/abs/2106.08713v1
- Date: Wed, 16 Jun 2021 11:32:03 GMT
- ステータス: 処理完了
- システム内更新日: 2021-06-17 17:22:05.992541
- Title: 2nd Place Solution for Waymo Open Dataset Challenge - Real-time 2D
Object Detection
- Title(参考訳): 2nd Place Solution for Waymo Open Dataset Challenge - リアルタイム2Dオブジェクト検出
- Authors: Yueming Zhang, Xiaolin Song, Bing Bai, Tengfei Xing, Chao Liu, Xin
Gao, Zhihui Wang, Yawei Wen, Haojin Liao, Guoshan Zhang, Pengfei Xu
- Abstract要約: 本稿では,画像から2次元物体を検出するリアルタイム手法を提案する。
我々は、加速度RTを活用して、検出パイプラインの推論時間を最適化する。
我々のフレームワークはNvidia Tesla V100 GPU上で45.8ms/frameのレイテンシを実現する。
- 参考スコア(独自算出の注目度): 26.086623067939605
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In an autonomous driving system, it is essential to recognize vehicles,
pedestrians and cyclists from images. Besides the high accuracy of the
prediction, the requirement of real-time running brings new challenges for
convolutional network models. In this report, we introduce a real-time method
to detect the 2D objects from images. We aggregate several popular one-stage
object detectors and train the models of variety input strategies
independently, to yield better performance for accurate multi-scale detection
of each category, especially for small objects. For model acceleration, we
leverage TensorRT to optimize the inference time of our detection pipeline. As
shown in the leaderboard, our proposed detection framework ranks the 2nd place
with 75.00% L1 mAP and 69.72% L2 mAP in the real-time 2D detection track of the
Waymo Open Dataset Challenges, while our framework achieves the latency of
45.8ms/frame on an Nvidia Tesla V100 GPU.
- Abstract(参考訳): 自動運転システムでは、画像から車両、歩行者、サイクリストを認識することが不可欠である。
予測の正確性に加えて、リアルタイム実行の必要性は畳み込みネットワークモデルに新たな課題をもたらす。
本稿では,画像から2次元物体をリアルタイムに検出する手法を提案する。
我々は,複数の一般的な一段階物体検出器を収集し,様々な入力戦略のモデルを個別に訓練することにより,各カテゴリ,特に小型物体の正確なマルチスケール検出性能を向上させる。
モデル加速にはTensorRTを使用し、検出パイプラインの推論時間を最適化する。
リーダボードに示されているように、当社の提案した検出フレームワークは、Waymo Open Dataset Challengesのリアルタイム2D検出トラックにおいて、75.00% L1 mAPと69.72% L2 mAPの2位にランク付けしています。
関連論文リスト
- Transformer-based Fusion of 2D-pose and Spatio-temporal Embeddings for
Distracted Driver Action Recognition [8.841708075914353]
運転行動の時間的局所化は、先進的な運転支援システムと自然主義運転研究にとって重要である。
本研究では,映像行動認識と2次元人文推定ネットワークを1つのモデルに適用することにより,時間的局所化と分類精度の向上を目指す。
このモデルは、2023年のNVIDIA AI City ChallengeというA2テストセットで、自然な運転行動認識のためにうまく機能する。
論文 参考訳(メタデータ) (2024-03-11T10:26:38Z) - ByteTrackV2: 2D and 3D Multi-Object Tracking by Associating Every
Detection Box [81.45219802386444]
マルチオブジェクトトラッキング(MOT)は、ビデオフレーム間のオブジェクトのバウンディングボックスとIDを推定することを目的としている。
低スコア検出ボックス内の真のオブジェクトをマイニングするための階層型データアソシエーション戦略を提案する。
3次元のシナリオでは、トラッカーが世界座標の物体速度を予測するのがずっと簡単である。
論文 参考訳(メタデータ) (2023-03-27T15:35:21Z) - Optimizing Anchor-based Detectors for Autonomous Driving Scenes [22.946814647030667]
本稿では、自律走行シーンにおける一般的なアンカーベース検出器のモデル改善と推定時間最適化について要約する。
高性能RCNN-RSおよびRetinaNet-RS検出フレームワークに基づいて,群衆シーンの小さな物体をよりよく検出するために,検出器に適応するための一連のフレームワークの改善について検討した。
論文 参考訳(メタデータ) (2022-08-11T22:44:59Z) - AutoAlignV2: Deformable Feature Aggregation for Dynamic Multi-Modal 3D
Object Detection [17.526914782562528]
我々はAutoAlign上に構築された高速で強力なマルチモーダル3D検出フレームワークであるAutoAlignV2を提案する。
我々の最良のモデルは、nuScenesテストのリーダーボード上で72.4 NDSに達し、新しい最先端の結果が得られます。
論文 参考訳(メタデータ) (2022-07-21T06:17:23Z) - Benchmarking the Robustness of LiDAR-Camera Fusion for 3D Object
Detection [58.81316192862618]
自律運転における3D知覚のための2つの重要なセンサーは、カメラとLiDARである。
これら2つのモダリティを融合させることで、3次元知覚モデルの性能を大幅に向上させることができる。
我々は、最先端の核融合法を初めてベンチマークした。
論文 参考訳(メタデータ) (2022-05-30T09:35:37Z) - Workshop on Autonomous Driving at CVPR 2021: Technical Report for
Streaming Perception Challenge [57.647371468876116]
本稿では,現実的な自律運転シナリオのためのリアルタイム2次元物体検出システムについて紹介する。
私たちの検出器は、YOLOXと呼ばれる新しい設計のYOLOモデルで構築されています。
Argoverse-HDデータセットでは,検出のみのトラック/トラックで2位を7.8/6.1上回る41.0ストリーミングAPを達成した。
論文 参考訳(メタデータ) (2021-07-27T06:36:06Z) - Achieving Real-Time Object Detection on MobileDevices with Neural
Pruning Search [45.20331644857981]
本稿では,2次元および3次元物体検出のための自律走行車における高速推論を実現するために,コンパイラ対応のニューラルプルーニング検索フレームワークを提案する。
提案手法は, YOLOv4 を用いた2次元物体検出と PointPillars による3次元物体検出において, 実時間, 55ms および 99ms の推論時間を実現する。
論文 参考訳(メタデータ) (2021-06-28T18:59:20Z) - SODA10M: Towards Large-Scale Object Detection Benchmark for Autonomous
Driving [94.11868795445798]
我々は,SODA10Mという名の自律走行用大規模物体検出ベンチマークをリリースし,1000万枚の未ラベル画像と6つの代表対象カテゴリをラベル付けした20K画像を含む。
多様性を向上させるために、画像は32の異なる都市で、1フレームあたり10秒毎に異なる気象条件、期間、場所のシーンで収集される。
我々は、既存の教師付き最先端検出モデル、一般的な自己監督型および半教師付きアプローチ、および将来のモデルの開発方法に関するいくつかの知見について、広範な実験と詳細な分析を行った。
論文 参考訳(メタデータ) (2021-06-21T13:55:57Z) - Anchor-free Small-scale Multispectral Pedestrian Detection [88.7497134369344]
適応型単一段アンカーフリーベースアーキテクチャにおける2つのモードの効果的かつ効率的な多重スペクトル融合法を提案する。
我々は,直接的境界ボックス予測ではなく,対象の中心と規模に基づく歩行者表現の学習を目指す。
その結果,小型歩行者の検出における本手法の有効性が示唆された。
論文 参考訳(メタデータ) (2020-08-19T13:13:01Z) - 2nd Place Solution for Waymo Open Dataset Challenge -- 2D Object
Detection [7.807118356899879]
本報告では、自律走行シナリオのための最先端2次元物体検出システムについて紹介する。
我々は、人気のある2段検出器と1段検出器をアンカーフリーで統合し、堅牢な検出を行う。
論文 参考訳(メタデータ) (2020-06-28T04:50:16Z) - DR-SPAAM: A Spatial-Attention and Auto-regressive Model for Person
Detection in 2D Range Data [81.06749792332641]
本研究では,異なるタイミングで得られたスキャンを組み合わせ,代替戦略を用いた人物検出ネットワークを提案する。
DR-SPAAMは、バックボーンネットワークから中間機能をテンプレートとして保持し、新しいスキャンが利用可能になったときにテンプレートをリカレントに更新する。
DROWデータセットでは,提案手法は既存の最先端技術よりも約4倍高速である。
論文 参考訳(メタデータ) (2020-04-29T11:01:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。