論文の概要: Improving 3D Object Detection through Progressive Population Based
Augmentation
- arxiv url: http://arxiv.org/abs/2004.00831v2
- Date: Thu, 16 Jul 2020 19:07:15 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-17 12:47:29.813910
- Title: Improving 3D Object Detection through Progressive Population Based
Augmentation
- Title(参考訳): プログレッシブ・ポピュレーションによる3次元物体検出の改善
- Authors: Shuyang Cheng, Zhaoqi Leng, Ekin Dogus Cubuk, Barret Zoph, Chunyan
Bai, Jiquan Ngiam, Yang Song, Benjamin Caine, Vijay Vasudevan, Congcong Li,
Quoc V. Le, Jonathon Shlens, Dragomir Anguelov
- Abstract要約: 本稿では3次元オブジェクト検出のためのデータ拡張ポリシーの設計を自動化するための最初の試みを示す。
このアルゴリズムは,探索空間を狭め,過去の反復で発見された最良のパラメータを採用することで,拡張戦略の最適化を学習する。
PPBAは, 拡張のないベースライン3次元検出モデルよりも最大10倍のデータ効率が高く, ラベル付きモデルよりもはるかに少ない精度で3次元検出モデルが競合精度を達成できる可能性が示唆された。
- 参考スコア(独自算出の注目度): 91.56261177665762
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Data augmentation has been widely adopted for object detection in 3D point
clouds. However, all previous related efforts have focused on manually
designing specific data augmentation methods for individual architectures. In
this work, we present the first attempt to automate the design of data
augmentation policies for 3D object detection. We introduce the Progressive
Population Based Augmentation (PPBA) algorithm, which learns to optimize
augmentation strategies by narrowing down the search space and adopting the
best parameters discovered in previous iterations. On the KITTI 3D detection
test set, PPBA improves the StarNet detector by substantial margins on the
moderate difficulty category of cars, pedestrians, and cyclists, outperforming
all current state-of-the-art single-stage detection models. Additional
experiments on the Waymo Open Dataset indicate that PPBA continues to
effectively improve the StarNet and PointPillars detectors on a 20x larger
dataset compared to KITTI. The magnitude of the improvements may be comparable
to advances in 3D perception architectures and the gains come without an
incurred cost at inference time. In subsequent experiments, we find that PPBA
may be up to 10x more data efficient than baseline 3D detection models without
augmentation, highlighting that 3D detection models may achieve competitive
accuracy with far fewer labeled examples.
- Abstract(参考訳): データ拡張は3Dポイントクラウドにおけるオブジェクト検出に広く採用されている。
しかしながら、以前のすべての取り組みは、個々のアーキテクチャのための特定のデータ拡張メソッドを手作業で設計することに集中してきた。
本研究では,3次元オブジェクト検出のためのデータ拡張ポリシーの設計を自動化する最初の試みを示す。
探索空間を狭くし,前回の反復で発見された最良パラメータを採用することで,拡張戦略を最適化するために学習するprogressive population based augmentation (ppba)アルゴリズムを導入する。
KITTIの3D検出テストセットでは、PPBAは車、歩行者、サイクリストの適度な難易度カテゴリーのかなりのマージンでStarNet検出器を改良し、現在の最先端の単一ステージ検出モデルを上回っている。
Waymo Open Datasetに関するさらなる実験は、PPBAがKITTIと比較して20倍大きなデータセット上のStarNetとPointPillars検出器を効果的に改善していることを示している。
改善の規模は3D知覚アーキテクチャの進歩に匹敵する可能性があり、利得は推論時のコストを伴わない。
その後の実験では,PPBAは拡張のないベースライン3D検出モデルよりも最大10倍のデータ効率が向上し,ラベル付きモデルよりもはるかに少ない精度で3D検出モデルが競合する可能性が示唆された。
関連論文リスト
- Exploring and Improving the Spatial Reasoning Abilities of Large
Language Models [0.0]
LLM(Large Language Models)は、シーケンスモデリングのツールである。
本稿では,ChatGPT-3.5,ChatGPT-4,Llama 2 7Bの3次元ロボット軌道データと対向する性能について検討する。
3Dトラジェクトリデータに33%の改善をもたらす新しいプレフィックスベースのプロンプト機構を導入する。
論文 参考訳(メタデータ) (2023-12-02T07:41:46Z) - 3DiffTection: 3D Object Detection with Geometry-Aware Diffusion Features [70.50665869806188]
3DiffTectionは、単一の画像から3Dオブジェクトを検出する最先端の方法である。
拡散モデルを微調整し、単一の画像に条件付けされた新しいビュー合成を行う。
さらに、検出監視により、ターゲットデータ上でモデルをトレーニングする。
論文 参考訳(メタデータ) (2023-11-07T23:46:41Z) - GOOD: General Optimization-based Fusion for 3D Object Detection via
LiDAR-Camera Object Candidates [10.534984939225014]
3次元物体検出は、自律運転における知覚タスクの中核となる基礎となる。
Goodは汎用的な最適化ベースの融合フレームワークで、追加のモデルをトレーニングすることなく、満足度の高い検出を実現できる。
nuScenesとKITTIデータセットの両方の実験を行い、その結果、GOODはPointPillarsと比較してmAPスコアで9.1%上回っていることが示された。
論文 参考訳(メタデータ) (2023-03-17T07:05:04Z) - LidarAugment: Searching for Scalable 3D LiDAR Data Augmentations [55.45435708426761]
LidarAugmentは3Dオブジェクト検出のための検索ベースのデータ拡張戦略である。
LidarAugmentはさまざまなモデルアーキテクチャ用にカスタマイズできる。
畳み込みベースのUPillars/StarNet/RSNとトランスフォーマーベースのSWFormerを一貫して改善する。
論文 参考訳(メタデータ) (2022-10-24T18:00:04Z) - Cost-Aware Evaluation and Model Scaling for LiDAR-Based 3D Object
Detection [34.34668878632354]
本研究は,LiDARを用いた3次元物体検出器の低コスト評価を行う。
具体的には、単純なグリッドベースのワンステージ検出器であるSECONDに焦点を当てる。
大規模SECONDのファミリーとVoxel R-CNNやPV-RCNN++といった最近の3D検出手法を比較した。
論文 参考訳(メタデータ) (2022-05-02T18:16:17Z) - ST3D: Self-training for Unsupervised Domain Adaptation on 3D
ObjectDetection [78.71826145162092]
点雲からの3次元物体検出における教師なし領域適応のための新しい領域適応型自己学習パイプラインST3Dを提案する。
当社のST3Dは、評価されたすべてのデータセットで最先端のパフォーマンスを達成し、KITTI 3Dオブジェクト検出ベンチマークで完全に監視された結果を超えます。
論文 参考訳(メタデータ) (2021-03-09T10:51:24Z) - Reinforced Axial Refinement Network for Monocular 3D Object Detection [160.34246529816085]
モノクロ3次元物体検出は、2次元入力画像から物体の位置と特性を抽出することを目的としている。
従来のアプローチでは、空間から3D境界ボックスをサンプリングし、対象オブジェクトと各オブジェクトの関係を推定するが、有効サンプルの確率は3D空間で比較的小さい。
我々は,まず最初の予測から始めて,各ステップで1つの3dパラメータだけを変えて,基礎的真理に向けて徐々に洗練することを提案する。
これは、いくつかのステップの後に報酬を得るポリシーを設計する必要があるため、最適化するために強化学習を採用します。
論文 参考訳(メタデータ) (2020-08-31T17:10:48Z) - InfoFocus: 3D Object Detection for Autonomous Driving with Dynamic
Information Modeling [65.47126868838836]
動的情報モデリングを用いた新しい3次元オブジェクト検出フレームワークを提案する。
粗い予測は、ボクセルベースの領域提案ネットワークを介して第1段階で生成される。
大規模なnuScenes 3D検出ベンチマークで実験を行った。
論文 参考訳(メタデータ) (2020-07-16T18:27:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。