論文の概要: Part-Aware Data Augmentation for 3D Object Detection in Point Cloud
- arxiv url: http://arxiv.org/abs/2007.13373v2
- Date: Sun, 11 Jul 2021 05:35:31 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-06 08:36:52.877086
- Title: Part-Aware Data Augmentation for 3D Object Detection in Point Cloud
- Title(参考訳): ポイントクラウドにおける3次元物体検出のための部分認識データ拡張
- Authors: Jaeseok Choi, Yeji Song and Nojun Kwak
- Abstract要約: 3Dラベルは2Dラベルよりも洗練され、よりリッチな構造情報を持っているため、より多彩で効果的なデータ拡張を可能にします。
本稿では,3Dラベルのリッチな情報をより有効活用できる部分認識型データ拡張(PA-AUG)を提案する。
PA-AUGは与えられたデータセットのパフォーマンスを向上するだけでなく、破損したデータに対して堅牢であることを示す。
- 参考スコア(独自算出の注目度): 33.59724834383291
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Data augmentation has greatly contributed to improving the performance in
image recognition tasks, and a lot of related studies have been conducted.
However, data augmentation on 3D point cloud data has not been much explored.
3D label has more sophisticated and rich structural information than the 2D
label, so it enables more diverse and effective data augmentation. In this
paper, we propose part-aware data augmentation (PA-AUG) that can better utilize
rich information of 3D label to enhance the performance of 3D object detectors.
PA-AUG divides objects into partitions and stochastically applies five
augmentation methods to each local region. It is compatible with existing point
cloud data augmentation methods and can be used universally regardless of the
detector's architecture. PA-AUG has improved the performance of
state-of-the-art 3D object detector for all classes of the KITTI dataset and
has the equivalent effect of increasing the train data by about 2.5$\times$. We
also show that PA-AUG not only increases performance for a given dataset but
also is robust to corrupted data. The code is available at
https://github.com/sky77764/pa-aug.pytorch
- Abstract(参考訳): データ拡張は画像認識タスクの性能向上に大きく貢献し、多くの関連研究が実施されている。
しかし、3d point cloud dataのデータ拡張はあまり検討されていない。
3Dラベルは2Dラベルよりも高度で豊富な構造情報を持っているため、より多彩で効果的なデータ拡張を可能にする。
本稿では,3dラベルのリッチな情報を利用して3d物体検出の性能を向上させるpart-aware data augmentation (pa-aug)を提案する。
PA-AUGはオブジェクトを分割に分割し、各局所領域に5つの拡張法を確率的に適用する。
既存のポイントクラウドデータ拡張手法と互換性があり、検出器のアーキテクチャに関係なく普遍的に使用できる。
PA-AUGは、KITTIデータセットの全クラスに対して最先端の3Dオブジェクト検出器の性能を改善し、列車データを2.5$\times$で増加させる同等の効果を有する。
また、PA-AUGは、与えられたデータセットのパフォーマンスを向上するだけでなく、破損したデータに対して堅牢であることを示す。
コードはhttps://github.com/sky77764/pa-aug.pytorchで入手できる。
関連論文リスト
- Learning Object-level Point Augmentor for Semi-supervised 3D Object
Detection [85.170578641966]
半教師付き3次元オブジェクト検出のための局所変換を行うオブジェクトレベルポイント拡張器(OPA)を提案する。
このようにして、結果のオーグメンタは、無関係なバックグラウンドではなく、オブジェクトインスタンスを強調するように導出されます。
ScanNetとSUN RGB-Dデータセットの実験は、提案したOPAが最先端の手法に対して好適に動作することを示している。
論文 参考訳(メタデータ) (2022-12-19T06:56:14Z) - Sparse2Dense: Learning to Densify 3D Features for 3D Object Detection [85.08249413137558]
LiDARが生成する点雲は、最先端の3Dオブジェクト検出器の主要な情報源である。
小さい、遠く、不完全な点の少ない物体は、しばしば検出するのが困難である。
Sparse2Denseは、潜在空間における点雲の密度化を学習することで、3D検出性能を効率的に向上する新しいフレームワークである。
論文 参考訳(メタデータ) (2022-11-23T16:01:06Z) - LidarAugment: Searching for Scalable 3D LiDAR Data Augmentations [55.45435708426761]
LidarAugmentは3Dオブジェクト検出のための検索ベースのデータ拡張戦略である。
LidarAugmentはさまざまなモデルアーキテクチャ用にカスタマイズできる。
畳み込みベースのUPillars/StarNet/RSNとトランスフォーマーベースのSWFormerを一貫して改善する。
論文 参考訳(メタデータ) (2022-10-24T18:00:04Z) - Real3D-Aug: Point Cloud Augmentation by Placing Real Objects with
Occlusion Handling for 3D Detection and Segmentation [0.0]
本稿では,すでに注釈付けされているデータを複数回活用するデータ拡張手法を提案する。
本稿では,実データを再利用する拡張フレームワークを提案する。
このパイプラインは、3Dオブジェクトの検出とセマンティックセグメンテーションのためのトップパフォーマンスモデルのトレーニングにおいて、競争力があることを証明している。
論文 参考訳(メタデータ) (2022-06-15T16:25:30Z) - VPFNet: Improving 3D Object Detection with Virtual Point based LiDAR and
Stereo Data Fusion [62.24001258298076]
VPFNetは、ポイントクラウドとイメージデータを仮想のポイントで巧みに調整し集約する新しいアーキテクチャである。
当社のVPFNetは,KITTIテストセットで83.21%の中等度3D AP,91.86%中等度BEV APを達成し,2021年5月21日以来の1位となった。
論文 参考訳(メタデータ) (2021-11-29T08:51:20Z) - Quantifying Data Augmentation for LiDAR based 3D Object Detection [139.64869289514525]
そこで本研究では,光検出・ランドング(LiDAR)に基づく3次元物体検出において一般的に使用される,様々なデータ拡張手法について光を当てた。
本研究では,グローバルな拡張技術がシーン全体の点雲に適用され,ローカルな拡張技術がシーン内の個々のオブジェクトに属する点にのみ適用される,様々なグローバルおよびローカルな拡張技術について検討する。
以上の結果から,2種類のデータ拡張はパフォーマンス向上につながるが,個々のオブジェクト翻訳などの拡張技術は非生産的であり,全体的なパフォーマンスを損なう可能性があることがわかった。
論文 参考訳(メタデータ) (2020-04-03T16:09:14Z) - Improving 3D Object Detection through Progressive Population Based
Augmentation [91.56261177665762]
本稿では3次元オブジェクト検出のためのデータ拡張ポリシーの設計を自動化するための最初の試みを示す。
このアルゴリズムは,探索空間を狭め,過去の反復で発見された最良のパラメータを採用することで,拡張戦略の最適化を学習する。
PPBAは, 拡張のないベースライン3次元検出モデルよりも最大10倍のデータ効率が高く, ラベル付きモデルよりもはるかに少ない精度で3次元検出モデルが競合精度を達成できる可能性が示唆された。
論文 参考訳(メタデータ) (2020-04-02T05:57:02Z) - Boundary-Aware Dense Feature Indicator for Single-Stage 3D Object
Detection from Point Clouds [32.916690488130506]
本稿では,3次元検出器が境界を意識して点雲の最も密集した領域に焦点を合わせるのを支援する普遍モジュールを提案する。
KITTIデータセットの実験により、DENFIはベースライン単段検出器の性能を著しく改善することが示された。
論文 参考訳(メタデータ) (2020-04-01T01:21:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。