論文の概要: Quantifying Data Augmentation for LiDAR based 3D Object Detection
- arxiv url: http://arxiv.org/abs/2004.01643v2
- Date: Fri, 29 Jul 2022 11:43:02 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-17 04:19:19.938310
- Title: Quantifying Data Augmentation for LiDAR based 3D Object Detection
- Title(参考訳): LiDARを用いた3次元物体検出のためのデータ拡張の定量化
- Authors: Martin Hahner, Dengxin Dai, Alexander Liniger, and Luc Van Gool
- Abstract要約: そこで本研究では,光検出・ランドング(LiDAR)に基づく3次元物体検出において一般的に使用される,様々なデータ拡張手法について光を当てた。
本研究では,グローバルな拡張技術がシーン全体の点雲に適用され,ローカルな拡張技術がシーン内の個々のオブジェクトに属する点にのみ適用される,様々なグローバルおよびローカルな拡張技術について検討する。
以上の結果から,2種類のデータ拡張はパフォーマンス向上につながるが,個々のオブジェクト翻訳などの拡張技術は非生産的であり,全体的なパフォーマンスを損なう可能性があることがわかった。
- 参考スコア(独自算出の注目度): 139.64869289514525
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In this work, we shed light on different data augmentation techniques
commonly used in Light Detection and Ranging (LiDAR) based 3D Object Detection.
For the bulk of our experiments, we utilize the well known PointPillars
pipeline and the well established KITTI dataset. We investigate a variety of
global and local augmentation techniques, where global augmentation techniques
are applied to the entire point cloud of a scene and local augmentation
techniques are only applied to points belonging to individual objects in the
scene. Our findings show that both types of data augmentation can lead to
performance increases, but it also turns out, that some augmentation
techniques, such as individual object translation, for example, can be
counterproductive and can hurt the overall performance. We show that these
findings transfer and generalize well to other state of the art 3D Object
Detection methods and the challenging STF dataset. On the KITTI dataset we can
gain up to 1.5% and on the STF dataset up to 1.7% in 3D mAP on the moderate car
class.
- Abstract(参考訳): 本研究では,光検出・測位(lidar)に基づく3次元物体検出において一般的に用いられる異なるデータ拡張技術について考察した。
実験の大部分は、よく知られたPointPillarsパイプラインと、確立されたKITTIデータセットを使用しています。
本研究では,シーンのポイントクラウド全体にグローバル拡張技術を適用し,シーン内の個々のオブジェクトに属するポイントのみに局所拡張技術を適用する,多岐にわたるグローバル拡張技術とローカル拡張技術について検討する。
以上の結果から,いずれのデータ拡張も性能向上につながる可能性が示唆された。しかし同時に,個々のオブジェクト変換などの拡張技術は非生産的であり,全体のパフォーマンスを損なう可能性があることも判明した。
これらの知見は, art 3d オブジェクト検出法やstf データセットの他の状態にもよく移行し, 一般化することを示す。
KITTIデータセットでは最大1.5%、STFデータセットでは中等車クラスの3D mAPで最大1.7%を得ることができる。
関連論文リスト
- Enhancing Generalizability of Representation Learning for Data-Efficient 3D Scene Understanding [50.448520056844885]
本研究では,実世界のパターンを持つ多様な合成シーンを生成可能なベイズネットワークを提案する。
一連の実験は、既存の最先端の事前学習手法に比べて、我々の手法が一貫した優位性を示す。
論文 参考訳(メタデータ) (2024-06-17T07:43:53Z) - MMScan: A Multi-Modal 3D Scene Dataset with Hierarchical Grounded Language Annotations [55.022519020409405]
本稿では,マルチモーダルな3Dシーンデータセットと階層型言語アノテーションを用いたベンチマーク,MMScanを構築した。
結果として得られたマルチモーダルな3Dデータセットは、109kオブジェクトと7.7kリージョン上の1.4Mメタアノテーション付きキャプションと、3Dビジュアルグラウンドと質問応答ベンチマークのための3.04M以上の多様なサンプルを含んでいる。
論文 参考訳(メタデータ) (2024-06-13T17:59:30Z) - MDT3D: Multi-Dataset Training for LiDAR 3D Object Detection
Generalization [3.8243923744440926]
特定の点分布を持つソースデータセットでトレーニングされた3Dオブジェクト検出モデルは、目に見えないデータセットに一般化する上で困難であることが示されている。
我々は、アノテーション付きソースデータセットから利用可能な情報を、MDT3D(Multi-Dataset Training for 3D Object Detection)メソッドで活用する。
トレーニング中にデータセットの混合をどのように管理し、最後にクロスデータセット拡張メソッド、すなわちクロスデータセットオブジェクトインジェクションを導入するかを示します。
論文 参考訳(メタデータ) (2023-08-02T08:20:00Z) - Learning Object-level Point Augmentor for Semi-supervised 3D Object
Detection [85.170578641966]
半教師付き3次元オブジェクト検出のための局所変換を行うオブジェクトレベルポイント拡張器(OPA)を提案する。
このようにして、結果のオーグメンタは、無関係なバックグラウンドではなく、オブジェクトインスタンスを強調するように導出されます。
ScanNetとSUN RGB-Dデータセットの実験は、提案したOPAが最先端の手法に対して好適に動作することを示している。
論文 参考訳(メタデータ) (2022-12-19T06:56:14Z) - LidarAugment: Searching for Scalable 3D LiDAR Data Augmentations [55.45435708426761]
LidarAugmentは3Dオブジェクト検出のための検索ベースのデータ拡張戦略である。
LidarAugmentはさまざまなモデルアーキテクチャ用にカスタマイズできる。
畳み込みベースのUPillars/StarNet/RSNとトランスフォーマーベースのSWFormerを一貫して改善する。
論文 参考訳(メタデータ) (2022-10-24T18:00:04Z) - Real3D-Aug: Point Cloud Augmentation by Placing Real Objects with
Occlusion Handling for 3D Detection and Segmentation [0.0]
本稿では,すでに注釈付けされているデータを複数回活用するデータ拡張手法を提案する。
本稿では,実データを再利用する拡張フレームワークを提案する。
このパイプラインは、3Dオブジェクトの検出とセマンティックセグメンテーションのためのトップパフォーマンスモデルのトレーニングにおいて、競争力があることを証明している。
論文 参考訳(メタデータ) (2022-06-15T16:25:30Z) - Pattern-Aware Data Augmentation for LiDAR 3D Object Detection [7.394029879643516]
本稿では,LiDARの特性に基づいてオブジェクトの点群をダウンサンプリングするデータ拡張手法である,パターン認識基底真理サンプリングを提案する。
自動車クラスにおけるPV-RCNNの性能は,25m以上の距離で分割したKITTI検証で0.7%以上向上した。
論文 参考訳(メタデータ) (2021-11-30T19:14:47Z) - Part-Aware Data Augmentation for 3D Object Detection in Point Cloud [33.59724834383291]
3Dラベルは2Dラベルよりも洗練され、よりリッチな構造情報を持っているため、より多彩で効果的なデータ拡張を可能にします。
本稿では,3Dラベルのリッチな情報をより有効活用できる部分認識型データ拡張(PA-AUG)を提案する。
PA-AUGは与えられたデータセットのパフォーマンスを向上するだけでなく、破損したデータに対して堅牢であることを示す。
論文 参考訳(メタデータ) (2020-07-27T08:47:19Z) - Improving 3D Object Detection through Progressive Population Based
Augmentation [91.56261177665762]
本稿では3次元オブジェクト検出のためのデータ拡張ポリシーの設計を自動化するための最初の試みを示す。
このアルゴリズムは,探索空間を狭め,過去の反復で発見された最良のパラメータを採用することで,拡張戦略の最適化を学習する。
PPBAは, 拡張のないベースライン3次元検出モデルよりも最大10倍のデータ効率が高く, ラベル付きモデルよりもはるかに少ない精度で3次元検出モデルが競合精度を達成できる可能性が示唆された。
論文 参考訳(メタデータ) (2020-04-02T05:57:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。