論文の概要: Traffic Context Aware Data Augmentation for Rare Object Detection in
Autonomous Driving
- arxiv url: http://arxiv.org/abs/2205.00376v1
- Date: Sun, 1 May 2022 01:45:00 GMT
- ステータス: 処理完了
- システム内更新日: 2022-05-03 15:18:50.955097
- Title: Traffic Context Aware Data Augmentation for Rare Object Detection in
Autonomous Driving
- Title(参考訳): 自律走行における希少物体検出のための交通状況認識データ強化
- Authors: Naifan Li, Fan Song, Ying Zhang, Pengpeng Liang, Erkang Cheng
- Abstract要約: 本稿では,自律運転におけるまれな物体検出のための簡易なコピー・ペーストデータ拡張に関する体系的研究を提案する。
具体的には、リアルなレアなオブジェクトマスクを生成するために、局所適応型インスタンスレベルの画像変換を導入する。
我々は10kのトレーニング画像と4kの検証画像と対応するラベルからなるNM10kという新しいデータセットを構築した。
- 参考スコア(独自算出の注目度): 5.037913689432052
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Detection of rare objects (e.g., traffic cones, traffic barrels and traffic
warning triangles) is an important perception task to improve the safety of
autonomous driving. Training of such models typically requires a large number
of annotated data which is expensive and time consuming to obtain. To address
the above problem, an emerging approach is to apply data augmentation to
automatically generate cost-free training samples. In this work, we propose a
systematic study on simple Copy-Paste data augmentation for rare object
detection in autonomous driving. Specifically, local adaptive instance-level
image transformation is introduced to generate realistic rare object masks from
source domain to the target domain. Moreover, traffic scene context is utilized
to guide the placement of masks of rare objects. To this end, our data
augmentation generates training data with high quality and realistic
characteristics by leveraging both local and global consistency. In addition,
we build a new dataset named NM10k consisting 10k training images, 4k
validation images and the corresponding labels with a diverse range of
scenarios in autonomous driving. Experiments on NM10k show that our method
achieves promising results on rare object detection. We also present a thorough
study to illustrate the effectiveness of our local-adaptive and global
constraints based Copy-Paste data augmentation for rare object detection. The
data, development kit and more information of NM10k dataset are available
online at: \url{https://nullmax-vision.github.io}.
- Abstract(参考訳): 希少物体(交通コーン、交通バレル、交通警告の三角形など)の検出は、自動運転の安全性を高めるための重要な認識課題である。
このようなモデルのトレーニングは通常、大量の注釈付きデータを必要とする。
上記の問題に対処するために、データ拡張を適用して、費用のかかるトレーニングサンプルを自動的に生成する、という新しいアプローチがある。
本研究では,自律運転におけるまれな物体検出のための簡易なコピー・ペーストデータ拡張方式を提案する。
具体的には、ローカルアダプティブなインスタンスレベルの画像変換を導入し、ソースドメインからターゲットドメインへの現実的なレアオブジェクトマスクを生成する。
また,トラヒックシーンの文脈を用いて,レアオブジェクトのマスク配置を案内する。
これにより,局所的およびグローバル的一貫性を活かし,高品質かつ現実的な特徴を持つトレーニングデータを生成する。
さらに,10kのトレーニング画像,4kの検証画像,およびそれに対応するラベルからなるNM10kという新しいデータセットを構築し,自律運転におけるさまざまなシナリオについて検討した。
NM10k実験により, 希少物体検出における有望な結果が得られた。
また, 局所適応型およびグローバル制約に基づくCopy-Pasteデータ拡張による希少物体検出の有効性について, 詳細な研究を行った。
nm10kデータセットのデータ、開発キット、さらに詳しい情報は、 \url{https://nullmax-vision.github.io} で入手できる。
関連論文リスト
- Label-Efficient 3D Object Detection For Road-Side Units [10.663986706501188]
協調的知覚は、インテリジェント・ロードサイド・ユニット(RSU)との深部情報融合による自動運転車の知覚を高める
これらの手法は、特に注釈付きRSUデータを必要とするため、実際のデプロイメントにおいて大きなハードルを生んでいる。
教師なしオブジェクト発見に基づくRSUのためのラベル効率の高いオブジェクト検出手法を考案する。
論文 参考訳(メタデータ) (2024-04-09T12:29:16Z) - Transfer learning with generative models for object detection on limited datasets [1.4999444543328293]
海洋生物学などいくつかの分野では、各物体の周囲に有界箱を正しくラベル付けする必要がある。
本稿では,一般的なシナリオに有効な伝達学習フレームワークを提案する。
我々の研究結果は、さまざまな分野における機械学習アプリケーションのための、新しい生成AIベースのプロトコルの道を開くものである。
論文 参考訳(メタデータ) (2024-02-09T21:17:31Z) - Unsupervised Domain Adaptation for Self-Driving from Past Traversal
Features [69.47588461101925]
本研究では,新しい運転環境に3次元物体検出器を適応させる手法を提案する。
提案手法は,空間的量子化履歴特徴を用いたLiDARに基づく検出モデルを強化する。
実世界のデータセットの実験では、大幅な改善が示されている。
論文 参考訳(メタデータ) (2023-09-21T15:00:31Z) - Generalized Few-Shot 3D Object Detection of LiDAR Point Cloud for
Autonomous Driving [91.39625612027386]
我々は,一般的な(ベース)オブジェクトに対して大量のトレーニングデータを持つが,レア(ノーベル)クラスに対してはごく少数のデータしか持たない,一般化された数発の3Dオブジェクト検出という新しいタスクを提案する。
具体的には、画像と点雲の奥行きの違いを分析し、3D LiDARデータセットにおける少数ショット設定の実践的原理を示す。
この課題を解決するために,既存の3次元検出モデルを拡張し,一般的なオブジェクトと稀なオブジェクトの両方を認識するためのインクリメンタルな微調整手法を提案する。
論文 参考訳(メタデータ) (2023-02-08T07:11:36Z) - SODA10M: Towards Large-Scale Object Detection Benchmark for Autonomous
Driving [94.11868795445798]
我々は,SODA10Mという名の自律走行用大規模物体検出ベンチマークをリリースし,1000万枚の未ラベル画像と6つの代表対象カテゴリをラベル付けした20K画像を含む。
多様性を向上させるために、画像は32の異なる都市で、1フレームあたり10秒毎に異なる気象条件、期間、場所のシーンで収集される。
我々は、既存の教師付き最先端検出モデル、一般的な自己監督型および半教師付きアプローチ、および将来のモデルの開発方法に関するいくつかの知見について、広範な実験と詳細な分析を行った。
論文 参考訳(メタデータ) (2021-06-21T13:55:57Z) - One Million Scenes for Autonomous Driving: ONCE Dataset [91.94189514073354]
自律運転シナリオにおける3次元物体検出のためのONCEデータセットを提案する。
データは、利用可能な最大の3D自動運転データセットよりも20倍長い144時間の運転時間から選択される。
我々はONCEデータセット上で、様々な自己教師的・半教師的手法を再現し、評価する。
論文 参考訳(メタデータ) (2021-06-21T12:28:08Z) - Fine-Grained Vehicle Perception via 3D Part-Guided Visual Data
Augmentation [77.60050239225086]
実画像中の車両に動的部品を付加した3次元自動車モデルによる効果的なトレーニングデータ生成プロセスを提案する。
私達のアプローチは人間の相互作用なしで完全に自動です。
VUS解析用マルチタスクネットワークとVHI解析用マルチストリームネットワークを提案する。
論文 参考訳(メタデータ) (2020-12-15T03:03:38Z) - Deep traffic light detection by overlaying synthetic context on
arbitrary natural images [49.592798832978296]
深部交通光検出器のための人工的な交通関連トレーニングデータを生成する手法を提案する。
このデータは、任意の画像背景の上に偽のトラフィックシーンをブレンドするために、基本的な非現実的なコンピュータグラフィックスを用いて生成される。
また、交通信号データセットの本質的なデータ不均衡問題にも対処し、主に黄色い状態のサンプルの少なさによって引き起こされる。
論文 参考訳(メタデータ) (2020-11-07T19:57:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。