論文の概要: One Million Scenes for Autonomous Driving: ONCE Dataset
- arxiv url: http://arxiv.org/abs/2106.11037v1
- Date: Mon, 21 Jun 2021 12:28:08 GMT
- ステータス: 処理完了
- システム内更新日: 2021-06-22 15:30:05.750076
- Title: One Million Scenes for Autonomous Driving: ONCE Dataset
- Title(参考訳): 自動運転の100万シーン:ONCEデータセット
- Authors: Jiageng Mao, Minzhe Niu, Chenhan Jiang, Hanxue Liang, Xiaodan Liang,
Yamin Li, Chaoqiang Ye, Wei Zhang, Zhenguo Li, Jie Yu, Hang Xu, Chunjing Xu
- Abstract要約: 自律運転シナリオにおける3次元物体検出のためのONCEデータセットを提案する。
データは、利用可能な最大の3D自動運転データセットよりも20倍長い144時間の運転時間から選択される。
我々はONCEデータセット上で、様々な自己教師的・半教師的手法を再現し、評価する。
- 参考スコア(独自算出の注目度): 91.94189514073354
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Current perception models in autonomous driving have become notorious for
greatly relying on a mass of annotated data to cover unseen cases and address
the long-tail problem. On the other hand, learning from unlabeled large-scale
collected data and incrementally self-training powerful recognition models have
received increasing attention and may become the solutions of next-generation
industry-level powerful and robust perception models in autonomous driving.
However, the research community generally suffered from data inadequacy of
those essential real-world scene data, which hampers the future exploration of
fully/semi/self-supervised methods for 3D perception. In this paper, we
introduce the ONCE (One millioN sCenEs) dataset for 3D object detection in the
autonomous driving scenario. The ONCE dataset consists of 1 million LiDAR
scenes and 7 million corresponding camera images. The data is selected from 144
driving hours, which is 20x longer than the largest 3D autonomous driving
dataset available (e.g. nuScenes and Waymo), and it is collected across a range
of different areas, periods and weather conditions. To facilitate future
research on exploiting unlabeled data for 3D detection, we additionally provide
a benchmark in which we reproduce and evaluate a variety of self-supervised and
semi-supervised methods on the ONCE dataset. We conduct extensive analyses on
those methods and provide valuable observations on their performance related to
the scale of used data. Data, code, and more information are available at
https://once-for-auto-driving.github.io/index.html.
- Abstract(参考訳): 自動運転における現在の認識モデルは、未発見のケースをカバーし、ロングテール問題に対処するために注釈付きデータの大量に依存することで悪名高い。
一方、ラベルのない大規模収集データや漸進的に自己学習する強力な認識モデルからの学習は注目され、自動運転における次世代の産業レベルの強力で堅牢な認識モデルの解決策となりうる。
しかし、研究コミュニティは一般的に、これらの重要な現実世界のシーンデータの不十分さに悩まされ、将来の3D知覚のための完全/半自己管理手法の探求を妨げている。
本稿では,自動運転シナリオにおける3次元物体検出のためのONCEデータセットについて紹介する。
ONCEデータセットは100万のLiDARシーンと700万の対応するカメライメージで構成されている。
データは、利用可能な最大の3D自動運転データセット(例)よりも20倍長い144時間の運転時間から選択される。
ヌッセン (nuscenes) とウェイモ (waymo) は、様々な地域、期間、気象条件にまたがって収集される。
3次元検出のためのラベルなしデータの利用に関する今後の研究を容易にするため、ONCEデータセット上で様々な自己監督的および半監督的手法を再現し評価するベンチマークも提供する。
これらの手法を広範囲に分析し,使用データの規模に関連する性能に関する貴重な知見を提供する。
データ、コード、その他の情報はhttps://once-for-auto-driving.github.io/index.htmlで確認できる。
関連論文リスト
- HUM3DIL: Semi-supervised Multi-modal 3D Human Pose Estimation for
Autonomous Driving [95.42203932627102]
3Dの人間のポーズ推定は、自動運転車が歩行者の微妙で複雑な振る舞いを知覚し理解できるようにする新しい技術である。
提案手法は,これらの補完信号を半教師付き方式で効率的に利用し,既存の手法よりも大きなマージンで性能を向上する。
具体的には、LiDAR点を画素整列マルチモーダル特徴に埋め込み、トランスフォーマーの精細化段階を経る。
論文 参考訳(メタデータ) (2022-12-15T11:15:14Z) - aiMotive Dataset: A Multimodal Dataset for Robust Autonomous Driving
with Long-Range Perception [0.0]
このデータセットは、同期して校正されたLiDAR、カメラ、および360度の視野をカバーするレーダーセンサーを備えた176のシーンで構成されている。
収集したデータは、昼間、夜、雨の間に、高速道路、都市、郊外で撮影された。
我々は3次元物体検出のための一次元・多モードベースラインモデルを訓練した。
論文 参考訳(メタデータ) (2022-11-17T10:19:59Z) - Benchmarking the Robustness of LiDAR-Camera Fusion for 3D Object
Detection [58.81316192862618]
自律運転における3D知覚のための2つの重要なセンサーは、カメラとLiDARである。
これら2つのモダリティを融合させることで、3次元知覚モデルの性能を大幅に向上させることができる。
我々は、最先端の核融合法を初めてベンチマークした。
論文 参考訳(メタデータ) (2022-05-30T09:35:37Z) - CODA: A Real-World Road Corner Case Dataset for Object Detection in
Autonomous Driving [117.87070488537334]
我々は、ビジョンベース検出器のこの重要な問題を露呈する、CODAという挑戦的なデータセットを導入する。
大規模自動運転データセットで訓練された標準物体検出器の性能は、mARの12.8%以下に著しく低下した。
我々は最先端のオープンワールドオブジェクト検出器を実験し、CODAの新しいオブジェクトを確実に識別できないことを発見した。
論文 参考訳(メタデータ) (2022-03-15T08:32:56Z) - Weakly Supervised Training of Monocular 3D Object Detectors Using Wide
Baseline Multi-view Traffic Camera Data [19.63193201107591]
交差点における車両の7DoF予測は,道路利用者間の潜在的な衝突を評価する上で重要な課題である。
交通監視カメラ用3次元物体検出装置の微調整を弱教師付きで行う手法を開発した。
提案手法は,自動運転車のデータセット上で最上位のモノクル3Dオブジェクト検出器と同等の精度で車両の7DoFの予測精度を推定する。
論文 参考訳(メタデータ) (2021-10-21T08:26:48Z) - SODA10M: Towards Large-Scale Object Detection Benchmark for Autonomous
Driving [94.11868795445798]
我々は,SODA10Mという名の自律走行用大規模物体検出ベンチマークをリリースし,1000万枚の未ラベル画像と6つの代表対象カテゴリをラベル付けした20K画像を含む。
多様性を向上させるために、画像は32の異なる都市で、1フレームあたり10秒毎に異なる気象条件、期間、場所のシーンで収集される。
我々は、既存の教師付き最先端検出モデル、一般的な自己監督型および半教師付きアプローチ、および将来のモデルの開発方法に関するいくつかの知見について、広範な実験と詳細な分析を行った。
論文 参考訳(メタデータ) (2021-06-21T13:55:57Z) - Fine-Grained Vehicle Perception via 3D Part-Guided Visual Data
Augmentation [77.60050239225086]
実画像中の車両に動的部品を付加した3次元自動車モデルによる効果的なトレーニングデータ生成プロセスを提案する。
私達のアプローチは人間の相互作用なしで完全に自動です。
VUS解析用マルチタスクネットワークとVHI解析用マルチストリームネットワークを提案する。
論文 参考訳(メタデータ) (2020-12-15T03:03:38Z) - The NEOLIX Open Dataset for Autonomous Driving [1.4091801425319965]
自律走行領域におけるNEOLIXデータセットとその応用について述べる。
私たちのデータセットには、ポイントクラウドラベル付き約30,000フレームと、アノテーション付き600k以上の3Dバウンディングボックスが含まれています。
論文 参考訳(メタデータ) (2020-11-27T02:27:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。