論文の概要: StandardE2E: A Unified Framework for End-to-End Autonomous Driving Datasets
- arxiv url: http://arxiv.org/abs/2606.04271v1
- Date: Tue, 02 Jun 2026 22:50:55 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-04 20:44:18.413351
- Title: StandardE2E: A Unified Framework for End-to-End Autonomous Driving Datasets
- Title(参考訳): StandardE2E: エンドツーエンドの自動運転データセットのための統一フレームワーク
- Authors: Stepan Konev,
- Abstract要約: 提案するStandardE2Eは,データセットを駆動するE2E上で単一の統一インターフェースを提供するフレームワークである。
StandardE2Eは、1つの共有データスキーマの下でデータセットごとの事前処理を標準化する。
複数のデータセットを単一のPyTorch DataLoaderに組み合わせて、クロスデータセット事前トレーニング、補助タスクの監視、シナリオレベルのフィルタリングを行う。
- 参考スコア(独自算出の注目度): 0.2855485723554975
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Autonomous driving has shifted from modular perception-prediction-planning stacks toward end-to-end (E2E) models that map sensor inputs directly to vehicle control, often regularized by auxiliary tasks such as 3D detection, motion forecasting, and HD-map perception. Progress is driven by a fast-growing ecosystem of sensor-rich driving datasets, yet each ships its own file formats, APIs, coordinate conventions, and modality coverage, leaving cross-dataset experimentation and even basic per-dataset preprocessing to be re-implemented per project. We present StandardE2E, a framework that provides a single unified interface over E2E driving datasets. StandardE2E (i) standardizes per-dataset preprocessing under one shared data schema; (ii) combines multiple datasets in a single PyTorch DataLoader for cross-dataset pretraining, auxiliary-task supervision, and scenario-level filtering; and (iii) reduces adding a new dataset to a single per-dataset mapping from raw frames to the canonical schema, leaving the entire downstream pipeline unchanged. The framework supports six datasets out of the box: Waymo End-to-End, Waymo Perception, Argoverse 2 Sensor, Argoverse 2 LiDAR, NAVSIM (OpenScene-v1.1), and WayveScenes101, and is released as the open-source standard-e2e Python package, available at https://github.com/stepankonev/StandardE2E.
- Abstract(参考訳): 自律運転は、モジュラー認識予測計画スタックから、センサー入力を直接車両制御にマッピングするエンド・ツー・エンド(E2E)モデルへと移行し、しばしば3D検出、モーション予測、HDマップ認識といった補助的なタスクによって正規化されている。
進歩は、センサリッチな駆動データセットの急成長するエコシステムによって駆動されるが、それぞれ独自のファイルフォーマット、API、コーディネート、モダリティカバレッジを出荷する。
提案するStandardE2Eは,データセットを駆動するE2E上で単一の統一インターフェースを提供するフレームワークである。
StandardE2E
i) 1つの共有データスキーマの下で、データセットごとの事前処理を標準化する。
(ii) 複数データセットを1つのPyTorch DataLoaderに組み合わせて、クロスデータセット事前トレーニング、補助タスク管理、シナリオレベルのフィルタリングを行う。
(iii) 原フレームから標準スキーマへの単一データセット単位のマッピングに新たなデータセットを追加することで、ダウンストリームパイプライン全体の変更が不要になる。
Waymo End-to-End、Waymo Perception、Argoverse 2 Sensor、Argoverse 2 LiDAR、NAVSIM(OpenScene-v1.1)、WayveScenes101の6つのデータセットをサポートし、https://github.com/stepankonev/StandardE2Eで利用可能なオープンソースの標準e2e Pythonパッケージとしてリリースされた。
関連論文リスト
- FRED: A Multi-Modal Autonomous Driving Dataset for Flooded Road Environments [2.4578723416255746]
このデータセットには、2.3MPのFLIR Blackfly USB3カメラ、Ouster OS1-64 LiDARの64-beam 360$circ point cloud、Geoflex RTKによって修正されたiXblue ATLANS-C IMUのデータが含まれている。
既存のデータツールと簡単に統合できるKITTIスタイルのフォーマットと、車両のデータキャプチャを直接再生するRTMapsフォーマットである。
論文 参考訳(メタデータ) (2026-05-21T05:37:07Z) - 123D: Unifying Multi-Modal Autonomous Driving Data at Scale [58.4010470217018]
このようなマルチモーダル駆動データを単一のAPIで統一するオープンソースフレームワークである123Dを提案する。
私たちは,3300時間90万kmにわたる8つの実世界の運転データセットと,収集スクリプトを備えた合成データセットを統合し,データ解析と可視化のためのツールを提供しています。
論文 参考訳(メタデータ) (2026-05-08T17:59:53Z) - Ozone: A Unified Platform for Transportation Research [19.072804811705684]
Ozoneは、ハードウェア、データ、モデル、評価、プロトタイプという5つの相互接続されたレイヤを中心に組織された、輸送研究のための統一されたプラットフォームである。
既存のトラジェクトリデータセットは、座標系、オブジェクト表現、メタデータフィールドの非互換な規約に従っている。
オゾンは実験のセットアップ時間を85%削減し、安全モデルの都市間移動効率91%を達成し、データセット間の分散を3%以内に改善する。
論文 参考訳(メタデータ) (2026-04-13T03:55:39Z) - TaCarla: A comprehensive benchmarking dataset for end-to-end autonomous driving [3.037642191465275]
さまざまなLeadboard 2.0チャレンジシナリオに対して,CARLAシミュレーション環境を使用して,285万フレームを越える新たなデータセットを収集した。
我々のデータセットは、計画タスクだけでなく、動的オブジェクト検出、車線分割検出、センターライン検出、トラフィック光認識、予測タスク、視覚言語行動モデルもサポートしています。
論文 参考訳(メタデータ) (2026-02-26T21:16:20Z) - Mixed Signals: A Diverse Point Cloud Dataset for Heterogeneous LiDAR V2X Collaboration [57.3519952529079]
車両間協調認識(V2X)は、単車知覚システムの限界に対処するための有望な解決策として登場した。
これらのギャップに対処するために、45.1kの点雲と240.6kのバウンディングボックスを備えた総合的なV2XデータセットであるMixed Signalsを紹介した。
私たちのデータセットは10クラスのポイントクラウドとバウンディングボックスアノテーションを提供し、認識トレーニングのための信頼性の高いデータを確保します。
論文 参考訳(メタデータ) (2025-02-19T23:53:00Z) - MV-JAR: Masked Voxel Jigsaw and Reconstruction for LiDAR-Based
Self-Supervised Pre-Training [58.07391711548269]
Masked Voxel Jigsaw and Reconstruction (MV-JAR) method for LiDAR-based self-supervised pre-training
Masked Voxel Jigsaw and Reconstruction (MV-JAR) method for LiDAR-based self-supervised pre-training
論文 参考訳(メタデータ) (2023-03-23T17:59:02Z) - A Bag-of-Prototypes Representation for Dataset-Level Applications [24.629132557336312]
本研究では,データセットレベルの2つのタスクに対するデータセットベクトル化について検討する。
本稿では,パッチ記述子からなるイメージレベルバッグを,セマンティックプロトタイプからなるデータセットレベルバッグに拡張する,Bop-of-prototypes(BoP)データセット表現を提案する。
BoPは、2つのデータセットレベルのタスクに対する一連のベンチマークにおいて、既存の表現に対する優位性を一貫して示している。
論文 参考訳(メタデータ) (2023-03-23T13:33:58Z) - Argoverse 2: Next Generation Datasets for Self-Driving Perception and
Forecasting [64.7364925689825]
Argoverse 2(AV2)は、自動運転分野の研究の知覚と予測のための3つのデータセットの集合である。
Lidarデータセットには、ラベルなしのLidar点雲とマップ整列ポーズの2万のシーケンスが含まれている。
Motion Forecastingデータセットには、各ローカルシーンにおける自動運転車と他のアクター間の興味深い、挑戦的なインタラクションのために採掘された25万のシナリオが含まれている。
論文 参考訳(メタデータ) (2023-01-02T00:36:22Z) - Omnidata: A Scalable Pipeline for Making Multi-Task Mid-Level Vision
Datasets from 3D Scans [103.92680099373567]
本稿では,実世界の包括的3Dスキャンからマルチタスク視覚データセットをパラメトリックサンプリングし,レンダリングするパイプラインを提案する。
サンプリングパラメータを変更することで、生成されたデータセットを“ステア”して、特定の情報を強調することが可能になる。
生成されたスタータデータセットでトレーニングされた共通アーキテクチャは、複数の共通ビジョンタスクとベンチマークで最先端のパフォーマンスに達した。
論文 参考訳(メタデータ) (2021-10-11T04:21:46Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。