論文の概要: Hidden Biases of End-to-End Driving Datasets
- arxiv url: http://arxiv.org/abs/2412.09602v1
- Date: Thu, 12 Dec 2024 18:59:13 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-12-13 13:34:39.354869
- Title: Hidden Biases of End-to-End Driving Datasets
- Title(参考訳): エンド・ツー・エンド運転データセットの隠れバイアス
- Authors: Julian Zimmerlin, Jens Beißwenger, Bernhard Jaeger, Andreas Geiger, Kashyap Chitta,
- Abstract要約: 私たちは、CARLA Leaderboard 2.0のエンドツーエンドの運転を初めて試みます。
トレーニングデータセットを体系的に分析し、新たな洞察を得る。
我々のモデルは2024年のCARLA Challengeの地図とセンサーのトラックでそれぞれ第1位と第2位にランクされている。
- 参考スコア(独自算出の注目度): 25.931831743383782
- License:
- Abstract: End-to-end driving systems have made rapid progress, but have so far not been applied to the challenging new CARLA Leaderboard 2.0. Further, while there is a large body of literature on end-to-end architectures and training strategies, the impact of the training dataset is often overlooked. In this work, we make a first attempt at end-to-end driving for Leaderboard 2.0. Instead of investigating architectures, we systematically analyze the training dataset, leading to new insights: (1) Expert style significantly affects downstream policy performance. (2) In complex data sets, the frames should not be weighted on the basis of simplistic criteria such as class frequencies. (3) Instead, estimating whether a frame changes the target labels compared to previous frames can reduce the size of the dataset without removing important information. By incorporating these findings, our model ranks first and second respectively on the map and sensors tracks of the 2024 CARLA Challenge, and sets a new state-of-the-art on the Bench2Drive test routes. Finally, we uncover a design flaw in the current evaluation metrics and propose a modification for future challenges. Our dataset, code, and pre-trained models are publicly available at https://github.com/autonomousvision/carla_garage.
- Abstract(参考訳): エンドツーエンドの運転システムは急速に進歩しているが、新しいCARLA Leaderboard 2.0には適用されていない。
さらに、エンドツーエンドのアーキテクチャとトレーニング戦略に関する多くの文献がありますが、トレーニングデータセットの影響は見過ごされがちです。
この作業では、Leaderboard 2.0のエンドツーエンドの運転を初めて試みます。
アーキテクチャを調査する代わりに,トレーニングデータセットを体系的に分析し,新たな洞察を得た。
2) 複雑なデータセットでは, フレームの重み付けは, クラス周波数などの単純な基準に基づいて行うべきではない。
(3) フレームが従来のフレームと比較してターゲットラベルを変更するかどうかを推定することで,重要な情報を取り除かずにデータセットのサイズを小さくすることができる。
これらの知見を取り入れて、我々のモデルは2024年のCARLA Challengeの地図とセンサーのトラックでそれぞれ第1位と第2位にランク付けし、Bench2Driveのテストルートで新しい最先端のコースを設定した。
最後に、現在の評価基準における設計上の欠陥を明らかにし、今後の課題に対する修正を提案する。
私たちのデータセット、コード、トレーニング済みモデルはhttps://github.com/autonomousvision/carla_garage.comで公開されています。
関連論文リスト
- TARGO: Benchmarking Target-driven Object Grasping under Occlusions [39.970680093124145]
我々はまず,Occlusionsの下でTARGOという,TARget駆動型グラフ作成のための新しいベンチマークデータセットを構築した。
我々は5つのグリップモデルを評価し、現在のSOTAモデルでさえ、閉塞レベルが大きくなると悩むことを見出した。
本稿では, TARGO-Net と呼ばれる形状完備化モジュールを含む変圧器を用いた把握モデルを提案する。
論文 参考訳(メタデータ) (2024-07-08T17:47:45Z) - A Data-Centric Perspective on Evaluating Machine Learning Models for Tabular Data [9.57464542357693]
実世界のモデリングパイプラインは、しばしばデータセット固有の前処理と特徴工学を必要とするため、モデル中心の評価は偏りがあることを実証する。
Kaggleコンペティションから10の関連するデータセットを選択し、データセット毎に専門家レベルの前処理パイプラインを実装します。
データセット固有の機能エンジニアリングの後、モデルランキングは大幅に変化し、性能差が減少し、モデル選択の重要性が低下する。
論文 参考訳(メタデータ) (2024-07-02T09:54:39Z) - Kick Back & Relax++: Scaling Beyond Ground-Truth Depth with SlowTV &
CribsTV [50.616892315086574]
本稿では,SlowTV と CribsTV の2つの新しいデータセットを提案する。
これらは、一般公開されているYouTubeビデオから収集された大規模なデータセットで、合計200万のトレーニングフレームが含まれている。
我々はこれらのデータセットを活用し、ゼロショット一般化の難しい課題に取り組む。
論文 参考訳(メタデータ) (2024-03-03T17:29:03Z) - Is Ego Status All You Need for Open-Loop End-to-End Autonomous Driving? [84.17711168595311]
エンドツーエンドの自動運転は、フルスタックの観点から自律性を目標とする、有望な研究の方向性として浮上している。
比較的単純な駆動シナリオを特徴とするnuScenesデータセットは、エンド・ツー・エンド・モデルにおける知覚情報の未使用化につながる。
予測軌跡が道路に付着するかどうかを評価するための新しい指標を提案する。
論文 参考訳(メタデータ) (2023-12-05T11:32:31Z) - Transfer Learning between Motor Imagery Datasets using Deep Learning --
Validation of Framework and Comparison of Datasets [0.0]
本稿では,コンピュータビジョンによく用いられる,シンプルなディープラーニングベースのフレームワークを提案する。
精神画像復号処理におけるデータセット間変換学習の有効性を実証する。
論文 参考訳(メタデータ) (2023-09-04T20:58:57Z) - Deconstructing Self-Supervised Monocular Reconstruction: The Design
Decisions that Matter [63.5550818034739]
本稿では,自己教師付き単分子深度推定への最先端の貢献を評価するための枠組みを提案する。
事前トレーニング、バックボーン、アーキテクチャ設計の選択、損失関数が含まれる。
我々は16の最先端コントリビューションを再実装し、検証し、再評価し、新しいデータセットを導入します。
論文 参考訳(メタデータ) (2022-08-02T14:38:53Z) - Learning from Temporal Spatial Cubism for Cross-Dataset Skeleton-based
Action Recognition [88.34182299496074]
アクションラベルはソースデータセットでのみ利用可能だが、トレーニング段階のターゲットデータセットでは利用できない。
我々は,2つの骨格に基づく行動データセット間の領域シフトを低減するために,自己スーパービジョン方式を利用する。
時間的セグメントや人体部分のセグメンテーションとパーフォーミングにより、我々は2つの自己教師あり学習分類タスクを設計する。
論文 参考訳(メタデータ) (2022-07-17T07:05:39Z) - LID 2020: The Learning from Imperfect Data Challenge Results [242.86700551532272]
Imperfect Dataワークショップからの学習は、新しいアプローチの開発に刺激を与え、促進することを目的としている。
我々は、弱教師付き学習環境における最先端のアプローチを見つけるために、3つの課題を編成する。
この技術的レポートは、課題のハイライトを要約している。
論文 参考訳(メタデータ) (2020-10-17T13:06:12Z) - 2nd Place Scheme on Action Recognition Track of ECCV 2020 VIPriors
Challenges: An Efficient Optical Flow Stream Guided Framework [57.847010327319964]
我々は、小さなデータセットでモデルをスクラッチからトレーニングできるデータ効率フレームワークを提案する。
具体的には、3D中心差分畳み込み演算を導入することで、新しいC3Dニューラルネットワークベースの2ストリームフレームワークを提案する。
提案手法は,大規模データセット上で事前学習したモデルがなくても,有望な結果が得られることを実証した。
論文 参考訳(メタデータ) (2020-08-10T09:50:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。