論文の概要: Embedding Synthetic Off-Policy Experience for Autonomous Driving via
Zero-Shot Curricula
- arxiv url: http://arxiv.org/abs/2212.01375v1
- Date: Fri, 2 Dec 2022 18:57:21 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-05 16:20:56.951146
- Title: Embedding Synthetic Off-Policy Experience for Autonomous Driving via
Zero-Shot Curricula
- Title(参考訳): ゼロショット・キュリキュラによる自動走行のための合成オフポリティ体験の埋め込み
- Authors: Eli Bronstein, Sirish Srinivasan, Supratik Paul, Aman Sinha, Matthew
O'Kelly, Payam Nikdel, Shimon Whiteson
- Abstract要約: 我々は、データの10%サブセットのみを使用してトレーニングされたエージェントが、データセット全体に対してトレーニングされたエージェントと同様に動作することを示す。
次に、この難易度スコアをゼロショット転送に使用して、模倣学習に基づく計画エージェントのカリキュラムを生成することを実証する。
- 参考スコア(独自算出の注目度): 48.58973705935691
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: ML-based motion planning is a promising approach to produce agents that
exhibit complex behaviors, and automatically adapt to novel environments. In
the context of autonomous driving, it is common to treat all available training
data equally. However, this approach produces agents that do not perform
robustly in safety-critical settings, an issue that cannot be addressed by
simply adding more data to the training set - we show that an agent trained
using only a 10% subset of the data performs just as well as an agent trained
on the entire dataset. We present a method to predict the inherent difficulty
of a driving situation given data collected from a fleet of autonomous vehicles
deployed on public roads. We then demonstrate that this difficulty score can be
used in a zero-shot transfer to generate curricula for an imitation-learning
based planning agent. Compared to training on the entire unbiased training
dataset, we show that prioritizing difficult driving scenarios both reduces
collisions by 15% and increases route adherence by 14% in closed-loop
evaluation, all while using only 10% of the training data.
- Abstract(参考訳): MLベースのモーションプランニングは、複雑な振る舞いを示し、新しい環境に自動的に適応するエージェントを作成するための有望なアプローチである。
自動運転の文脈では、利用可能なすべてのトレーニングデータを平等に扱うことが一般的である。
しかしながら、このアプローチでは、安全クリティカルな設定で堅牢に動作しないエージェントを生成するため、トレーニングセットにより多くのデータを追加するだけでは対処できない問題が発生します。
本研究では,公道に配備された自動運転車群から収集したデータをもとに,運転状況の難しさを予測する手法を提案する。
次に,この難易度スコアをゼロショット転送に使用して,模倣学習に基づく計画エージェントのカリキュラムを生成することを実証する。
非バイアスのトレーニングデータセット全体のトレーニングと比較して、難しい運転シナリオの優先順位付けは衝突を15%減らし、クローズドループ評価においてルートアテンデンスを14%増加させ、トレーニングデータの10%しか使用していないことを示す。
関連論文リスト
- Learning to Drive via Asymmetric Self-Play [34.56873945538085]
課題,解決可能,現実的な合成シナリオを用いて,実際のデータを超えてスケールする非対称なセルフプレイを提案する。
私たちのアプローチは、解決可能なシナリオを生成することを学ぶ教師と、それを解くことを学ぶ学生のペアです。
当社の方針は、エンド・ツー・エンドの自律性のためのトレーニングデータを生成するためのゼロショット転送をさらに促進し、最先端の敵のアプローチを著しく上回っている。
論文 参考訳(メタデータ) (2024-09-26T18:55:38Z) - Data-efficient Trajectory Prediction via Coreset Selection [4.682090083225856]
軌道予測モデルの訓練には2つの方法がある。
簡単ミーム駆動のシナリオがデータセットを圧倒的に支配することが多い。
コアセット選択に基づく新しいデータ効率訓練手法を提案する。
論文 参考訳(メタデータ) (2024-09-25T22:00:11Z) - Mitigating Covariate Shift in Imitation Learning for Autonomous Vehicles Using Latent Space Generative World Models [60.87795376541144]
World Model(ワールドモデル)は、エージェントの次の状態を予測できるニューラルネットワークである。
エンド・ツー・エンドのトレーニングでは、人間のデモで観察された状態と整合してエラーから回復する方法を学ぶ。
クローズドループ試験における先行技術に有意な改善がみられた定性的,定量的な結果を示す。
論文 参考訳(メタデータ) (2024-09-25T06:48:25Z) - Autonomous Vehicle Controllers From End-to-End Differentiable Simulation [60.05963742334746]
そこで我々は,AVコントローラのトレーニングにAPG(analytic Policy gradients)アプローチを適用可能なシミュレータを提案し,その設計を行う。
提案するフレームワークは, エージェントがより根底的なポリシーを学ぶのを助けるために, 環境力学の勾配を役立てる, エンド・ツー・エンドの訓練ループに, 微分可能シミュレータを組み込む。
ダイナミクスにおけるパフォーマンスとノイズに対する堅牢性の大幅な改善と、全体としてより直感的なヒューマンライクな処理が見られます。
論文 参考訳(メタデータ) (2024-09-12T11:50:06Z) - Perception Without Vision for Trajectory Prediction: Ego Vehicle Dynamics as Scene Representation for Efficient Active Learning in Autonomous Driving [0.0]
本研究では,アクティブラーニングフレームワークにおける軌道状態とサンプリング戦略のクラスタリング手法を提案する。
トラジェクティブ・ステートインフォームド・アクティブ・ラーニングを統合することで、より効率的で堅牢な自動運転システムが実現可能であることを示す。
論文 参考訳(メタデータ) (2024-05-15T02:54:11Z) - Pre-training on Synthetic Driving Data for Trajectory Prediction [61.520225216107306]
軌道予測におけるデータ不足の問題を緩和するパイプラインレベルのソリューションを提案する。
我々は、駆動データを生成するためにHDマップ拡張とトラジェクトリ合成を採用し、それらを事前学習することで表現を学習する。
我々は、データ拡張と事前学習戦略の有効性を実証するための広範な実験を行う。
論文 参考訳(メタデータ) (2023-09-18T19:49:22Z) - Rethinking Closed-loop Training for Autonomous Driving [82.61418945804544]
本研究は,学習エージェントの成功に対する異なるトレーニングベンチマーク設計の影響を分析した最初の実証的研究である。
複数ステップのルックアヘッドで計画を行うRLベースの駆動エージェントであるtrajectory value learning (TRAVL)を提案する。
実験の結果,TRAVLはすべてのベースラインと比較してより速く学習でき,安全な操作が可能であることがわかった。
論文 参考訳(メタデータ) (2023-06-27T17:58:39Z) - Learning Interactive Driving Policies via Data-driven Simulation [125.97811179463542]
データ駆動シミュレータは、ポリシー学習の駆動に高いデータ効率を約束する。
小さな基盤となるデータセットは、インタラクティブな運転を学ぶための興味深い、挑戦的なエッジケースを欠いていることが多い。
本研究では,ロバストな運転方針の学習に塗装されたアドカーを用いたシミュレーション手法を提案する。
論文 参考訳(メタデータ) (2021-11-23T20:14:02Z) - Equilibrium Inverse Reinforcement Learning for Ride-hailing Vehicle
Network [1.599072005190786]
疎結合グラフにおける客車マッチングの問題を定式化する。
マルチエージェント環境における平衡ポリシを導出するアルゴリズムを提案する。
論文 参考訳(メタデータ) (2021-02-13T03:18:44Z) - Meta Reinforcement Learning-Based Lane Change Strategy for Autonomous
Vehicles [11.180588185127892]
教師付き学習アルゴリズムは、大量のラベル付きデータをトレーニングすることで、新しい環境に一般化することができる。
しばしば、新しい環境ごとに十分なデータを得るために、実用的または費用を抑えることができる。
エージェントの一般化能力を向上させるメタ強化学習(MRL)法を提案する。
論文 参考訳(メタデータ) (2020-08-28T02:57:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。