論文の概要: Learning to Drive via Asymmetric Self-Play
- arxiv url: http://arxiv.org/abs/2409.18218v1
- Date: Thu, 26 Sep 2024 18:55:38 GMT
- ステータス: 処理完了
- システム内更新日: 2024-11-06 15:21:45.166895
- Title: Learning to Drive via Asymmetric Self-Play
- Title(参考訳): 非対称なセルフプレイによるドライブ学習
- Authors: Chris Zhang, Sourav Biswas, Kelvin Wong, Kion Fallah, Lunjun Zhang, Dian Chen, Sergio Casas, Raquel Urtasun,
- Abstract要約: 課題,解決可能,現実的な合成シナリオを用いて,実際のデータを超えてスケールする非対称なセルフプレイを提案する。
私たちのアプローチは、解決可能なシナリオを生成することを学ぶ教師と、それを解くことを学ぶ学生のペアです。
当社の方針は、エンド・ツー・エンドの自律性のためのトレーニングデータを生成するためのゼロショット転送をさらに促進し、最先端の敵のアプローチを著しく上回っている。
- 参考スコア(独自算出の注目度): 34.56873945538085
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Large-scale data is crucial for learning realistic and capable driving policies. However, it can be impractical to rely on scaling datasets with real data alone. The majority of driving data is uninteresting, and deliberately collecting new long-tail scenarios is expensive and unsafe. We propose asymmetric self-play to scale beyond real data with additional challenging, solvable, and realistic synthetic scenarios. Our approach pairs a teacher that learns to generate scenarios it can solve but the student cannot, with a student that learns to solve them. When applied to traffic simulation, we learn realistic policies with significantly fewer collisions in both nominal and long-tail scenarios. Our policies further zero-shot transfer to generate training data for end-to-end autonomy, significantly outperforming state-of-the-art adversarial approaches, or using real data alone. For more information, visit https://waabi.ai/selfplay .
- Abstract(参考訳): 大規模データは、現実的で有能な運転ポリシーを学ぶために不可欠である。
しかし、実際のデータだけでデータセットのスケーリングに頼るのは現実的ではない。
運転データの大部分は興味がなく、新しいロングテールシナリオを意図的に収集することは高価で安全ではない。
我々は、より困難で、解決可能で、現実的な合成シナリオを伴って、実際のデータを超えてスケールする非対称なセルフプレイを提案する。
私たちのアプローチは、解決可能なシナリオを生成することを学ぶ教師と、それを解くことを学ぶ学生のペアです。
交通シミュレーションに適用すると、名目シナリオとロングテールシナリオの両方において、衝突が著しく少ない現実的なポリシーを学習する。
当社の方針は、エンドツーエンドの自律性のためのトレーニングデータを生成するためのゼロショット転送をさらに強化し、最先端の敵アプローチを著しく上回り、実際のデータのみを使用する。
詳細はhttps://waabi.ai/selfplay を参照してください。
関連論文リスト
- ReGentS: Real-World Safety-Critical Driving Scenario Generation Made Stable [88.08120417169971]
機械学習に基づく自律運転システムは、現実世界のデータでは稀な安全クリティカルなシナリオで課題に直面していることが多い。
この研究は、軌道最適化によって複雑な現実世界の通常のシナリオを変更することによって、安全クリティカルな運転シナリオを生成することを検討する。
提案手法は、頑健なプランナーの訓練には役に立たない非現実的な発散軌道と避けられない衝突シナリオに対処する。
論文 参考訳(メタデータ) (2024-09-12T08:26:33Z) - Imitation Is Not Enough: Robustifying Imitation with Reinforcement
Learning for Challenging Driving Scenarios [147.16925581385576]
シミュレーション学習と強化学習を組み合わせることで,運転方針の安全性と信頼性が大幅に向上することを示す。
都会の運転データ100万マイル以上でポリシーを訓練し、異なるレベルの衝突確率でグループ化されたテストシナリオにおける有効性を測定する。
論文 参考訳(メタデータ) (2022-12-21T23:59:33Z) - Embedding Synthetic Off-Policy Experience for Autonomous Driving via
Zero-Shot Curricula [48.58973705935691]
我々は、データの10%サブセットのみを使用してトレーニングされたエージェントが、データセット全体に対してトレーニングされたエージェントと同様に動作することを示す。
次に、この難易度スコアをゼロショット転送に使用して、模倣学習に基づく計画エージェントのカリキュラムを生成することを実証する。
論文 参考訳(メタデータ) (2022-12-02T18:57:21Z) - Learning Interactive Driving Policies via Data-driven Simulation [125.97811179463542]
データ駆動シミュレータは、ポリシー学習の駆動に高いデータ効率を約束する。
小さな基盤となるデータセットは、インタラクティブな運転を学ぶための興味深い、挑戦的なエッジケースを欠いていることが多い。
本研究では,ロバストな運転方針の学習に塗装されたアドカーを用いたシミュレーション手法を提案する。
論文 参考訳(メタデータ) (2021-11-23T20:14:02Z) - Towards Optimal Strategies for Training Self-Driving Perception Models
in Simulation [98.51313127382937]
合成ドメインのみにおけるラベルの使用に焦点を当てる。
提案手法では,ニューラル不変表現の学習方法と,シミュレータからデータをサンプリングする方法に関する理論的にインスピレーションを得た視点を導入する。
マルチセンサーデータを用いた鳥眼視車両分割作業におけるアプローチについて紹介する。
論文 参考訳(メタデータ) (2021-11-15T18:37:43Z) - Learning to Simulate on Sparse Trajectory Data [26.718807213824853]
本稿では,実世界のスパースデータから運転行動をシミュレートする学習問題に対処するための新しいフレームワーク imingail を提案する。
私たちの知る限りでは、行動学習問題に対するデータ疎結合問題に最初に取り組みます。
論文 参考訳(メタデータ) (2021-03-22T13:42:11Z) - TrafficSim: Learning to Simulate Realistic Multi-Agent Behaviors [74.67698916175614]
リアル交通シミュレーションのためのマルチエージェント行動モデルであるTrafficSimを提案する。
特に、暗黙の潜在変数モデルを利用して、共同アクターポリシーをパラメータ化する。
TrafficSimは、多様なベースラインと比較して、より現実的で多様なトラフィックシナリオを生成します。
論文 参考訳(メタデータ) (2021-01-17T00:29:30Z) - Enhanced Transfer Learning for Autonomous Driving with Systematic
Accident Simulation [3.2456691142503256]
シミュレーションデータセット上での伝達学習は、より優れた一般化と衝突回避をもたらすことを示す。
シミュレーションデータに基づいてトレーニングされたモデルから得られた情報は,実世界のデータに基づいてトレーニングされたモデルに推測可能であることを示す。
論文 参考訳(メタデータ) (2020-07-23T17:27:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。