論文の概要: Robust Autonomy Emerges from Self-Play
- arxiv url: http://arxiv.org/abs/2502.03349v1
- Date: Wed, 05 Feb 2025 16:41:05 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-02-06 14:27:58.127851
- Title: Robust Autonomy Emerges from Self-Play
- Title(参考訳): ロバストな自律性 - セルフプレイによる創発
- Authors: Marco Cusumano-Towner, David Hafner, Alex Hertzberg, Brody Huval, Aleksei Petrenko, Eugene Vinitsky, Erik Wijmans, Taylor Killian, Stuart Bowers, Ozan Sener, Philipp Krähenbühl, Vladlen Koltun,
- Abstract要約: 我々は、前例のない規模のシミュレーションにおいて、頑健で自然主義的な運転が、完全に自己プレイから現れることを示す。
Gigaflowは、42年間の主観的な運転体験を1時間に合成し、訓練することができる。
- 参考スコア(独自算出の注目度): 63.44745854476206
- License:
- Abstract: Self-play has powered breakthroughs in two-player and multi-player games. Here we show that self-play is a surprisingly effective strategy in another domain. We show that robust and naturalistic driving emerges entirely from self-play in simulation at unprecedented scale -- 1.6~billion~km of driving. This is enabled by Gigaflow, a batched simulator that can synthesize and train on 42 years of subjective driving experience per hour on a single 8-GPU node. The resulting policy achieves state-of-the-art performance on three independent autonomous driving benchmarks. The policy outperforms the prior state of the art when tested on recorded real-world scenarios, amidst human drivers, without ever seeing human data during training. The policy is realistic when assessed against human references and achieves unprecedented robustness, averaging 17.5 years of continuous driving between incidents in simulation.
- Abstract(参考訳): セルフプレイは2人プレイとマルチプレイヤーゲームでブレークスルーを生かしている。
ここでは、他のドメインにおいて、セルフプレイが驚くほど効果的な戦略であることを示します。
我々は、前例のない規模のシミュレーションで、頑健で自然主義的な運転が完全に自己プレイから出現することを示します -- 1.6~ビリオン~kmの運転です。
これはGigaflowによって実現されている。これはバッチ化されたシミュレータで、1つの8GPUノードで42年の主観的な運転経験を1時間に合成し、トレーニングすることができる。
結果として得られたポリシーは、3つの独立した自動運転ベンチマークで最先端のパフォーマンスを達成する。
このポリシーは、人間のドライバーの中で、トレーニング中に人間のデータを見ることなく、記録された現実世界のシナリオでテストした場合、これまでの最先端よりも優れています。
この政策は、人間の参照に対して評価されると現実的であり、前例のない堅牢性を実現し、シミュレーションにおけるインシデント間の17.5年間の平均的な連続運転を実現している。
関連論文リスト
- HUGSIM: A Real-Time, Photo-Realistic and Closed-Loop Simulator for Autonomous Driving [48.84595398410479]
HUGSIMは、自律運転アルゴリズムを評価するためのクローズドループ、フォトリアリスティック、リアルタイムシミュレータである。
我々は、視点外挿や360度車両レンダリングを含む閉ループシナリオにおける新しいビュー合成の課題に取り組む。
HUGSIMは、KITTI-360、nuScenes、PandaSetから70以上のシーケンスにまたがる包括的なベンチマークと400以上のさまざまなシナリオを提供する。
論文 参考訳(メタデータ) (2024-12-02T17:07:59Z) - IGDrivSim: A Benchmark for the Imitation Gap in Autonomous Driving [35.64960921334498]
textbfIGDrivSimはWaymaxシミュレータ上に構築されたベンチマークである。
実験の結果,この認識ギャップは安全かつ効果的な運転行動の学習を妨げることが示された。
本研究は,模倣と強化学習を組み合わせることで,禁止行為に対する簡単な報奨を生かし,これらの失敗を効果的に軽減することを示す。
論文 参考訳(メタデータ) (2024-11-07T12:28:52Z) - Sim-to-Real via Sim-to-Seg: End-to-end Off-road Autonomous Driving
Without Real Data [56.49494318285391]
我々は、オフロード自動運転の視覚的現実的ギャップを横断するRCANを再想像するSim2Segを紹介する。
これは、ランダム化されたシミュレーション画像をシミュレートされたセグメンテーションと深さマップに変換する学習によって行われる。
これにより、シミュレーションでエンドツーエンドのRLポリシーをトレーニングし、現実世界に直接デプロイできます。
論文 参考訳(メタデータ) (2022-10-25T17:50:36Z) - Indy Autonomous Challenge -- Autonomous Race Cars at the Handling Limits [81.22616193933021]
TUM Auton-omous Motorsportsは2021年10月、インディ・オートマチック・チャレンジに参加する。
インディアナポリス・モーター・スピードウェイのダララAV-21レースカー10台のうち1台を走らせることで、自動運転のソフトウェアスタックをベンチマークする。
これは、最も困難で稀な状況をマスターできる自律走行アルゴリズムを開発するための理想的な試験場である。
論文 参考訳(メタデータ) (2022-02-08T11:55:05Z) - Autonomous Racing using a Hybrid Imitation-Reinforcement Learning
Architecture [0.5735035463793008]
本稿では,タイムアタックレースイベントにおけるラップタイムの最小化を目的とした,自動運転車のエンドツーエンド制御戦略を提案する。
また,正確な車体・環境力学をシミュレートするAutoRACEシミュレータも導入した。
論文 参考訳(メタデータ) (2021-10-11T17:26:55Z) - DriveGAN: Towards a Controllable High-Quality Neural Simulation [147.6822288981004]
DriveGANと呼ばれる新しい高品質のニューラルシミュレータを紹介します。
DriveGANは、異なるコンポーネントを監督なしで切り離すことによって制御性を達成する。
実世界の運転データ160時間を含む複数のデータセットでdriveganをトレーニングします。
論文 参考訳(メタデータ) (2021-04-30T15:30:05Z) - Learning Accurate and Human-Like Driving using Semantic Maps and
Attention [152.48143666881418]
本稿では,より正確かつ人間らしく運転できるエンド・ツー・エンド駆動モデルについて検討する。
HERE Technologiesのセマンティックマップとビジュアルマップを活用し、既存のDrive360データセットを拡張します。
私たちのモデルは、実世界の運転データ60時間3000kmのDrive360+HEREデータセットでトレーニングされ、評価されています。
論文 参考訳(メタデータ) (2020-07-10T22:25:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。