論文の概要: Urban Driver: Learning to Drive from Real-world Demonstrations Using
Policy Gradients
- arxiv url: http://arxiv.org/abs/2109.13333v1
- Date: Mon, 27 Sep 2021 20:19:18 GMT
- ステータス: 処理完了
- システム内更新日: 2021-09-30 05:30:17.602544
- Title: Urban Driver: Learning to Drive from Real-world Demonstrations Using
Policy Gradients
- Title(参考訳): 都市ドライバー:政策グラディエントを用いた実世界のデモから学ぶ
- Authors: Oliver Scheel, Luca Bergamini, Maciej Wo{\l}czyk, B{\l}a\.zej
Osi\'nski, Peter Ondruska
- Abstract要約: 本研究では,実世界における大規模な実証実験から,複雑な都市交通の模倣政策を学習するためのオフラインポリシー手法を提案する。
これは、知覚出力と高忠実度HDマップの上に、微分可能なデータ駆動シミュレータを構築することで実現される。
提案手法は,都市道路における100時間にわたる専門家による実証実験に基づいて学習し,複雑な運転方針を学習し,多種多様な運転操作を行えることを示す。
- 参考スコア(独自算出の注目度): 7.58363583085932
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In this work we are the first to present an offline policy gradient method
for learning imitative policies for complex urban driving from a large corpus
of real-world demonstrations. This is achieved by building a differentiable
data-driven simulator on top of perception outputs and high-fidelity HD maps of
the area. It allows us to synthesize new driving experiences from existing
demonstrations using mid-level representations. Using this simulator we then
train a policy network in closed-loop employing policy gradients. We train our
proposed method on 100 hours of expert demonstrations on urban roads and show
that it learns complex driving policies that generalize well and can perform a
variety of driving maneuvers. We demonstrate this in simulation as well as
deploy our model to self-driving vehicles in the real-world. Our method
outperforms previously demonstrated state-of-the-art for urban driving
scenarios -- all this without the need for complex state perturbations or
collecting additional on-policy data during training. We make code and data
publicly available.
- Abstract(参考訳): 本研究では,実世界の実演の大規模なコーパスから,複雑な都市運転の模倣政策を学ぶためのオフライン政策勾配手法を最初に提示する。
これは、知覚出力と高忠実度HDマップの上に、微分可能なデータ駆動シミュレータを構築することで実現される。
これにより、中間レベル表現を使用して、既存のデモから新しい駆動エクスペリエンスを合成できます。
このシミュレータを用いて、ポリシー勾配を用いたクローズドループでポリシーネットワークを訓練する。
提案手法を都市道路における100時間の実証実験で訓練し, 運転を一般化する複雑な運転方針を学習し, 様々な運転操作を行えることを示す。
これをシミュレーションで実証し、実世界の自動運転車にモデルをデプロイします。
我々の手法は以前、都市部の運転シナリオの最先端性を実証した。これら全ては、複雑な状態の摂動や、トレーニング中に追加の政治データを収集する必要がない。
コードとデータを公開しています。
関連論文リスト
- TrafficBots: Towards World Models for Autonomous Driving Simulation and
Motion Prediction [149.5716746789134]
我々は,データ駆動型交通シミュレーションを世界モデルとして定式化できることを示した。
動作予測とエンドツーエンドの運転に基づくマルチエージェントポリシーであるTrafficBotsを紹介する。
オープンモーションデータセットの実験は、TrafficBotsが現実的なマルチエージェント動作をシミュレートできることを示している。
論文 参考訳(メタデータ) (2023-03-07T18:28:41Z) - Policy Pre-training for End-to-end Autonomous Driving via
Self-supervised Geometric Modeling [96.31941517446859]
PPGeo (Policy Pre-training via Geometric Modeling) は,視覚運動運転における政策事前学習のための,直感的かつ直接的な完全自己教師型フレームワークである。
本研究では,大規模な未ラベル・未校正動画の3次元幾何学シーンをモデル化することにより,ポリシー表現を強力な抽象化として学習することを目的とする。
第1段階では、幾何モデリングフレームワークは、2つの連続したフレームを入力として、ポーズと深さの予測を同時に生成する。
第2段階では、視覚エンコーダは、将来のエゴモーションを予測し、現在の視覚観察のみに基づいて測光誤差を最適化することにより、運転方針表現を学習する。
論文 参考訳(メタデータ) (2023-01-03T08:52:49Z) - Sim-to-Real via Sim-to-Seg: End-to-end Off-road Autonomous Driving
Without Real Data [56.49494318285391]
我々は、オフロード自動運転の視覚的現実的ギャップを横断するRCANを再想像するSim2Segを紹介する。
これは、ランダム化されたシミュレーション画像をシミュレートされたセグメンテーションと深さマップに変換する学習によって行われる。
これにより、シミュレーションでエンドツーエンドのRLポリシーをトレーニングし、現実世界に直接デプロイできます。
論文 参考訳(メタデータ) (2022-10-25T17:50:36Z) - DeXtreme: Transfer of Agile In-hand Manipulation from Simulation to
Reality [64.51295032956118]
我々は人型ロボットの手で頑健な操作を行える政策を訓練する。
本研究は,各種ハードウェアおよびシミュレータのデクスタラス操作におけるsim-to-real転送の可能性を再確認する。
論文 参考訳(メタデータ) (2022-10-25T01:51:36Z) - Learning Interactive Driving Policies via Data-driven Simulation [125.97811179463542]
データ駆動シミュレータは、ポリシー学習の駆動に高いデータ効率を約束する。
小さな基盤となるデータセットは、インタラクティブな運転を学ぶための興味深い、挑戦的なエッジケースを欠いていることが多い。
本研究では,ロバストな運転方針の学習に塗装されたアドカーを用いたシミュレーション手法を提案する。
論文 参考訳(メタデータ) (2021-11-23T20:14:02Z) - TrafficSim: Learning to Simulate Realistic Multi-Agent Behaviors [74.67698916175614]
リアル交通シミュレーションのためのマルチエージェント行動モデルであるTrafficSimを提案する。
特に、暗黙の潜在変数モデルを利用して、共同アクターポリシーをパラメータ化する。
TrafficSimは、多様なベースラインと比較して、より現実的で多様なトラフィックシナリオを生成します。
論文 参考訳(メタデータ) (2021-01-17T00:29:30Z) - CARLA Real Traffic Scenarios -- novel training ground and benchmark for
autonomous driving [8.287331387095545]
本研究では,実世界のトラフィックに基づくCARLAシミュレータにおけるインタラクティブな交通シナリオについて紹介する。
我々は数秒間続く戦術的タスクに集中しており、これは現在の制御方法では特に困難である。
CARLA Real Traffic Scenarios(CRTS)は、自動運転システムのトレーニングとテストの場になることを意図しています。
論文 参考訳(メタデータ) (2020-12-16T13:20:39Z) - Interpretable End-to-end Urban Autonomous Driving with Latent Deep
Reinforcement Learning [32.97789225998642]
本稿では,エンドツーエンド自動運転のための解釈可能な深部強化学習手法を提案する。
逐次潜在環境モデルを導入し、強化学習プロセスと共同で学習する。
本手法は,自動車が運転環境にどう影響するかを,よりよく説明することができる。
論文 参考訳(メタデータ) (2020-01-23T18:36:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。