論文の概要: Sparse Curriculum Reinforcement Learning for End-to-End Driving
- arxiv url: http://arxiv.org/abs/2103.09189v1
- Date: Tue, 16 Mar 2021 16:39:09 GMT
- ステータス: 処理完了
- システム内更新日: 2021-03-17 14:47:09.244032
- Title: Sparse Curriculum Reinforcement Learning for End-to-End Driving
- Title(参考訳): エンドツーエンド運転のためのスパースカリキュラム強化学習
- Authors: Pranav Agarwal, Pierre de Beaucorps and Raoul de Charette
- Abstract要約: 仮想と現実のドメインギャップの少ないナビゲーションビューマップのみを用いて,エンドツーエンド運転のためのカリキュラム学習手法を提案する。
提案手法は,未確認の道路レイアウトを一般化し,トレーニングよりも長く運転できることを実証する。
- 参考スコア(独自算出の注目度): 8.398623478484248
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Deep reinforcement Learning for end-to-end driving is limited by the need of
complex reward engineering. Sparse rewards can circumvent this challenge but
suffers from long training time and leads to sub-optimal policy. In this work,
we explore driving using only goal conditioned sparse rewards and propose a
curriculum learning approach for end to end driving using only navigation view
maps that benefit from small virtual-to-real domain gap. To address the
complexity of multiple driving policies, we learn concurrent individual
policies which are selected at inference by a navigation system. We demonstrate
the ability of our proposal to generalize on unseen road layout, and to drive
longer than in the training.
- Abstract(参考訳): エンドツーエンド運転のための深い強化学習は、複雑な報酬工学の必要性によって制限される。
スパース報酬はこの課題を回避できるが、長い訓練時間に悩まされ、準最適政策につながる。
本研究では,目標条件付きスパース報酬のみを用いた運転について検討し,ナビゲーションビューマップのみを用いたエンドツーエンド運転のためのカリキュラム学習手法を提案する。
複数の運転ポリシーの複雑さに対処するために,ナビゲーションシステムによって選択された同時個別ポリシーを学習する。
提案手法は,未確認の道路レイアウトを一般化し,トレーニングよりも長い運転が可能であることを示す。
関連論文リスト
- RACER: Epistemic Risk-Sensitive RL Enables Fast Driving with Fewer Crashes [57.319845580050924]
本稿では,リスク感応制御と適応行動空間のカリキュラムを組み合わせた強化学習フレームワークを提案する。
提案アルゴリズムは,現実世界のオフロード運転タスクに対して,高速なポリシーを学習可能であることを示す。
論文 参考訳(メタデータ) (2024-05-07T23:32:36Z) - Evaluation of Safety Constraints in Autonomous Navigation with Deep
Reinforcement Learning [62.997667081978825]
学習可能なナビゲーションポリシとして,セーフとアンセーフの2つを比較します。
安全なポリシは、制約をアカウントに含めますが、もう一方はそうではありません。
安全政策は、よりクリアランスの高い軌道を生成することができ(障害物によらず)、全体的な性能を犠牲にすることなく、トレーニング中に衝突を減らすことができることを示す。
論文 参考訳(メタデータ) (2023-07-27T01:04:57Z) - Recent Advancements in End-to-End Autonomous Driving using Deep
Learning: A Survey [9.385936248154987]
エンド・ツー・エンドの運転は、モジュラーシステムに関連する欠点を回避するため、有望なパラダイムである。
エンド・ツー・エンド自動運転の最近の進歩は分析され、基礎原理に基づいて研究が分類される。
本稿では,最先端の評価,課題の特定,今後の可能性を探る。
論文 参考訳(メタデータ) (2023-07-10T07:00:06Z) - Comprehensive Training and Evaluation on Deep Reinforcement Learning for
Automated Driving in Various Simulated Driving Maneuvers [0.4241054493737716]
本研究では、DQN(Deep Q-networks)とTRPO(Trust Region Policy Optimization)の2つのDRLアルゴリズムの実装、評価、比較を行う。
設計されたComplexRoads環境で訓練されたモデルは、他の運転操作にうまく適応でき、全体的な性能が期待できる。
論文 参考訳(メタデータ) (2023-06-20T11:41:01Z) - FastRLAP: A System for Learning High-Speed Driving via Deep RL and
Autonomous Practicing [71.76084256567599]
本稿では、自律型小型RCカーを強化学習(RL)を用いた視覚的観察から積極的に駆動するシステムを提案する。
我々のシステムであるFastRLAP (faster lap)は、人間の介入なしに、シミュレーションや専門家によるデモンストレーションを必要とせず、現実世界で自律的に訓練する。
結果として得られたポリシーは、タイミングブレーキや回転の加速度などの突発的な運転スキルを示し、ロボットの動きを妨げる領域を避け、トレーニングの途中で同様の1対1のインタフェースを使用して人間のドライバーのパフォーマンスにアプローチする。
論文 参考訳(メタデータ) (2023-04-19T17:33:47Z) - Learning Interactive Driving Policies via Data-driven Simulation [125.97811179463542]
データ駆動シミュレータは、ポリシー学習の駆動に高いデータ効率を約束する。
小さな基盤となるデータセットは、インタラクティブな運転を学ぶための興味深い、挑戦的なエッジケースを欠いていることが多い。
本研究では,ロバストな運転方針の学習に塗装されたアドカーを用いたシミュレーション手法を提案する。
論文 参考訳(メタデータ) (2021-11-23T20:14:02Z) - Learning to drive from a world on rails [78.28647825246472]
モデルベースアプローチによって,事前記録された運転ログからインタラクティブな視覚ベースの運転方針を学習する。
世界の前方モデルは、あらゆる潜在的な運転経路の結果を予測する運転政策を監督する。
提案手法は,carla リーダボードにまずランク付けし,40 倍少ないデータを用いて25%高い運転スコアを得た。
論文 参考訳(メタデータ) (2021-05-03T05:55:30Z) - End-to-End Intersection Handling using Multi-Agent Deep Reinforcement
Learning [63.56464608571663]
交差点をナビゲートすることは、自動運転車にとって大きな課題の1つです。
本研究では,交通標識のみが提供された交差点をナビゲート可能なシステムの実装に着目する。
本研究では,時間ステップ毎に加速度と操舵角を予測するためのニューラルネットワークの訓練に用いる,モデルフリーの連続学習アルゴリズムを用いたマルチエージェントシステムを提案する。
論文 参考訳(メタデータ) (2021-04-28T07:54:40Z) - Affordance-based Reinforcement Learning for Urban Driving [3.507764811554557]
経路点と低次元視覚表現を用いた最適制御ポリシーを学習するための深層強化学習フレームワークを提案する。
スクラッチから訓練されたエージェントは、車線追従のタスクを学習し、区間間を走り回り、密集した交通状況でも他のアクターや信号機の前で立ち止まることを実証する。
論文 参考訳(メタデータ) (2021-01-15T05:21:25Z) - A Survey of End-to-End Driving: Architectures and Training Methods [0.9449650062296824]
私たちは、運転パイプライン全体を1つのニューラルネットワークに置き換える、いわゆるエンドツーエンドの自動運転アプローチについて、より深く検討しています。
本稿では,エンド・ツー・エンド駆動文学における学習方法,入力・出力モダリティ,ネットワークアーキテクチャ,評価スキームについてレビューする。
我々は、エンドツーエンドの自動運転システムの最も有望な要素を組み合わせたアーキテクチャでレビューを締めくくります。
論文 参考訳(メタデータ) (2020-03-13T17:42:58Z) - Interpretable End-to-end Urban Autonomous Driving with Latent Deep
Reinforcement Learning [32.97789225998642]
本稿では,エンドツーエンド自動運転のための解釈可能な深部強化学習手法を提案する。
逐次潜在環境モデルを導入し、強化学習プロセスと共同で学習する。
本手法は,自動車が運転環境にどう影響するかを,よりよく説明することができる。
論文 参考訳(メタデータ) (2020-01-23T18:36:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。