論文の概要: Driver Dojo: A Benchmark for Generalizable Reinforcement Learning for
Autonomous Driving
- arxiv url: http://arxiv.org/abs/2207.11432v1
- Date: Sat, 23 Jul 2022 06:29:43 GMT
- ステータス: 処理完了
- システム内更新日: 2022-07-26 15:58:49.109298
- Title: Driver Dojo: A Benchmark for Generalizable Reinforcement Learning for
Autonomous Driving
- Title(参考訳): Driver Dojo: 自律運転のための一般化可能な強化学習のためのベンチマーク
- Authors: Sebastian Rietsch, Shih-Yuan Huang, Georgios Kontes, Axel Plinge,
Christopher Mutschler
- Abstract要約: 自律運転のための一般化可能な強化学習のためのベンチマークを提案する。
アプリケーション指向のベンチマークは、設計決定の影響をよりよく理解します。
我々のベンチマークは、研究者がシナリオをまたいでうまく一般化できるソリューションを提案することを奨励することを目的としている。
- 参考スコア(独自算出の注目度): 1.496194593196997
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Reinforcement learning (RL) has shown to reach super human-level performance
across a wide range of tasks. However, unlike supervised machine learning,
learning strategies that generalize well to a wide range of situations remains
one of the most challenging problems for real-world RL. Autonomous driving (AD)
provides a multi-faceted experimental field, as it is necessary to learn the
correct behavior over many variations of road layouts and large distributions
of possible traffic situations, including individual driver personalities and
hard-to-predict traffic events. In this paper we propose a challenging
benchmark for generalizable RL for AD based on a configurable, flexible, and
performant code base. Our benchmark uses a catalog of randomized scenario
generators, including multiple mechanisms for road layout and traffic
variations, different numerical and visual observation types, distinct action
spaces, diverse vehicle models, and allows for use under static scenario
definitions. In addition to purely algorithmic insights, our
application-oriented benchmark also enables a better understanding of the
impact of design decisions such as action and observation space on the
generalizability of policies. Our benchmark aims to encourage researchers to
propose solutions that are able to successfully generalize across scenarios, a
task in which current RL methods fail. The code for the benchmark is available
at https://github.com/seawee1/driver-dojo.
- Abstract(参考訳): 強化学習(rl)は、幅広いタスクにわたる超人間レベルのパフォーマンスに達することが示されている。
しかし、教師付き機械学習とは異なり、幅広い状況にうまく一般化する学習戦略は、現実世界のrlにとって最も難しい問題である。
自律運転(AD)は、運転者の個人性や予測が難しい交通イベントなど、様々な道路レイアウトや交通状況の大規模分布に関する正しい行動を学ぶ必要があるため、多面的な実験分野を提供する。
本稿では,構成可能でフレキシブルでパフォーマンスの高いコードベースに基づいて,ADのための一般化可能なRLの挑戦的ベンチマークを提案する。
本ベンチマークでは,道路レイアウトと交通変動の複数のメカニズム,数値と視覚の異なる観察タイプ,異なる行動空間,多様な車両モデル,静的なシナリオ定義の下での利用など,ランダム化されたシナリオ生成装置のカタログを使用する。
純粋にアルゴリズム的な洞察に加えて、アプリケーション指向ベンチマークでは、アクションやオブザーバスペースといった設計決定がポリシーの一般化可能性に与える影響をよりよく理解することができます。
本ベンチマークは,現在のRLメソッドが失敗するタスクであるシナリオをまたいで効率的に一般化できるソリューションを提案することを目的としている。
ベンチマークのコードはhttps://github.com/seawee1/driver-dojoで入手できる。
関連論文リスト
- ODRL: A Benchmark for Off-Dynamics Reinforcement Learning [59.72217833812439]
我々は、オフダイナミックスRL法を評価するための最初のベンチマークであるODRLを紹介する。
ODRLには、4つの実験的な設定が含まれており、ソースドメインとターゲットドメインはオンラインまたはオフラインにすることができる。
我々は、様々な力学シフトにまたがる普遍的な優位性を持つ手法が存在しないことを示す広範なベンチマーク実験を行った。
論文 参考訳(メタデータ) (2024-10-28T05:29:38Z) - Generalizing Cooperative Eco-driving via Multi-residual Task Learning [6.864745785996583]
MRTL(Multi-Residual Task Learning)はマルチタスク学習に基づく汎用的な学習フレームワークである。
MRTLは制御を従来の制御法と残留項によって効果的に解決される名目成分に分解する。
我々は、システム制御の手段として自律走行車を用いた混合交通における艦隊レベルの排出削減にMRTLを使用している。
論文 参考訳(メタデータ) (2024-03-07T05:25:34Z) - Action and Trajectory Planning for Urban Autonomous Driving with
Hierarchical Reinforcement Learning [1.3397650653650457]
本稿では,階層型強化学習法(atHRL)を用いた行動・軌道プランナを提案する。
我々は、複雑な都市運転シナリオにおける広範な実験を通して、atHRLの有効性を実証的に検証した。
論文 参考訳(メタデータ) (2023-06-28T07:11:02Z) - Comprehensive Training and Evaluation on Deep Reinforcement Learning for
Automated Driving in Various Simulated Driving Maneuvers [0.4241054493737716]
本研究では、DQN(Deep Q-networks)とTRPO(Trust Region Policy Optimization)の2つのDRLアルゴリズムの実装、評価、比較を行う。
設計されたComplexRoads環境で訓練されたモデルは、他の運転操作にうまく適応でき、全体的な性能が期待できる。
論文 参考訳(メタデータ) (2023-06-20T11:41:01Z) - FastRLAP: A System for Learning High-Speed Driving via Deep RL and
Autonomous Practicing [71.76084256567599]
本稿では、自律型小型RCカーを強化学習(RL)を用いた視覚的観察から積極的に駆動するシステムを提案する。
我々のシステムであるFastRLAP (faster lap)は、人間の介入なしに、シミュレーションや専門家によるデモンストレーションを必要とせず、現実世界で自律的に訓練する。
結果として得られたポリシーは、タイミングブレーキや回転の加速度などの突発的な運転スキルを示し、ロボットの動きを妨げる領域を避け、トレーニングの途中で同様の1対1のインタフェースを使用して人間のドライバーのパフォーマンスにアプローチする。
論文 参考訳(メタデータ) (2023-04-19T17:33:47Z) - Visual Exemplar Driven Task-Prompting for Unified Perception in
Autonomous Driving [100.3848723827869]
本稿では,タスク固有のプロンプトを通じて視覚的見本を提示する,効果的なマルチタスクフレームワークVE-Promptを提案する。
具体的には、境界ボックスと色に基づくマーカーに基づいて視覚的な例を生成し、ターゲットカテゴリの正確な視覚的外観を提供する。
我々は変圧器をベースとしたエンコーダと畳み込み層を橋渡しし、自律運転における効率的かつ正確な統合認識を実現する。
論文 参考訳(メタデータ) (2023-03-03T08:54:06Z) - Automated Reinforcement Learning (AutoRL): A Survey and Open Problems [92.73407630874841]
AutoRL(Automated Reinforcement Learning)には、AutoMLの標準的なアプリケーションだけでなく、RL特有の課題も含まれている。
我々は共通の分類法を提供し、各領域を詳細に議論し、今後の研究者にとって関心のあるオープンな問題を提起する。
論文 参考訳(メタデータ) (2022-01-11T12:41:43Z) - MetaDrive: Composing Diverse Driving Scenarios for Generalizable
Reinforcement Learning [25.191567110519866]
我々は,強化学習アルゴリズムの研究のために,MetaDriveと呼ばれる新しい運転シミュレーションプラットフォームを開発した。
MetaDriveをベースとして、シングルエージェントとマルチエージェントの両方の設定でさまざまなRLタスクとベースラインを構築します。
論文 参考訳(メタデータ) (2021-09-26T18:34:55Z) - End-to-End Intersection Handling using Multi-Agent Deep Reinforcement
Learning [63.56464608571663]
交差点をナビゲートすることは、自動運転車にとって大きな課題の1つです。
本研究では,交通標識のみが提供された交差点をナビゲート可能なシステムの実装に着目する。
本研究では,時間ステップ毎に加速度と操舵角を予測するためのニューラルネットワークの訓練に用いる,モデルフリーの連続学習アルゴリズムを用いたマルチエージェントシステムを提案する。
論文 参考訳(メタデータ) (2021-04-28T07:54:40Z) - Investigating Value of Curriculum Reinforcement Learning in Autonomous
Driving Under Diverse Road and Weather Conditions [0.0]
本稿では,自動運転アプリケーションにおけるカリキュラム強化学習の価値を検討する。
道路の複雑さや気象条件の異なる現実的な運転シミュレータで、複数の異なる運転シナリオを設定しました。
その結果、カリキュラムRLは、運転性能とサンプルの複雑さの両方の観点から、複雑な運転タスクで有意な利益を得ることができます。
論文 参考訳(メタデータ) (2021-03-14T12:05:05Z) - Trajectory-wise Multiple Choice Learning for Dynamics Generalization in
Reinforcement Learning [137.39196753245105]
本稿では,動的一般化のためのマルチヘッドダイナミックスモデルを学習するモデルベース強化学習アルゴリズムを提案する。
文脈学習は,過去の経験から得られる動的情報からコンテキスト潜在ベクトルにエンコードする。
提案手法は,最先端のRL法と比較して,様々な制御タスクにおいて優れたゼロショット一般化性能を示す。
論文 参考訳(メタデータ) (2020-10-26T03:20:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。