論文の概要: Towards Optimal Head-to-head Autonomous Racing with Curriculum
Reinforcement Learning
- arxiv url: http://arxiv.org/abs/2308.13491v1
- Date: Fri, 25 Aug 2023 17:05:41 GMT
- ステータス: 処理完了
- システム内更新日: 2023-08-28 13:11:28.063457
- Title: Towards Optimal Head-to-head Autonomous Racing with Curriculum
Reinforcement Learning
- Title(参考訳): カリキュラム強化学習による最適な頭対頭自律走行に向けて
- Authors: Dvij Kalaria, Qin Lin and John M. Dolan
- Abstract要約: 車両力学を正確にモデル化した強化学習のためのヘッド・ツー・ヘッドレース環境を提案する。
また,エージェントの安全性を高めるために,制御バリア関数に基づく安全強化学習アルゴリズムを提案する。
- 参考スコア(独自算出の注目度): 22.69532642800264
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Head-to-head autonomous racing is a challenging problem, as the vehicle needs
to operate at the friction or handling limits in order to achieve minimum lap
times while also actively looking for strategies to overtake/stay ahead of the
opponent. In this work we propose a head-to-head racing environment for
reinforcement learning which accurately models vehicle dynamics. Some previous
works have tried learning a policy directly in the complex vehicle dynamics
environment but have failed to learn an optimal policy. In this work, we
propose a curriculum learning-based framework by transitioning from a simpler
vehicle model to a more complex real environment to teach the reinforcement
learning agent a policy closer to the optimal policy. We also propose a control
barrier function-based safe reinforcement learning algorithm to enforce the
safety of the agent in a more effective way while not compromising on
optimality.
- Abstract(参考訳): ヘッド・ツー・ヘッドの自律レースは、車両が最小ラップタイムを達成するために摩擦やハンドリングの限界で走行する必要があり、また相手に先んじる戦略を積極的に探す必要があるため、難しい問題である。
本研究では,車両力学を正確にモデル化した強化学習のためのヘッドツーヘッドレース環境を提案する。
以前のいくつかの研究は、複雑な車両力学環境で直接ポリシーを学習しようとしたが、最適なポリシーを学ばなかった。
本研究では,より単純な車両モデルからより複雑な実環境へ移行し,強化学習エージェントに最適ポリシーに近いポリシーを教えることで,カリキュラム学習ベースのフレームワークを提案する。
また,最適性に妥協せず,より効果的な方法でエージェントの安全性を強制する制御障壁関数に基づく安全強化学習アルゴリズムを提案する。
関連論文リスト
- RACER: Epistemic Risk-Sensitive RL Enables Fast Driving with Fewer Crashes [57.319845580050924]
本稿では,リスク感応制御と適応行動空間のカリキュラムを組み合わせた強化学習フレームワークを提案する。
提案アルゴリズムは,現実世界のオフロード運転タスクに対して,高速なポリシーを学習可能であることを示す。
論文 参考訳(メタデータ) (2024-05-07T23:32:36Z) - Evaluation of Safety Constraints in Autonomous Navigation with Deep
Reinforcement Learning [62.997667081978825]
学習可能なナビゲーションポリシとして,セーフとアンセーフの2つを比較します。
安全なポリシは、制約をアカウントに含めますが、もう一方はそうではありません。
安全政策は、よりクリアランスの高い軌道を生成することができ(障害物によらず)、全体的な性能を犠牲にすることなく、トレーニング中に衝突を減らすことができることを示す。
論文 参考訳(メタデータ) (2023-07-27T01:04:57Z) - Robust Driving Policy Learning with Guided Meta Reinforcement Learning [49.860391298275616]
本稿では,ソーシャルカーの多種多様な運転方針を一つのメタ政治として訓練する効率的な方法を提案する。
ソーシャルカーのインタラクションに基づく報酬関数をランダム化することにより、多様な目的を生み出し、メタ政治を効率的に訓練することができる。
本研究では,社会自動車が学習メタ政治によって制御される環境を利用して,エゴ自動車の運転方針の堅牢性を高めるためのトレーニング戦略を提案する。
論文 参考訳(メタデータ) (2023-07-19T17:42:36Z) - Integration of Reinforcement Learning Based Behavior Planning With
Sampling Based Motion Planning for Automated Driving [0.5801044612920815]
本研究では,高度行動計画のための訓練された深層強化学習ポリシーを用いる方法を提案する。
私たちの知る限りでは、この研究は、この方法で深層強化学習を適用した最初のものである。
論文 参考訳(メタデータ) (2023-04-17T13:49:55Z) - Safety Correction from Baseline: Towards the Risk-aware Policy in
Robotics via Dual-agent Reinforcement Learning [64.11013095004786]
本稿では,ベースラインと安全エージェントからなる二重エージェント型安全強化学習戦略を提案する。
このような分離されたフレームワークは、RLベースの制御に対して高い柔軟性、データ効率、リスク認識を可能にする。
提案手法は,難易度の高いロボットの移動・操作作業において,最先端の安全RLアルゴリズムより優れる。
論文 参考訳(メタデータ) (2022-12-14T03:11:25Z) - Automatically Learning Fallback Strategies with Model-Free Reinforcement
Learning in Safety-Critical Driving Scenarios [9.761912672523977]
本稿では, モデルレス強化学習(RL)エージェントに対して, 環境内の複数の動作モードを捉えるための原則的アプローチを提案する。
我々は、報酬モデルに擬似報酬項を導入し、最適政策によって特権付けられた領域とは異なる国家空間の領域への探索を奨励する。
我々は、トレーニング中に見逃されたであろう有用なポリシーを学習でき、制御アルゴリズムの実行時に使用できないことを示す。
論文 参考訳(メタデータ) (2022-04-11T15:34:49Z) - Transferable Deep Reinforcement Learning Framework for Autonomous
Vehicles with Joint Radar-Data Communications [69.24726496448713]
本稿では,AVの最適決定を支援するために,マルコフ決定プロセス(MDP)に基づくインテリジェントな最適化フレームワークを提案する。
そこで我々は,近年の深層強化学習技術を活用した効果的な学習アルゴリズムを開発し,AVの最適方針を見出す。
提案手法は,従来の深部強化学習手法と比較して,AVによる障害物ミス検出確率を最大67%削減することを示す。
論文 参考訳(メタデータ) (2021-05-28T08:45:37Z) - Affordance-based Reinforcement Learning for Urban Driving [3.507764811554557]
経路点と低次元視覚表現を用いた最適制御ポリシーを学習するための深層強化学習フレームワークを提案する。
スクラッチから訓練されたエージェントは、車線追従のタスクを学習し、区間間を走り回り、密集した交通状況でも他のアクターや信号機の前で立ち止まることを実証する。
論文 参考訳(メタデータ) (2021-01-15T05:21:25Z) - Learning from Simulation, Racing in Reality [126.56346065780895]
ミニチュアレースカープラットフォーム上で自律的なレースを行うための強化学習ベースのソリューションを提案する。
シミュレーションで純粋に訓練されたポリシーは、実際のロボットのセットアップにうまく移行できることを示す。
論文 参考訳(メタデータ) (2020-11-26T14:58:49Z) - Safe Trajectory Planning Using Reinforcement Learning for Self Driving [21.500697097095408]
自動運転車の軌道計画段階におけるモデルフリー強化学習を提案する。
このアプローチにより、自動運転のタスクに必要な安全で汎用的で快適な方法で車を操作することができることを示す。
論文 参考訳(メタデータ) (2020-11-09T19:29:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。