論文の概要: Self-Paced Curriculum Reinforcement Learning for Autonomous Superbike Racing in Simulation
- arxiv url: http://arxiv.org/abs/2606.09236v1
- Date: Mon, 08 Jun 2026 09:14:12 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-09 14:42:06.883794
- Title: Self-Paced Curriculum Reinforcement Learning for Autonomous Superbike Racing in Simulation
- Title(参考訳): シミュレーションによる自動スーパーバイクレースの自己更新型カリキュラム強化学習
- Authors: Luca Ghisi, Jacopo Essenziale, Carlo D'Eramo, Matteo Luperto,
- Abstract要約: 本稿では,物理精度の高いUnityベースのバイクシミュレータであるVRider SBKで,スーパーバイクをレースする自律エージェントを訓練するためのフレームワークを提案する。
SPDLは, トレーニング効率, ラップタイム, 運転安定性において, 複数のトラックおよびバイクモデルにおいて, SAC単独よりも優れていた。
- 参考スコア(独自算出の注目度): 9.439483772106346
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Autonomous Racing has seen remarkable progress through deep Reinforcement Learning (RL), primarily for four-wheeled vehicles. However, motorbikes introduce substantially greater complexity due to the need to manage balance and lean angle, in addition to more reactive steering and throttle control, and a smaller weight. In this work, we present a framework for training an autonomous agent to race a superbike in VRider SBK, a physics-accurate Unity-based motorbike simulator. Our approach integrates Soft Actor-Critic (SAC) with Self-Paced curriculum Deep reinforcement Learning (SPDL), which dynamically generates progressively more challenging tasks based on the agent's performance, without requiring manual curriculum design. The agent's state space comprises proprioceptive features extended with lean-angle history, along with global track features via course points. The reward signal is shaped to encourage progress along the track while penalizing instability-inducing behaviors specific to two-wheeled dynamics. Preliminary experimental results demonstrate that SPDL outperforms SAC alone in training efficiency, lap time, and driving stability across multiple tracks and motorbike models, establishing a first baseline for RL-based autonomous motorbike racing.
- Abstract(参考訳): 自律レーシングは、主に四輪車のための深層強化学習(RL)を通じて顕著な進歩を遂げている。
しかし、モーターバイクは、より反応性の高いステアリングとスロットル制御に加えて、バランスとリーンアングルを管理する必要があるため、大幅に複雑さを増す。
本研究では,物理精度の高いUnityをベースとしたバイクシミュレータであるVRider SBKで,スーパーバイクをレースする自律エージェントを訓練するためのフレームワークを提案する。
本手法では,ソフト・アクター・クリティカル (SAC) とセルフパスカリキュラムの深層強化学習 (SPDL) を統合し,手作業によるカリキュラム設計を必要とせず,エージェントのパフォーマンスに基づいて動的により困難なタスクを生成する。
エージェントの状態空間は、リーン角度履歴で拡張された受容的特徴と、コースポイントを介してグローバルなトラック特徴から構成される。
報酬信号は、二輪動力学に特有の不安定誘導動作をペナルティ化しながら、コースに沿って進行を促進するために形成される。
予備実験の結果、SPDLは訓練効率、ラップタイム、運転安定性において、複数のトラックやバイクモデルでSACを単独で上回り、RLベースの自律バイクレースのベースラインを確立した。
関連論文リスト
- Physics-Informed Reinforcement Learning of Spatial Density Velocity Potentials for Map-Free Racing [73.88859384645264]
Out-Of-Distribution (OOD) の様々なレーストラックへの一般化は、機械学習(ML)を用いて、エンドツーエンド制御のためのセンサデータと車両アクチュエーターの間の数学的関係を符号化する。
本稿では,非幾何学的,物理インフォームド報酬を用いた深度測定のスペクトル分布から非線形車両動特性をパラメータ化して,ニューラルネットワーク(ANN)による車両の時間最適・乗換レース制御を推定するDRL法を提案する。
このポリシーは、経験的なパセジカタイヤモデルに似たタイヤのダイナミックスで摩擦円を最大化することで、OODトラックの12%で人間のデモより優れています。
論文 参考訳(メタデータ) (2026-04-10T17:12:07Z) - Curriculum-Based Iterative Self-Play for Scalable Multi-Drone Racing [0.0]
CRUISEはマルチドローンレースのための強化学習フレームワークである。
プログレッシブな難易度カリキュラムと効率的なセルフプレイ機構を組み合わせることで、堅牢な競争行動を促進する。
プランナーの平均レース速度を2倍近く達成し、高い成功率を維持し、エージェント密度が増加するにつれて堅牢なスケーラビリティを示す。
論文 参考訳(メタデータ) (2025-10-26T08:03:06Z) - SPIRAL: Self-Play Incremental Racing Algorithm for Learning in Multi-Drone Competitions [0.0]
本稿では,マルチエージェントレースにおける自律ドローンのトレーニング手法であるSPIRALを紹介する。
SPIRALは、複雑なレースの振る舞いを漸進的に培養するセルフプレイ機構を特有に採用している。
本手法は汎用性のために設計されており,最先端のDeep Reinforcement Learning (DRL)アルゴリズムと統合可能である。
論文 参考訳(メタデータ) (2025-10-26T07:59:44Z) - er.autopilot 1.0: The Full Autonomous Stack for Oval Racing at High
Speeds [61.91756903900903]
インディ・オートノラティカル・チャレンジ (IAC) は、オープンホイールのレースカー上で独立して開発されたソフトウェアを使用して、前例のないスピードとヘッド・ツー・ヘッドのシナリオで競う9つの自律レースチームを集めた。
本稿では,チームTII EuroRacing (TII-ER) が使用するソフトウェアアーキテクチャについて述べる。静的障害物を避け,アクティブオーバーテイクを行い,75m/s (270 km/h) 以上の速度に達するために必要なモジュールをすべて網羅する。
総合的な結果と各モジュールのパフォーマンス、および、チームがそれぞれ2番目と3番目を置く楕円軌道上の競技の最初の2つのイベントで学んだ教訓について説明する。
論文 参考訳(メタデータ) (2023-10-27T12:52:34Z) - Rethinking Closed-loop Training for Autonomous Driving [82.61418945804544]
本研究は,学習エージェントの成功に対する異なるトレーニングベンチマーク設計の影響を分析した最初の実証的研究である。
複数ステップのルックアヘッドで計画を行うRLベースの駆動エージェントであるtrajectory value learning (TRAVL)を提案する。
実験の結果,TRAVLはすべてのベースラインと比較してより速く学習でき,安全な操作が可能であることがわかった。
論文 参考訳(メタデータ) (2023-06-27T17:58:39Z) - Vehicle Dynamics Modeling for Autonomous Racing Using Gaussian Processes [0.0]
本稿では,自動走行における車両動力学の近似におけるGPモデルの適用性について,最も詳細な解析を行った。
人気のあるF1TENTHレーシングプラットフォームのための動的および拡張キネマティックモデルを構築した。
論文 参考訳(メタデータ) (2023-06-06T04:53:06Z) - FastRLAP: A System for Learning High-Speed Driving via Deep RL and
Autonomous Practicing [71.76084256567599]
本稿では、自律型小型RCカーを強化学習(RL)を用いた視覚的観察から積極的に駆動するシステムを提案する。
我々のシステムであるFastRLAP (faster lap)は、人間の介入なしに、シミュレーションや専門家によるデモンストレーションを必要とせず、現実世界で自律的に訓練する。
結果として得られたポリシーは、タイミングブレーキや回転の加速度などの突発的な運転スキルを示し、ロボットの動きを妨げる領域を避け、トレーニングの途中で同様の1対1のインタフェースを使用して人間のドライバーのパフォーマンスにアプローチする。
論文 参考訳(メタデータ) (2023-04-19T17:33:47Z) - Tackling Real-World Autonomous Driving using Deep Reinforcement Learning [63.3756530844707]
本研究では,加速と操舵角度を予測するニューラルネットワークを学習するモデルレスディープ強化学習プランナを提案する。
実際の自動運転車にシステムをデプロイするために、我々は小さなニューラルネットワークで表されるモジュールも開発する。
論文 参考訳(メタデータ) (2022-07-05T16:33:20Z) - Indy Autonomous Challenge -- Autonomous Race Cars at the Handling Limits [81.22616193933021]
TUM Auton-omous Motorsportsは2021年10月、インディ・オートマチック・チャレンジに参加する。
インディアナポリス・モーター・スピードウェイのダララAV-21レースカー10台のうち1台を走らせることで、自動運転のソフトウェアスタックをベンチマークする。
これは、最も困難で稀な状況をマスターできる自律走行アルゴリズムを開発するための理想的な試験場である。
論文 参考訳(メタデータ) (2022-02-08T11:55:05Z) - Autonomous Overtaking in Gran Turismo Sport Using Curriculum
Reinforcement Learning [39.757652701917166]
本研究では,自律オーバーテイク問題に対する新たな学習手法を提案する。
カーレースシミュレーターであるGran Turismo Sportによるアプローチの評価を行った。
論文 参考訳(メタデータ) (2021-03-26T18:06:50Z) - Super-Human Performance in Gran Turismo Sport Using Deep Reinforcement
Learning [39.719051858649216]
高忠実度物理カーシミュレーションを利用した自律走行車レース学習システムを提案する。
私たちは、異なるレースカーとトラックのリアルな物理シミュレーションで知られている世界主導の自動車シミュレータであるGran Turismo Sportにシステムをデプロイしました。
私たちのトレーニングされたポリシーは、組み込みAIによってこれまで達成された以上の自律的なレースパフォーマンスを実現しています。
論文 参考訳(メタデータ) (2020-08-18T15:06:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。