論文の概要: Online Fine-Tuning of Pretrained Controllers for Autonomous Driving via Real-Time Recurrent RL
- arxiv url: http://arxiv.org/abs/2602.02236v2
- Date: Tue, 03 Feb 2026 09:41:00 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-04 16:18:58.872689
- Title: Online Fine-Tuning of Pretrained Controllers for Autonomous Driving via Real-Time Recurrent RL
- Title(参考訳): リアルタイムリカレントRLによる自律走行のための事前学習制御器のオンライン微調整
- Authors: Julian Lemmel, Felix Resch, Mónika Farsang, Ramin Hasani, Daniela Rus, Radu Grosu,
- Abstract要約: 実時間リカレント強化学習(RTRRL)は,運転作業における自律エージェントのパフォーマンスを向上させるための事前訓練されたポリシーを微調整できることを示す。
シミュレーションされたCarRacing環境と,イベントカメラを備えたRoboRacer車を用いた実世界のラインフォロータスクにおいて,このクローズドループアプローチの有効性を実証する。
- 参考スコア(独自算出の注目度): 46.24289791053193
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Deploying pretrained policies in real-world applications presents substantial challenges that fundamentally limit the practical applicability of learning-based control systems. When autonomous systems encounter environmental changes in system dynamics, sensor drift, or task objectives, fixed policies rapidly degrade in performance. We show that employing Real-Time Recurrent Reinforcement Learning (RTRRL), a biologically plausible algorithm for online adaptation, can effectively fine-tune a pretrained policy to improve autonomous agents' performance on driving tasks. We further show that RTRRL synergizes with a recent biologically inspired recurrent network model, the Liquid-Resistance Liquid-Capacitance RNN. We demonstrate the effectiveness of this closed-loop approach in a simulated CarRacing environment and in a real-world line-following task with a RoboRacer car equipped with an event camera.
- Abstract(参考訳): 実世界のアプリケーションに事前訓練されたポリシーを配置することは、学習ベースの制御システムの実践的適用性を根本的に制限する重大な課題を示す。
自律システムがシステム力学、センサードリフト、タスク目標の環境変化に遭遇すると、一定のポリシーは急速に性能が低下する。
実時間繰り返し強化学習(RTRRL)を用いたオンライン適応のための生物学的に妥当なアルゴリズムは,運転作業における自律エージェントのパフォーマンスを向上させるための事前訓練されたポリシーを効果的に微調整できることを示す。
さらに, RTRRLは, 最近生体にインスパイアされたリカレントネットワークモデルであるLiquid-Resistance Liquid-Capacitance RNNと相乗効果を示す。
シミュレーションされたCarRacing環境と,イベントカメラを備えたRoboRacer車を用いた実世界のラインフォロータスクにおいて,このクローズドループアプローチの有効性を実証する。
関連論文リスト
- Mini Autonomous Car Driving based on 3D Convolutional Neural Networks [0.6349729476511409]
信頼性があり信頼性の高い自律システムの開発は、高い複雑さ、長い訓練期間、本質的な不確実性のレベルといった課題を引き起こす。
ミニオートマチックカー (MAC) は、小規模の設備における自律制御手法の検証を可能にする実用的なテストベッドとして使用される。
本研究では、シミュレーション環境におけるMAC自律運転のためのRGB-D情報と3次元畳み込みニューラルネットワーク(3次元CNN)に基づく方法論を提案する。
論文 参考訳(メタデータ) (2025-08-29T00:21:34Z) - Self-Driving Car Racing: Application of Deep Reinforcement Learning [0.0]
このプロジェクトの目的は、OpenAI Gymnasium CarRacing環境でシミュレーションカーを効率的に駆動するAIエージェントを開発することである。
本稿では,DQN(Deep Q-Network)やPPO(Proximal Policy Optimization)などのRLアルゴリズムや,トランスファーラーニングとリカレントニューラルネットワーク(RNN)を組み込んだ新たな適応手法について検討する。
論文 参考訳(メタデータ) (2024-10-30T07:32:25Z) - From Imitation to Exploration: End-to-end Autonomous Driving based on World Model [24.578178308010912]
RAMBLEは、意思決定を駆動するエンド・ツー・エンドの世界モデルベースのRL方式である。
複雑な動的トラフィックシナリオを処理できる。
CARLA Leaderboard 1.0では、ルート完了率の最先端のパフォーマンスを達成し、CARLA Leaderboard 2.0では38のシナリオをすべて完了している。
論文 参考訳(メタデータ) (2024-10-03T06:45:59Z) - Grow Your Limits: Continuous Improvement with Real-World RL for Robotic
Locomotion [66.69666636971922]
本稿では,ロボットの学習過程における探索を調節するポリシー正規化フレームワークであるAPRLを提案する。
APRLは四足歩行ロボットを、数分で完全に現実世界を歩けるように効率よく学習する。
論文 参考訳(メタデータ) (2023-10-26T17:51:46Z) - FastRLAP: A System for Learning High-Speed Driving via Deep RL and
Autonomous Practicing [71.76084256567599]
本稿では、自律型小型RCカーを強化学習(RL)を用いた視覚的観察から積極的に駆動するシステムを提案する。
我々のシステムであるFastRLAP (faster lap)は、人間の介入なしに、シミュレーションや専門家によるデモンストレーションを必要とせず、現実世界で自律的に訓練する。
結果として得られたポリシーは、タイミングブレーキや回転の加速度などの突発的な運転スキルを示し、ロボットの動きを妨げる領域を避け、トレーニングの途中で同様の1対1のインタフェースを使用して人間のドライバーのパフォーマンスにアプローチする。
論文 参考訳(メタデータ) (2023-04-19T17:33:47Z) - Learning to Control Autonomous Fleets from Observation via Offline
Reinforcement Learning [3.9121134770873733]
オフライン強化学習のレンズによる自律移動システム制御の形式化を提案する。
オフラインRLは、経済的にクリティカルなシステムにおいて、RLベースのソリューションを適用する上で有望なパラダイムであることを示す。
論文 参考訳(メタデータ) (2023-02-28T18:31:07Z) - Don't Start From Scratch: Leveraging Prior Data to Automate Robotic
Reinforcement Learning [70.70104870417784]
強化学習(RL)アルゴリズムは、ロボットシステムの自律的なスキル獲得を可能にするという約束を持っている。
現実のロボットRLは、通常、環境をリセットするためにデータ収集と頻繁な人間の介入を必要とする。
本研究では,従来のタスクから収集した多様なオフラインデータセットを効果的に活用することで,これらの課題にどのように対処できるかを検討する。
論文 参考訳(メタデータ) (2022-07-11T08:31:22Z) - Tackling Real-World Autonomous Driving using Deep Reinforcement Learning [63.3756530844707]
本研究では,加速と操舵角度を予測するニューラルネットワークを学習するモデルレスディープ強化学習プランナを提案する。
実際の自動運転車にシステムをデプロイするために、我々は小さなニューラルネットワークで表されるモジュールも開発する。
論文 参考訳(メタデータ) (2022-07-05T16:33:20Z) - Learning from Simulation, Racing in Reality [126.56346065780895]
ミニチュアレースカープラットフォーム上で自律的なレースを行うための強化学習ベースのソリューションを提案する。
シミュレーションで純粋に訓練されたポリシーは、実際のロボットのセットアップにうまく移行できることを示す。
論文 参考訳(メタデータ) (2020-11-26T14:58:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。