論文の概要: ReinVBC: A Model-based Reinforcement Learning Approach to Vehicle Braking Controller
- arxiv url: http://arxiv.org/abs/2604.04401v1
- Date: Mon, 06 Apr 2026 04:00:40 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-07 15:49:19.083414
- Title: ReinVBC: A Model-based Reinforcement Learning Approach to Vehicle Braking Controller
- Title(参考訳): ReinVBC: 車両ブレーキ制御のためのモデルに基づく強化学習アプローチ
- Authors: Haoxin Lin, Junjie Zhou, Daheng Xu, Yang Yu,
- Abstract要約: 本研究では,車両ブレーキ制御問題に対するオフラインモデルに基づく強化学習手法を応用したReinVBCを提案する。
実世界の車両ブレーキにおける本手法の有効性と,生産レベルのアンチロックブレーキシステムに取って代わる可能性を示した。
- 参考スコア(独自算出の注目度): 8.694943397561124
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Braking system, the key module to ensure the safety and steer-ability of current vehicles, relies on extensive manual calibration during production. Reducing labor and time consumption while maintaining the Vehicle Braking Controller (VBC) performance greatly benefits the vehicle industry. Model-based methods in offline reinforcement learning, which facilitate policy exploration within a data-driven dynamics model, offer a promising solution for addressing real-world control tasks. This work proposes ReinVBC, which applies an offline model-based reinforcement learning approach to deal with the vehicle braking control problem. We introduce useful engineering designs into the paradigm of model learning and utilization to obtain a reliable vehicle dynamics model and a capable braking policy. Several results demonstrate the capability of our method in real-world vehicle braking and its potential to replace the production-grade anti-lock braking system.
- Abstract(参考訳): ブレーキシステムは、現行車両の安全性と操舵性を確保するための重要なモジュールであり、生産中に広範囲な手動キャリブレーションに依存している。
自動車ブレーキ制御器(VBC)の性能を維持しながら、労働と時間の消費を減らすことは、自動車産業に大きな利益をもたらす。
データ駆動型動的モデルにおけるポリシー探索を容易にするオフライン強化学習におけるモデルベース手法は、現実世界の制御タスクに対処するための有望なソリューションを提供する。
本研究では,車両ブレーキ制御問題に対するオフラインモデルに基づく強化学習手法を応用したReinVBCを提案する。
モデル学習と利用のパラダイムに有用なエンジニアリング設計を導入し、信頼性の高い車両動力学モデルと有能なブレーキポリシーを得る。
実世界の車両ブレーキにおける本手法の有効性と,生産レベルのアンチロックブレーキシステムに取って代わる可能性を示した。
関連論文リスト
- First, Learn What You Don't Know: Active Information Gathering for Driving at the Limits of Handling [38.468291768795865]
不安定なシステムでは、オンライン適応は信頼性の高い同時学習と制御を確保するのに十分ではないかもしれない。
車両の動力学をできるだけ早く識別するためのアクティブな情報収集フレームワークを提案する。
このフレームワークは安定性の限界において車両の信頼性の高い制御を可能にすることを示す。
論文 参考訳(メタデータ) (2024-10-31T18:02:30Z) - Mitigating Covariate Shift in Imitation Learning for Autonomous Vehicles Using Latent Space Generative World Models [60.87795376541144]
World Model(ワールドモデル)は、エージェントの次の状態を予測できるニューラルネットワークである。
エンド・ツー・エンドのトレーニングでは、人間のデモで観察された状態と整合してエラーから回復する方法を学ぶ。
クローズドループ試験における先行技術に有意な改善がみられた定性的,定量的な結果を示す。
論文 参考訳(メタデータ) (2024-09-25T06:48:25Z) - MOTO: Offline Pre-training to Online Fine-tuning for Model-based Robot
Learning [52.101643259906915]
本研究では,高次元観測による強化学習におけるオフライン事前学習とオンラインファインチューニングの問題について検討する。
既存のモデルベースオフラインRL法は高次元領域におけるオフラインからオンラインへの微調整には適していない。
本稿では,事前データをモデルベース値拡張とポリシー正則化によって効率的に再利用できるオンラインモデルベース手法を提案する。
論文 参考訳(メタデータ) (2024-01-06T21:04:31Z) - Model-Based Reinforcement Learning with Isolated Imaginations [61.67183143982074]
モデルに基づく強化学習手法であるIso-Dream++を提案する。
我々は、切り離された潜在的想像力に基づいて政策最適化を行う。
これにより、野生の混合力学源を孤立させることで、長い水平振動子制御タスクの恩恵を受けることができる。
論文 参考訳(メタデータ) (2023-03-27T02:55:56Z) - Unified Automatic Control of Vehicular Systems with Reinforcement
Learning [64.63619662693068]
本稿では,車載マイクロシミュレーションの合理化手法について述べる。
最小限の手動設計で高性能な制御戦略を発見する。
この研究は、波動緩和、交通信号、ランプ計測に類似した多くの創発的挙動を明らかにしている。
論文 参考訳(メタデータ) (2022-07-30T16:23:45Z) - Tackling Real-World Autonomous Driving using Deep Reinforcement Learning [63.3756530844707]
本研究では,加速と操舵角度を予測するニューラルネットワークを学習するモデルレスディープ強化学習プランナを提案する。
実際の自動運転車にシステムをデプロイするために、我々は小さなニューラルネットワークで表されるモジュールも開発する。
論文 参考訳(メタデータ) (2022-07-05T16:33:20Z) - UMBRELLA: Uncertainty-Aware Model-Based Offline Reinforcement Learning
Leveraging Planning [1.1339580074756188]
オフライン強化学習(RL)は、オフラインデータから意思決定を学ぶためのフレームワークを提供する。
自動運転車(SDV)は、おそらく準最適データセットの振る舞いよりも優れるポリシーを学ぶ。
これはモデルベースのオフラインRLアプローチの使用を動機付け、プランニングを活用する。
論文 参考訳(メタデータ) (2021-11-22T10:37:52Z) - Weakly Supervised Reinforcement Learning for Autonomous Highway Driving
via Virtual Safety Cages [42.57240271305088]
規則に基づく安全ケージは、車両の安全性の向上と強化学習エージェントに対する弱い監督を提供する自律型車両の縦方向制御に対する強化学習ベースのアプローチを提示する。
モデルパラメータが制約されたり,あるいは最適化されていない場合,モデルが強化学習だけでは運転を訓練できない場合でも,モデルが安全な運転方針を学習できることを示す。
論文 参考訳(メタデータ) (2021-03-17T15:30:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。