論文の概要: Self-adaptive Torque Vectoring Controller Using Reinforcement Learning
- arxiv url: http://arxiv.org/abs/2103.14892v1
- Date: Sat, 27 Mar 2021 12:39:56 GMT
- ステータス: 処理完了
- システム内更新日: 2021-03-30 14:34:13.319702
- Title: Self-adaptive Torque Vectoring Controller Using Reinforcement Learning
- Title(参考訳): 強化学習を用いた自己適応トルクベクトル制御
- Authors: Shayan Taherian, Sampo Kuutti, Marco Visca and Saber Fallah
- Abstract要約: トルクベクトルコントローラなどの連続直接ヨーモーメント制御システムは、車両の安定化に不可欠な部品です。
トルクベクトル制御器のパラメータを注意深くチューニングする能力は、車両の性能と安定性を著しく向上させることができる。
トルクベクトル制御のためのパラメータチューニングアルゴリズムとして、DDPG(Deep Deterministic Policy Gradient)に基づく強化学習(RL)の有用性を示す。
- 参考スコア(独自算出の注目度): 6.8390297905731625
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Continuous direct yaw moment control systems such as torque-vectoring
controller are an essential part for vehicle stabilization. This controller has
been extensively researched with the central objective of maintaining the
vehicle stability by providing consistent stable cornering response. The
ability of careful tuning of the parameters in a torque-vectoring controller
can significantly enhance vehicle's performance and stability. However, without
any re-tuning of the parameters, especially in extreme driving conditions e.g.
low friction surface or high velocity, the vehicle fails to maintain the
stability. In this paper, the utility of Reinforcement Learning (RL) based on
Deep Deterministic Policy Gradient (DDPG) as a parameter tuning algorithm for
torque-vectoring controller is presented. It is shown that, torque-vectoring
controller with parameter tuning via reinforcement learning performs well on a
range of different driving environment e.g., wide range of friction conditions
and different velocities, which highlight the advantages of reinforcement
learning as an adaptive algorithm for parameter tuning. Moreover, the
robustness of DDPG algorithm are validated under scenarios which are beyond the
training environment of the reinforcement learning algorithm. The simulation
has been carried out using a four wheels vehicle model with nonlinear tire
characteristics. We compare our DDPG based parameter tuning against a genetic
algorithm and a conventional trial-and-error tunning of the torque vectoring
controller, and the results demonstrated that the reinforcement learning based
parameter tuning significantly improves the stability of the vehicle.
- Abstract(参考訳): トルクベクタリングコントローラなどの連続ヨーモーメント制御系は、車両の安定化に欠かせない部分である。
この制御器は、一貫した安定なコーナー応答を提供することにより、車両の安定性を維持するという中心的な目的で広範囲に研究されてきた。
トルクベクトル制御器のパラメータを注意深くチューニングする能力は、車両の性能と安定性を著しく向上させることができる。
しかし、特に極端な運転条件においてパラメータを再調整する必要がない。
摩擦面が低いか 速度が速いか 車両は安定性を維持するのに失敗する
本稿では、トルクベクトル制御のためのパラメータチューニングアルゴリズムとして、DDPG(Deep Deterministic Policy Gradient)に基づく強化学習(RL)の有用性を示す。
強化学習によるパラメータチューニングによるトルクベクトル制御は, パラメータチューニングの適応アルゴリズムとしての強化学習の利点を浮き彫りにした, 様々な駆動環境, 幅広い摩擦条件, 異なる速度で良好に動作することを示す。
さらに,強化学習アルゴリズムの学習環境を超えたシナリオにおいて,ddpgアルゴリズムの頑健性を検証する。
非線形タイヤ特性を有する四輪車モデルを用いてシミュレーションを行った。
本実験では,ddpgに基づくパラメータチューニングを遺伝的アルゴリズムと従来のトルクベクトル制御器の試行錯誤チューニングと比較し,強化学習に基づくパラメータチューニングにより車両の安定性が大幅に向上することを示す。
関連論文リスト
- PID Tuning using Cross-Entropy Deep Learning: a Lyapunov Stability Analysis [1.2499537119440245]
この研究は、そのようなコントローラの安定性を実証的に研究する実験とメトリクスを提案する。
クロスエントロピー深層学習法を用いて適応パラメータを決定するLB適応制御系において,この安定性解析を行う。
論文 参考訳(メタデータ) (2024-04-18T09:22:08Z) - A Tricycle Model to Accurately Control an Autonomous Racecar with Locked
Differential [71.53284767149685]
自動オープンホイールレースカーの側面力学に対するロックディファレンシャルの影響をモデル化するための新しい定式化を提案する。
本稿では,マイクロステップの離散化手法を用いて,動的に線形化し,実時間実装に適した予測を行う。
論文 参考訳(メタデータ) (2023-12-22T16:29:55Z) - RACER: Rational Artificial Intelligence Car-following-model Enhanced by
Reality [51.244807332133696]
本稿では,アダプティブ・クルーズ・コントロール(ACC)運転行動を予測する,最先端の深層学習車追従モデルであるRACERを紹介する。
従来のモデルとは異なり、RACERは実走行の重要な要素であるRDC(Rational Driving Constraints)を効果的に統合している。
RACERはアクセラレーション、ベロシティ、スペーシングといった主要なメトリクスを網羅し、ゼロ違反を登録する。
論文 参考訳(メタデータ) (2023-12-12T06:21:30Z) - Partial End-to-end Reinforcement Learning for Robustness Against Modelling Error in Autonomous Racing [0.0]
本稿では、自動運転車における強化学習(RL)ソリューションの性能向上の問題に対処する。
計画タスクと制御タスクを分離する部分的なエンドツーエンドアルゴリズムを提案する。
従来の制御器のロバスト性を活用することにより,本アルゴリズムは標準のエンドツーエンドアルゴリズムよりもモデルミスマッチに対するロバスト性を向上する。
論文 参考訳(メタデータ) (2023-12-11T14:27:10Z) - Real-Time Model-Free Deep Reinforcement Learning for Force Control of a
Series Elastic Actuator [56.11574814802912]
最先端のロボットアプリケーションは、歩行、揚力、操作などの複雑なタスクを達成するために、閉ループ力制御を備えた連続弾性アクチュエータ(SEAs)を使用する。
モデルフリーPID制御法はSEAの非線形性により不安定になりやすい。
深層強化学習は連続制御タスクに有効なモデルレス手法であることが証明されている。
論文 参考訳(メタデータ) (2023-04-11T00:51:47Z) - Designing a Robust Low-Level Agnostic Controller for a Quadrotor with
Actor-Critic Reinforcement Learning [0.38073142980732994]
ソフトアクター・クリティカルに基づく低レベルウェイポイント誘導制御器の訓練段階におけるドメインランダム化を提案する。
トレーニング中の四元数力学に一定の不確実性を導入することにより、より大規模な四元数パラメータを用いて提案課題を実行することができる制御器が得られることを示す。
論文 参考訳(メタデータ) (2022-10-06T14:58:19Z) - Performance-Driven Controller Tuning via Derivative-Free Reinforcement
Learning [6.5158195776494]
我々は,新しい微分自由強化学習フレームワークを用いて,制御器のチューニング問題に取り組む。
我々は,PIDコントローラを用いた適応走行制御とMPCコントローラを用いた軌道追跡という,自律走行による2つの具体例に関する数値実験を行った。
実験の結果,提案手法は一般的なベースラインよりも優れており,コントローラチューニングの強い可能性を強調している。
論文 参考訳(メタデータ) (2022-09-11T13:01:14Z) - Improving the Performance of Robust Control through Event-Triggered
Learning [74.57758188038375]
LQR問題における不確実性に直面していつ学習するかを決定するイベントトリガー学習アルゴリズムを提案する。
本研究では,ロバストな制御器ベースライン上での性能向上を数値例で示す。
論文 参考訳(メタデータ) (2022-07-28T17:36:37Z) - Gaussian Process-based Min-norm Stabilizing Controller for
Control-Affine Systems with Uncertain Input Effects and Dynamics [90.81186513537777]
本稿では,この問題の制御・アフィン特性を捉えた新しい化合物カーネルを提案する。
この結果の最適化問題は凸であることを示し、ガウス過程に基づく制御リャプノフ関数第二次コーンプログラム(GP-CLF-SOCP)と呼ぶ。
論文 参考訳(メタデータ) (2020-11-14T01:27:32Z) - Model-Reference Reinforcement Learning for Collision-Free Tracking
Control of Autonomous Surface Vehicles [1.7033108359337459]
提案する制御アルゴリズムは,従来の制御手法と強化学習を組み合わせることで,制御精度と知性を向上させる。
強化学習により、全体トラッキングコントローラはモデルの不確実性を補償し、衝突回避を実現することができる。
論文 参考訳(メタデータ) (2020-08-17T12:15:15Z) - Tracking Performance of Online Stochastic Learners [57.14673504239551]
オンラインアルゴリズムは、大規模なバッチにデータを保存したり処理したりすることなく、リアルタイムで更新を計算できるため、大規模な学習環境で人気がある。
一定のステップサイズを使用すると、これらのアルゴリズムはデータやモデル特性などの問題パラメータのドリフトに適応し、適切な精度で最適解を追跡する能力を持つ。
定常仮定に基づく定常状態性能とランダムウォークモデルによるオンライン学習者の追跡性能の関連性を確立する。
論文 参考訳(メタデータ) (2020-04-04T14:16:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。