論文の概要: Learning Residual Model of Model Predictive Control via Random Forests
for Autonomous Driving
- arxiv url: http://arxiv.org/abs/2304.04366v1
- Date: Mon, 10 Apr 2023 03:32:09 GMT
- ステータス: 処理完了
- システム内更新日: 2023-04-11 16:06:51.778221
- Title: Learning Residual Model of Model Predictive Control via Random Forests
for Autonomous Driving
- Title(参考訳): 自律運転のためのランダム森林を用いたモデル予測制御の残差モデル学習
- Authors: Kang Zhao, Jianru Xue, Xiangning Meng, Gengxin Li, and Mengsen Wu
- Abstract要約: 自律運転における予測制御(MPC)の大きな問題は、システムモデルの予測と計算の矛盾である。
本稿では、MPC追跡精度をプログラム(QP)問題最適化として再構成し、プログラム(QP)が効果的に解けるようにする。
- 参考スコア(独自算出の注目度): 13.865293598486492
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: One major issue in learning-based model predictive control (MPC) for
autonomous driving is the contradiction between the system model's prediction
accuracy and computation efficiency. The more situations a system model covers,
the more complex it is, along with highly nonlinear and nonconvex properties.
These issues make the optimization too complicated to solve and render
real-time control impractical.To address these issues, we propose a
hierarchical learning residual model which leverages random forests and linear
regression.The learned model consists of two levels. The low level uses linear
regression to fit the residues, and the high level uses random forests to
switch different linear models. Meanwhile, we adopt the linear dynamic bicycle
model with error states as the nominal model.The switched linear regression
model is added to the nominal model to form the system model. It reformulates
the learning-based MPC as a quadratic program (QP) problem and optimization
solvers can effectively solve it. Experimental path tracking results show that
the driving vehicle's prediction accuracy and tracking accuracy are
significantly improved compared with the nominal MPC.Compared with the
state-of-the-art Gaussian process-based nonlinear model predictive control
(GP-NMPC), our method gets better performance on tracking accuracy while
maintaining a lower computation consumption.
- Abstract(参考訳): 自律運転のための学習ベースモデル予測制御(MPC)の大きな問題は、システムモデルの予測精度と計算効率の矛盾である。
システムモデルがカバーする状況が多ければ多いほど、高度に非線形で非凸な性質とともに複雑になる。
これらの課題により,リアルタイム制御を現実的でないものにするには最適化が複雑すぎる。これらの問題に対処するために,ランダムフォレストと線形回帰を利用した階層的学習残差モデルを提案する。
低レベルは線形回帰を使って残留物に適合し、高レベルはランダム森林を使って異なる線形モデルを切り替える。
一方, 誤差状態の線形動的自転車モデルを名目モデルとして採用し, 名目モデルに切り換えた線形回帰モデルを加え, システムモデルを形成する。
学習ベースのMPCを2次プログラム問題(QP)として再構成し、最適化問題を効果的に解く。
実験経路追跡の結果, 運転車両の予測精度と追従精度は, 名目mpcと比較して有意に向上し, ガウス過程に基づく非線形モデル予測制御(gp-nmpc)と比較すると, 計算量が少なく, 追従精度が向上した。
関連論文リスト
- Towards Stable Machine Learning Model Retraining via Slowly Varying Sequences [6.067007470552307]
そこで本研究では,繰り返しのトレーニングにおいて安定な機械学習モデルのシーケンスを見つける手法を提案する。
最適モデルの復元が保証される混合整数最適化の定式化を開発する。
本手法は, 予測力の小さい, 制御可能な犠牲を伴い, 厳密に訓練されたモデルよりも強い安定性を示す。
論文 参考訳(メタデータ) (2024-03-28T22:45:38Z) - Deep autoregressive density nets vs neural ensembles for model-based
offline reinforcement learning [2.9158689853305693]
本稿では、利用可能なデータからシステムダイナミクスを推定し、仮想モデルロールアウトにおけるポリシー最適化を行うモデルベース強化学習アルゴリズムについて考察する。
このアプローチは、実際のシステムで破滅的な失敗を引き起こす可能性のあるモデルエラーを悪用することに対して脆弱である。
D4RLベンチマークの1つのよく校正された自己回帰モデルにより、より良い性能が得られることを示す。
論文 参考訳(メタデータ) (2024-02-05T10:18:15Z) - Predictable MDP Abstraction for Unsupervised Model-Based RL [93.91375268580806]
予測可能なMDP抽象化(PMA)を提案する。
元のMDPで予測モデルを訓練する代わりに、学習されたアクション空間を持つ変換MDPでモデルを訓練する。
我々はPMAを理論的に解析し、PMAが以前の教師なしモデルベースRLアプローチよりも大幅に改善することを示す。
論文 参考訳(メタデータ) (2023-02-08T07:37:51Z) - Real-to-Sim: Predicting Residual Errors of Robotic Systems with Sparse
Data using a Learning-based Unscented Kalman Filter [65.93205328894608]
我々は,動的・シミュレータモデルと実ロボット間の残差を学習する。
学習した残差誤差により、動的モデル、シミュレーション、および実際のハードウェア間の現実的ギャップをさらに埋めることができることを示す。
論文 参考訳(メタデータ) (2022-09-07T15:15:12Z) - Online Dynamics Learning for Predictive Control with an Application to
Aerial Robots [3.673994921516517]
予測モデルは学習し、モデルベースのコントローラに適用することができるが、これらのモデルはしばしばオフラインで学習される。
このオフライン設定では、トレーニングデータをまず収集し、精巧なトレーニング手順により予測モデルを学ぶ。
本稿では,デプロイ中の動的モデルの精度を継続的に向上するオンライン動的学習フレームワークを提案する。
論文 参考訳(メタデータ) (2022-07-19T15:51:25Z) - A Data-driven feature selection and machine-learning model benchmark for
the prediction of longitudinal dispersion coefficient [29.58577229101903]
縦方向分散(LD)係数の正確な予測は、関連するシミュレーションにおいて性能の飛躍をもたらすことができる。
本研究では, 蒸留した局所最適値と代表MLモデルとの数値比較により, 大域的最適特徴集合を提案した。
その結果,サポートベクタマシンは他のモデルよりも大幅に性能が向上していることがわかった。
論文 参考訳(メタデータ) (2021-07-16T09:50:38Z) - Regression Bugs Are In Your Model! Measuring, Reducing and Analyzing
Regressions In NLP Model Updates [68.09049111171862]
この研究は、NLPモデル更新における回帰エラーの定量化、低減、分析に重点を置いている。
回帰フリーモデル更新を制約付き最適化問題に定式化する。
モデルアンサンブルが回帰を減らす方法を実証的に分析します。
論文 参考訳(メタデータ) (2021-05-07T03:33:00Z) - Gaussian Process-based Min-norm Stabilizing Controller for
Control-Affine Systems with Uncertain Input Effects and Dynamics [90.81186513537777]
本稿では,この問題の制御・アフィン特性を捉えた新しい化合物カーネルを提案する。
この結果の最適化問題は凸であることを示し、ガウス過程に基づく制御リャプノフ関数第二次コーンプログラム(GP-CLF-SOCP)と呼ぶ。
論文 参考訳(メタデータ) (2020-11-14T01:27:32Z) - Logarithmic Regret Bound in Partially Observable Linear Dynamical
Systems [91.43582419264763]
部分的に観測可能な線形力学系におけるシステム同定と適応制御の問題について検討する。
開ループ系と閉ループ系の両方において有限時間保証付きの最初のモデル推定法を提案する。
AdaptOnは、未知の部分観測可能な線形力学系の適応制御において、$textpolylogleft(Tright)$ regretを達成する最初のアルゴリズムであることを示す。
論文 参考訳(メタデータ) (2020-03-25T06:00:33Z) - Information Theoretic Model Predictive Q-Learning [64.74041985237105]
本稿では,情報理論的MPCとエントロピー正規化RLとの新たな理論的関連性を示す。
バイアスモデルを利用したQ-ラーニングアルゴリズムを開発した。
論文 参考訳(メタデータ) (2019-12-31T00:29:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。