論文の概要: Approximate Robust NMPC using Reinforcement Learning
- arxiv url: http://arxiv.org/abs/2104.02743v1
- Date: Tue, 6 Apr 2021 18:34:58 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-09 03:18:41.183595
- Title: Approximate Robust NMPC using Reinforcement Learning
- Title(参考訳): 強化学習を用いた近似ロバストNMPC
- Authors: Hossein Nejatbakhsh Esfahani, Arash Bahari Kordabad, Sebastien Gros
- Abstract要約: 障害や不確実性の存在下で非線形システムを制御するための強化学習に基づくロバストモデル予測制御(RL-RNMPC)を提案する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We present a Reinforcement Learning-based Robust Nonlinear Model Predictive
Control (RL-RNMPC) framework for controlling nonlinear systems in the presence
of disturbances and uncertainties. An approximate Robust Nonlinear Model
Predictive Control (RNMPC) of low computational complexity is used in which the
state trajectory uncertainty is modelled via ellipsoids. Reinforcement Learning
is then used in order to handle the ellipsoidal approximation and improve the
closed-loop performance of the scheme by adjusting the MPC parameters
generating the ellipsoids. The approach is tested on a simulated Wheeled Mobile
Robot (WMR) tracking a desired trajectory while avoiding static obstacles.
- Abstract(参考訳): 本稿では、障害や不確実性の存在下で非線形システムを制御するための強化学習に基づくロバスト非線形モデル予測制御(RL-RNMPC)フレームワークを提案する。
低計算複雑性の近似ロバスト非線形モデル予測制御(RNMPC)は、状態軌跡の不確かさが楕円体を介してモデル化される。
強化学習は楕円体近似の処理に用いられ、楕円体を生成するMPCパラメータを調整することにより、スキームの閉ループ性能を向上させる。
この手法は、静的障害物を避けながら、所望の軌道を追跡するシミュレーションされた車輪付き移動ロボット(WMR)でテストされる。
関連論文リスト
- Efficient model predictive control for nonlinear systems modelled by deep neural networks [6.5268245109828005]
本稿では、非線形性と不確実性が深層ニューラルネットワーク(NN)によってモデル化された動的システムのためのモデル予測制御(MPC)を提案する。
NN出力はシステム状態と制御入力の高次複素非線形性を含むため、MPC問題は非線形であり、リアルタイム制御では解決が難しい。
論文 参考訳(メタデータ) (2024-05-16T18:05:18Z) - Parameter-Adaptive Approximate MPC: Tuning Neural-Network Controllers without Retraining [50.00291020618743]
この研究は、大規模なデータセットを再計算し、再トレーニングすることなくオンラインチューニングが可能な、新しいパラメータ適応型AMPCアーキテクチャを導入している。
資源制約の厳しいマイクロコントローラ(MCU)を用いた2種類の実カートポールシステムの揺らぎを制御し,パラメータ適応型AMPCの有効性を示す。
これらの貢献は、現実世界のシステムにおけるAMPCの実践的応用に向けた重要な一歩である。
論文 参考訳(メタデータ) (2024-04-08T20:02:19Z) - Data-driven Nonlinear Model Reduction using Koopman Theory: Integrated
Control Form and NMPC Case Study [56.283944756315066]
そこで本研究では,遅延座標符号化と全状態復号化を組み合わせた汎用モデル構造を提案し,Koopmanモデリングと状態推定を統合した。
ケーススタディでは,本手法が正確な制御モデルを提供し,高純度極低温蒸留塔のリアルタイム非線形予測制御を可能にすることを実証している。
論文 参考訳(メタデータ) (2024-01-09T11:54:54Z) - Multirotor Ensemble Model Predictive Control I: Simulation Experiments [0.0]
アンサンブル表現されたガウス過程は、初期時間の最適利得を決定するために後方計算を行う。
端末制御と制御問題のためのEMPCを構築し、シミュレーション・同一双対研究の制御に適用する。
論文 参考訳(メタデータ) (2023-05-22T01:32:17Z) - Learning Over Contracting and Lipschitz Closed-Loops for
Partially-Observed Nonlinear Systems (Extended Version) [1.2430809884830318]
本稿では非線形な部分観測力学系に対する学習に基づく制御のためのポリシーパラメータ化を提案する。
結果のYoula-RENパラメータ化は自動的に安定性(収縮)とユーザチューニング可能な堅牢性(Lipschitz)を満足することを示した。
We found that the Youla-REN are also like to existing learning-based and optimal control method, also ensure stability and exhibiting improve robustness to adversarial disturbances。
論文 参考訳(メタデータ) (2023-04-12T23:55:56Z) - Deep Learning Explicit Differentiable Predictive Control Laws for
Buildings [1.4121977037543585]
未知の非線形システムに対する制約付き制御法を学習するための微分予測制御(DPC)手法を提案する。
DPCは、明示的非線形モデル予測制御(MPC)から生じるマルチパラメトリックプログラミング問題に対する近似解を提供する
論文 参考訳(メタデータ) (2021-07-25T16:47:57Z) - Concurrent Learning Based Tracking Control of Nonlinear Systems using
Gaussian Process [2.7930955543692817]
本稿では,パラメータ推定ツールとしての並列学習と,オンライン外乱学習における非パラメトリックガウス過程の適用性を示す。
制御法則は、フィードバック線形化の文脈において、両方の手法を逐次的に用いて開発される。
n階系の閉ループ系安定性はリャプノフ安定性定理を用いて証明される。
論文 参考訳(メタデータ) (2021-06-02T02:59:48Z) - Gaussian Process-based Min-norm Stabilizing Controller for
Control-Affine Systems with Uncertain Input Effects and Dynamics [90.81186513537777]
本稿では,この問題の制御・アフィン特性を捉えた新しい化合物カーネルを提案する。
この結果の最適化問題は凸であることを示し、ガウス過程に基づく制御リャプノフ関数第二次コーンプログラム(GP-CLF-SOCP)と呼ぶ。
論文 参考訳(メタデータ) (2020-11-14T01:27:32Z) - Reinforcement Learning for Low-Thrust Trajectory Design of
Interplanetary Missions [77.34726150561087]
本稿では, 惑星間軌道のロバスト設計における強化学習の適用について検討する。
最先端アルゴリズムのオープンソース実装が採用されている。
その結果得られた誘導制御ネットワークは、堅牢な名目的軌道と関連する閉ループ誘導法の両方を提供する。
論文 参考訳(メタデータ) (2020-08-19T15:22:15Z) - Reinforcement Learning for Safety-Critical Control under Model
Uncertainty, using Control Lyapunov Functions and Control Barrier Functions [96.63967125746747]
強化学習フレームワークは、CBFおよびCLF制約に存在するモデル不確実性を学ぶ。
RL-CBF-CLF-QPは、安全制約におけるモデル不確実性の問題に対処する。
論文 参考訳(メタデータ) (2020-04-16T10:51:33Z) - Adaptive Control and Regret Minimization in Linear Quadratic Gaussian
(LQG) Setting [91.43582419264763]
我々は不確実性に直面した楽観主義の原理に基づく新しい強化学習アルゴリズムLqgOptを提案する。
LqgOptはシステムのダイナミクスを効率的に探索し、モデルのパラメータを信頼区間まで推定し、最も楽観的なモデルのコントローラをデプロイする。
論文 参考訳(メタデータ) (2020-03-12T19:56:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。