論文の概要: On the improvement of model-predictive controllers
- arxiv url: http://arxiv.org/abs/2308.15157v1
- Date: Tue, 29 Aug 2023 09:39:12 GMT
- ステータス: 処理完了
- システム内更新日: 2023-08-30 14:47:32.937380
- Title: On the improvement of model-predictive controllers
- Title(参考訳): モデル予測制御器の改良について
- Authors: L. F\'eret, A. Gepperth, S. Lambeck
- Abstract要約: 本稿では,合成モデル予測制御(MPC)問題について考察する。
内部予測モデル(PM)の精度が向上すると,制御系全体の精度が向上することを示す。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This article investigates synthetic model-predictive control (MPC) problems
to demonstrate that an increased precision of the internal prediction model
(PM) automatially entails an improvement of the controller as a whole. In
contrast to reinforcement learning (RL), MPC uses the PM to predict subsequent
states of the controlled system (CS), instead of directly recommending suitable
actions. To assess how the precision of the PM translates into the quality of
the model-predictive controller, we compare a DNN-based PM to the optimal
baseline PM for three well-known control problems of varying complexity. The
baseline PM achieves perfect accuracy by accessing the simulation of the CS
itself. Based on the obtained results, we argue that an improvement of the PM
will always improve the controller as a whole, without considering the impact
of other components such as action selection (which, in this article, relies on
evolutionary optimization).
- Abstract(参考訳): 本稿では,mpc(synthetic model-predictive control)問題を調査し,内部予測モデル(pm)の精度の向上がコントローラ全体の改善を自動的に伴っていることを示す。
強化学習(RL)とは対照的に、MPCはPMを用いて制御システムのその後の状態を予測する。
モデル予測制御器の品質にpmの精度がどのように変換されるかを評価するため、dnnベースのpmと最適なベースラインpmを比較し、複雑さの異なる3つのよく知られた制御問題と比較する。
ベースラインPMはCS自体のシミュレーションにアクセスして完全精度を達成する。
得られた結果に基づき、pmの改善は、アクション選択などの他のコンポーネントの影響を考慮せずに、コントローラ全体を常に改善する(この記事では、進化的最適化に依存している)。
関連論文リスト
- Parameter-Adaptive Approximate MPC: Tuning Neural-Network Controllers without Retraining [50.00291020618743]
この研究は、大規模なデータセットを再計算し、再トレーニングすることなくオンラインチューニングが可能な、新しいパラメータ適応型AMPCアーキテクチャを導入している。
資源制約の厳しいマイクロコントローラ(MCU)を用いた2種類の実カートポールシステムの揺らぎを制御し,パラメータ適応型AMPCの有効性を示す。
これらの貢献は、現実世界のシステムにおけるAMPCの実践的応用に向けた重要な一歩である。
論文 参考訳(メタデータ) (2024-04-08T20:02:19Z) - MPC-Inspired Reinforcement Learning for Verifiable Model-Free Control [5.9867297878688195]
モデル予測制御(MPC)からインスピレーションを得た新しいパラメータ化コントローラを導入する。
コントローラは線形MPC問題の擬似プログラミング(QP)解法に似ており、コントローラのパラメータはDeep Reinforcement Learning(DRL)を介して訓練される。
提案したコントローラは, MPCに比べて計算効率が優れ, コントローラよりも学習するパラメータが少ない。
論文 参考訳(メタデータ) (2023-12-08T19:33:22Z) - Predictable MDP Abstraction for Unsupervised Model-Based RL [93.91375268580806]
予測可能なMDP抽象化(PMA)を提案する。
元のMDPで予測モデルを訓練する代わりに、学習されたアクション空間を持つ変換MDPでモデルを訓練する。
我々はPMAを理論的に解析し、PMAが以前の教師なしモデルベースRLアプローチよりも大幅に改善することを示す。
論文 参考訳(メタデータ) (2023-02-08T07:37:51Z) - Improving the Performance of Robust Control through Event-Triggered
Learning [74.57758188038375]
LQR問題における不確実性に直面していつ学習するかを決定するイベントトリガー学習アルゴリズムを提案する。
本研究では,ロバストな制御器ベースライン上での性能向上を数値例で示す。
論文 参考訳(メタデータ) (2022-07-28T17:36:37Z) - On Controller Tuning with Time-Varying Bayesian Optimization [74.57758188038375]
制御対象とその変更に関する適切な事前知識を用いて、時間変化最適化(TVBO)を用いて、変更環境におけるコントローラのオンラインチューニングを行う。
本研究では,不確実性注入(UI)を用いたTVBO戦略を提案する。
我々のモデルはTVBOの最先端手法よりも優れており、後悔の軽減と不安定なパラメータ構成の低減を実現している。
論文 参考訳(メタデータ) (2022-07-22T14:54:13Z) - Policy Search for Model Predictive Control with Application to Agile
Drone Flight [56.24908013905407]
MPCのためのポリシ・フォー・モデル・予測制御フレームワークを提案する。
具体的には、パラメータ化コントローラとしてMPCを定式化し、パラメータ化の難しい決定変数を高レベルポリシーとして表現する。
シミュレーションと実環境の両方において,我々の制御器が堅牢かつリアルタイムに制御性能を発揮することを示す実験を行った。
論文 参考訳(メタデータ) (2021-12-07T17:39:24Z) - Optimization of the Model Predictive Control Meta-Parameters Through
Reinforcement Learning [1.4069478981641936]
強化学習(RL)を用いて制御アルゴリズムの任意のパラメータを協調的に調整できる新しいフレームワークを提案する。
我々は,倒立振子制御タスクの枠組みを実証し,制御システムの総時間を36%削減するとともに,最高性能のMPCベースラインよりも18.4%向上した。
論文 参考訳(メタデータ) (2021-11-07T18:33:22Z) - An Artificial Neural Network-Based Model Predictive Control for
Three-phase Flying Capacitor Multi-Level Inverter [2.3513645401551333]
モデル予測制御(MPC)は、単純な概念、高速な動的応答、優れた参照追跡のため、パワーエレクトロニクスで広く使われている。
最適なスイッチング状態を予測するためにシステムの数学的モデルに依存するため、パラメトリックな不確実性に悩まされる。
本稿では,ニューラルネットワーク(ANN)に基づくモデルフリー制御戦略を提案する。
論文 参考訳(メタデータ) (2021-10-15T13:54:08Z) - Gaussian Process-based Min-norm Stabilizing Controller for
Control-Affine Systems with Uncertain Input Effects and Dynamics [90.81186513537777]
本稿では,この問題の制御・アフィン特性を捉えた新しい化合物カーネルを提案する。
この結果の最適化問題は凸であることを示し、ガウス過程に基づく制御リャプノフ関数第二次コーンプログラム(GP-CLF-SOCP)と呼ぶ。
論文 参考訳(メタデータ) (2020-11-14T01:27:32Z) - Heteroscedastic Bayesian Optimisation for Stochastic Model Predictive
Control [23.180330602334223]
モデル予測制御(MPC)は、複雑な物理システムの制御を含むアプリケーションで成功している。
制御器の動作のランダム性に起因した余分な課題を提示する,MPC のコンテキストにおける微調整 MPC 手法について検討する。
論文 参考訳(メタデータ) (2020-10-01T05:31:41Z) - Comparison of Model Predictive and Reinforcement Learning Methods for
Fault Tolerant Control [2.524528674141466]
階層的強化学習に基づく離散時間系に対する2つの適応型耐故障制御方式を提案する。
実験により、強化学習に基づく制御器は、故障下のモデル予測制御器、部分的に観測可能なシステムモデル、様々なセンサノイズレベルよりも堅牢に動作することが示されている。
論文 参考訳(メタデータ) (2020-08-10T20:22:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。