論文の概要: Model-Free Predictive Control: Introductory Algebraic Calculations, and a Comparison with HEOL and ANNs
- arxiv url: http://arxiv.org/abs/2502.00443v1
- Date: Sat, 01 Feb 2025 14:23:34 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-02-05 14:56:16.428865
- Title: Model-Free Predictive Control: Introductory Algebraic Calculations, and a Comparison with HEOL and ANNs
- Title(参考訳): モデルフリー予測制御:導入代数計算とHEOLとANNとの比較
- Authors: Cédric Join, Emmanuel Delaleau, Michel Fliess,
- Abstract要約: モデルフリー予測制御は、定数係数の線形微分方程式によって、ここで再構成される。
これは、ハミルトン・ヤコビ・ベルマン方程式である動的プログラミングとポントリャーギンの最大原理を置き換えるものである。
最近のANNアーキテクチャによる2つのタンクシステムの識別は、完全なモデリングとそれに対応する機械学習メカニズムが、制御においても、より一般的にも、AIにおいても必ずしも必要ではないことを示しているかもしれない。
- 参考スコア(独自算出の注目度): 0.1474723404975345
- License:
- Abstract: Model predictive control (MPC) is a popular control engineering practice, but requires a sound knowledge of the model. Model-free predictive control (MFPC), a burning issue today, also related to reinforcement learning (RL) in AI, is reformulated here via a linear differential equation with constant coefficients, thanks to a new perspective on optimal control combined with recent advances in the field of model-free control. It is replacing Dynamic Programming, the Hamilton-Jacobi-Bellman equation, and Pontryagin's Maximum Principle. The computing burden is low. The implementation is straightforward. Two nonlinear examples, a chemical reactor and a two tank system, are illustrating our approach. A comparison with the HEOL setting, where some expertise of the process model is needed, shows only a slight superiority of the later. A recent identification of the two tank system via a complex ANN architecture might indicate that a full modeling and the corresponding machine learning mechanism are not always necessary neither in control, nor, more generally, in AI.
- Abstract(参考訳): モデル予測制御(MPC)は、一般的な制御工学のプラクティスであるが、モデルに関する健全な知識が必要である。
モデルフリー予測制御(MFPC)は現在、AIの強化学習(RL)にも関係している燃える問題であるが、モデルフリー制御の分野における最近の進歩と相まって、最適制御に関する新たな視点により、定数係数を持つ線形微分方程式によってここで再検討されている。
これは、ハミルトン・ヤコビ・ベルマン方程式である動的プログラミングとポントリャーギンの最大原理を置き換えるものである。
計算負担は低い。
実装は簡単です。
化学反応器と2つのタンクシステムの2つの非線形例は、我々のアプローチを例示している。
プロセスモデルに関するいくつかの専門知識が必要なHEOL設定との比較では、後述の若干の優位性しか示されていない。
最近のANNアーキテクチャによる2つのタンクシステムの識別は、完全なモデリングとそれに対応する機械学習メカニズムが、制御においても、より一般的にも、AIにおいても必ずしも必要ではないことを示しているかもしれない。
関連論文リスト
- Data-driven Nonlinear Model Reduction using Koopman Theory: Integrated
Control Form and NMPC Case Study [56.283944756315066]
そこで本研究では,遅延座標符号化と全状態復号化を組み合わせた汎用モデル構造を提案し,Koopmanモデリングと状態推定を統合した。
ケーススタディでは,本手法が正確な制御モデルを提供し,高純度極低温蒸留塔のリアルタイム非線形予測制御を可能にすることを実証している。
論文 参考訳(メタデータ) (2024-01-09T11:54:54Z) - AI Enhanced Control Engineering Methods [66.08455276899578]
我々は、AIツールがアプリケーションを制御するのにどのように役立つかを探求する。
直近の2つの応用は、局所安定性解析やカルマンフィルタを用いた状態推定のための系力学の線形化である。
さらに、モデル予測制御アプリケーションにおける状態ベクトルのグローバルパラメータ化と制御入力に対する機械学習モデルの利用について検討する。
論文 参考訳(メタデータ) (2023-06-08T20:31:14Z) - Sample-efficient Model-based Reinforcement Learning for Quantum Control [0.2999888908665658]
ノイズの多い時間依存ゲート最適化のためのモデルベース強化学習(RL)手法を提案する。
標準モデルフリーRLに比べて,本手法のサンプル複雑性において,桁違いの優位性を示す。
提案アルゴリズムは,部分的特徴付き1量子ビット系と2量子ビット系の制御に適している。
論文 参考訳(メタデータ) (2023-04-19T15:05:19Z) - Learning Residual Model of Model Predictive Control via Random Forests
for Autonomous Driving [13.865293598486492]
自律運転における予測制御(MPC)の大きな問題は、システムモデルの予測と計算の矛盾である。
本稿では、MPC追跡精度をプログラム(QP)問題最適化として再構成し、プログラム(QP)が効果的に解けるようにする。
論文 参考訳(メタデータ) (2023-04-10T03:32:09Z) - Predictable MDP Abstraction for Unsupervised Model-Based RL [93.91375268580806]
予測可能なMDP抽象化(PMA)を提案する。
元のMDPで予測モデルを訓練する代わりに、学習されたアクション空間を持つ変換MDPでモデルを訓練する。
我々はPMAを理論的に解析し、PMAが以前の教師なしモデルベースRLアプローチよりも大幅に改善することを示す。
論文 参考訳(メタデータ) (2023-02-08T07:37:51Z) - Oracle Inequalities for Model Selection in Offline Reinforcement
Learning [105.74139523696284]
本稿では,値関数近似を用いたオフラインRLにおけるモデル選択の問題について検討する。
対数係数まで最小値の速度-最適不等式を実現するオフラインRLの最初のモデル選択アルゴリズムを提案する。
そこで本研究では,優れたモデルクラスを確実に選択できることを示す数値シミュレーションを行った。
論文 参考訳(メタデータ) (2022-11-03T17:32:34Z) - Comparative analysis of machine learning methods for active flow control [60.53767050487434]
遺伝的プログラミング(GP)と強化学習(RL)はフロー制御において人気を集めている。
この研究は2つの比較分析を行い、地球規模の最適化手法に対して最も代表的なアルゴリズムのいくつかをベンチマークする。
論文 参考訳(メタデータ) (2022-02-23T18:11:19Z) - Physics-informed linear regression is a competitive approach compared to
Machine Learning methods in building MPC [0.8135412538980287]
総じて, ビルのベースラインコントローラと比較して, 暖房・冷却エネルギーの低減効果が良好であることが示唆された。
また, 物理インフォームドARMAXモデルは, 計算負担が低く, 機械学習モデルと比較して, サンプル効率が優れていることも確認した。
論文 参考訳(メタデータ) (2021-10-29T16:56:05Z) - Bellman: A Toolbox for Model-Based Reinforcement Learning in TensorFlow [14.422129911404472]
Bellmanはこのギャップを埋めることを目指しており、モデルベースのRLツールボックスを初めて完全に設計し、テストした。
我々のモジュラーアプローチは、幅広い環境モデルと、最先端アルゴリズムを復元する汎用モデルベースのエージェントクラスを組み合わせることができる。
論文 参考訳(メタデータ) (2021-03-26T11:32:27Z) - Information Theoretic Model Predictive Q-Learning [64.74041985237105]
本稿では,情報理論的MPCとエントロピー正規化RLとの新たな理論的関連性を示す。
バイアスモデルを利用したQ-ラーニングアルゴリズムを開発した。
論文 参考訳(メタデータ) (2019-12-31T00:29:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。