論文の概要: Controllability-Constrained Deep Network Models for Enhanced Control of
Dynamical Systems
- arxiv url: http://arxiv.org/abs/2311.06438v1
- Date: Sat, 11 Nov 2023 00:04:26 GMT
- ステータス: 処理完了
- システム内更新日: 2023-11-14 18:32:43.121334
- Title: Controllability-Constrained Deep Network Models for Enhanced Control of
Dynamical Systems
- Title(参考訳): 動的システムの制御強化のための制御可能性制約付きディープネットワークモデル
- Authors: Suruchi Sharma, Volodymyr Makarenko, Gautam Kumar, Stas Tiomkin
- Abstract要約: 力学の知識を持たない力学系の制御は重要かつ困難な課題である。
ディープニューラルネットワーク(DNN)のような現代の機械学習アプローチは、制御入力と対応する状態観測出力から動的モデルの推定を可能にする。
制御性のあるデータから推定されるモデルを明確に拡張する制御理論法を提案する。
- 参考スコア(独自算出の注目度): 4.948174943314265
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Control of a dynamical system without the knowledge of dynamics is an
important and challenging task. Modern machine learning approaches, such as
deep neural networks (DNNs), allow for the estimation of a dynamics model from
control inputs and corresponding state observation outputs. Such data-driven
models are often utilized for the derivation of model-based controllers.
However, in general, there are no guarantees that a model represented by DNNs
will be controllable according to the formal control-theoretical meaning of
controllability, which is crucial for the design of effective controllers. This
often precludes the use of DNN-estimated models in applications, where formal
controllability guarantees are required. In this proof-of-the-concept work, we
propose a control-theoretical method that explicitly enhances models estimated
from data with controllability. That is achieved by augmenting the model
estimation objective with a controllability constraint, which penalizes models
with a low degree of controllability. As a result, the models estimated with
the proposed controllability constraint allow for the derivation of more
efficient controllers, they are interpretable by the control-theoretical
quantities and have a lower long-term prediction error. The proposed method
provides new insights on the connection between the DNN-based estimation of
unknown dynamics and the control-theoretical guarantees of the solution
properties. We demonstrate the superiority of the proposed method in two
standard classical control systems with state observation given by low
resolution high-dimensional images.
- Abstract(参考訳): 力学の知識を持たない力学系の制御は重要かつ困難な課題である。
ディープニューラルネットワーク(DNN)のような現代の機械学習アプローチは、制御入力と対応する状態観測出力から動的モデルの推定を可能にする。
このようなデータ駆動モデルはしばしばモデルベースのコントローラの導出に利用される。
しかし、一般的には、dnnで表されるモデルは、制御可能性の正式な制御理論的な意味に従って制御可能であるという保証はない。
これはしばしば、正式な制御可能性を保証する必要があるアプリケーションにおけるDNN推定モデルの使用を妨げる。
本稿では,制御可能性のあるデータから推定されるモデルを明確に拡張する制御理論手法を提案する。
これは、制御可能性の低いモデルにペナルティを与える制御可能性制約でモデル推定目標を増大させることによって達成される。
その結果, 制御可能性制約により推定されたモデルでは, より効率的な制御器の導出が可能となり, 制御理論量によって解釈可能となり, 長期予測誤差が低くなった。
提案手法は、未知の力学のDNNに基づく推定と解の性質の制御理論的保証との関連性に関する新たな知見を提供する。
低分解能高次元画像による状態観察を行う2つの標準古典制御系において,提案手法が優れていることを示す。
関連論文リスト
- Data-driven Nonlinear Model Reduction using Koopman Theory: Integrated
Control Form and NMPC Case Study [56.283944756315066]
そこで本研究では,遅延座標符号化と全状態復号化を組み合わせた汎用モデル構造を提案し,Koopmanモデリングと状態推定を統合した。
ケーススタディでは,本手法が正確な制御モデルを提供し,高純度極低温蒸留塔のリアルタイム非線形予測制御を可能にすることを実証している。
論文 参考訳(メタデータ) (2024-01-09T11:54:54Z) - End-to-End Reinforcement Learning of Koopman Models for Economic
Nonlinear Model Predictive Control [50.0791489606211]
非線形モデル予測制御((e)NMPC)は、すべての状態空間領域において十分正確なシステムモデルを必要とする。
メカニスティックモデルのためのデータ駆動サロゲートモデルは、(e)NMPCの計算負担を軽減するために使用できる。
In this method for end-to-end reinforcement learning of dynamic surrogate model for optimal performance in (e)NMPC applications。
論文 参考訳(メタデータ) (2023-08-03T10:21:53Z) - Steady-State Error Compensation in Reference Tracking and Disturbance
Rejection Problems for Reinforcement Learning-Based Control [0.9023847175654602]
強化学習(Reinforcement Learning, RL)は、自動制御アプリケーションにおける将来的なトピックである。
アクター批判に基づくRLコントローラのためのイニシアティブアクション状態拡張(IASA)が導入される。
この拡張は専門家の知識を必要とせず、アプローチモデルを無償にしておく。
論文 参考訳(メタデータ) (2022-01-31T16:29:19Z) - Sparsity in Partially Controllable Linear Systems [56.142264865866636]
本研究では, 部分制御可能な線形力学系について, 基礎となる空間パターンを用いて検討する。
最適制御には無関係な状態変数を特徴付ける。
論文 参考訳(メタデータ) (2021-10-12T16:41:47Z) - Stochastic Deep Model Reference Adaptive Control [9.594432031144715]
本稿では,ディープニューラルネットワークを用いたモデル参照適応制御を提案する。
Deep Model Reference Adaptive Controlは、DNNモデルの出力層重みをリアルタイムに適応させるために、リアプノフ法を用いる。
データ駆動型教師付き学習アルゴリズムは、内部層パラメータの更新に使用される。
論文 参考訳(メタデータ) (2021-08-04T14:05:09Z) - Safety Verification of Model Based Reinforcement Learning Controllers [7.407039316561176]
本稿では,モデルベースRLコントローラのリーチブル・セット解析を用いた新しい安全性検証フレームワークを提案する。
提案したフレームワークは、ニューラルネットワークを用いて表現されるモデルとコントローラを効率的に扱うことができる。
論文 参考訳(メタデータ) (2020-10-21T03:35:28Z) - Control as Hybrid Inference [62.997667081978825]
本稿では、反復推論と償却推論のバランスを自然に仲介するCHIの実装について述べる。
連続的な制御ベンチマークでアルゴリズムのスケーラビリティを検証し、強力なモデルフリーおよびモデルベースラインを上回る性能を示す。
論文 参考訳(メタデータ) (2020-07-11T19:44:09Z) - Adaptive Control and Regret Minimization in Linear Quadratic Gaussian
(LQG) Setting [91.43582419264763]
我々は不確実性に直面した楽観主義の原理に基づく新しい強化学習アルゴリズムLqgOptを提案する。
LqgOptはシステムのダイナミクスを効率的に探索し、モデルのパラメータを信頼区間まで推定し、最も楽観的なモデルのコントローラをデプロイする。
論文 参考訳(メタデータ) (2020-03-12T19:56:38Z) - Predictive Coding for Locally-Linear Control [92.35650774524399]
高次元観測と未知のダイナミクスは、多くの実世界の意思決定タスクに最適な制御を適用する際に大きな課題である。
Learning Controllable Embedding (LCE)フレームワークは、観測結果を低次元の潜伏空間に埋め込むことによって、これらの課題に対処する。
理論的には、明示的な次観測予測を予測符号化に置き換えることが可能である。
論文 参考訳(メタデータ) (2020-03-02T18:20:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。