論文の概要: Certainty Equivalent Quadratic Control for Markov Jump Systems
- arxiv url: http://arxiv.org/abs/2105.12358v1
- Date: Wed, 26 May 2021 06:45:47 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-27 13:10:25.227668
- Title: Certainty Equivalent Quadratic Control for Markov Jump Systems
- Title(参考訳): マルコフジャンプ系に対する同値な二次制御
- Authors: Zhe Du, Yahya Sattar, Davoud Ataee Tarzanagh, Laura Balzano, Samet
Oymak and Necmiye Ozay
- Abstract要約: 本稿では,2次コスト関数を持つMJSにおけるモデルベース最適制御のロバスト性について検討する。
我々は、それぞれ $mathcalO(epsilon + eta)$ と $mathcalO((epsilon + eta)2)$ として崩壊する明示的な摂動境界を提供する。
- 参考スコア(独自算出の注目度): 24.744481548320305
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Real-world control applications often involve complex dynamics subject to
abrupt changes or variations. Markov jump linear systems (MJS) provide a rich
framework for modeling such dynamics. Despite an extensive history, theoretical
understanding of parameter sensitivities of MJS control is somewhat lacking.
Motivated by this, we investigate robustness aspects of certainty equivalent
model-based optimal control for MJS with quadratic cost function. Given the
uncertainty in the system matrices and in the Markov transition matrix is
bounded by $\epsilon$ and $\eta$ respectively, robustness results are
established for (i) the solution to coupled Riccati equations and (ii) the
optimal cost, by providing explicit perturbation bounds which decay as
$\mathcal{O}(\epsilon + \eta)$ and $\mathcal{O}((\epsilon + \eta)^2)$
respectively.
- Abstract(参考訳): 現実世界の制御アプリケーションは、しばしば突然の変化や変動を伴う複雑なダイナミクスを伴う。
markov jump linear systems (mjs)は、そのようなダイナミクスをモデリングするためのリッチなフレームワークを提供する。
広範な歴史にもかかわらず、MJS制御のパラメータ感度に関する理論的理解は幾らか欠如している。
そこで本研究では,2次コスト関数を持つMJSのモデルベース最適制御のロバスト性について検討する。
系行列とマルコフ遷移行列における不確実性がそれぞれ$\epsilon$ と $\eta$ で区切られていると仮定すると、(i)結合リッカティ方程式に対する解と(ii)最適コストに対して、それぞれ$\mathcal{o}(\epsilon + \eta)$ と$\mathcal{o}((\epsilon + \eta)^2) で崩壊する明示的な摂動境界を与えることによって、ロバストネスの結果が確立される。
関連論文リスト
- Latent Linear Quadratic Regulator for Robotic Control Tasks [10.09131366605447]
本稿では、状態空間を潜在空間にマッピングする、$textbfla$tent $textbfl$inear $textbfq$uadratic $textbfr$egulator (LaLQR)を提案する。
実験では、LaLQRの他のベースラインに比べて効率と一般化が優れていることが示された。
論文 参考訳(メタデータ) (2024-07-15T15:22:52Z) - Improving Sample Efficiency of Model-Free Algorithms for Zero-Sum Markov Games [66.2085181793014]
モデルフリーのステージベースQ-ラーニングアルゴリズムはモデルベースアルゴリズムと同じ$H$依存の最適性を享受できることを示す。
本アルゴリズムは,楽観的値関数と悲観的値関数のペアとして参照値関数を更新するキーとなる新しい設計を特徴とする。
論文 参考訳(メタデータ) (2023-08-17T08:34:58Z) - Formal Controller Synthesis for Markov Jump Linear Systems with
Uncertain Dynamics [64.72260320446158]
マルコフジャンプ線形系に対する制御器の合成法を提案する。
本手法は,MJLSの離散(モードジャンピング)と連続(確率線形)の両方の挙動を捉える有限状態抽象化に基づいている。
本手法を複数の現実的なベンチマーク問題,特に温度制御と航空機の配送問題に適用する。
論文 参考訳(メタデータ) (2022-12-01T17:36:30Z) - Gradient-Free Methods for Deterministic and Stochastic Nonsmooth
Nonconvex Optimization [94.19177623349947]
非滑らかな非最適化問題は、機械学習とビジネス製造に現れる。
2つのコア課題は、有限収束を保証する効率的な方法の開発を妨げる。
GFMとSGFMの2相版も提案され, 改良された大規模評価結果が得られた。
論文 参考訳(メタデータ) (2022-09-12T06:53:24Z) - Identification and Adaptive Control of Markov Jump Systems: Sample
Complexity and Regret Bounds [24.74448154832031]
本稿では,未知のマルコフジャンプ線形系 (MJS) を2次目的に最適化する問題を考える。
まず,MJSが各モードの力学を学習するためのシステム識別アルゴリズムを提案する。
そこで本研究では,システム識別と等価な制御を併用した適応制御方式を提案する。
論文 参考訳(メタデータ) (2021-11-13T02:38:13Z) - Finite-time System Identification and Adaptive Control in Autoregressive
Exogenous Systems [79.67879934935661]
未知のARXシステムのシステム識別と適応制御の問題について検討する。
我々は,オープンループとクローズループの両方のデータ収集の下で,ARXシステムに対する有限時間学習保証を提供する。
論文 参考訳(メタデータ) (2021-08-26T18:00:00Z) - Robust Online Control with Model Misspecification [96.23493624553998]
本研究では,未知の非線形力学系のモデル不特定性を考慮したオンライン制御について検討する。
本研究は, 線形近似からの偏差を許容できる程度に測定できるロバスト性に着目した。
論文 参考訳(メタデータ) (2021-07-16T07:04:35Z) - A conditional one-output likelihood formulation for multitask Gaussian
processes [0.0]
マルチタスクガウス過程(MTGP)は多出力回帰問題に対するガウスプロセスフレームワークの解である。
本稿では,マルチタスク学習を簡略化する新しい手法を提案する。
現状の美術品と計算的に競合していることが示される。
論文 参考訳(メタデータ) (2020-06-05T14:59:06Z) - Adaptive Control and Regret Minimization in Linear Quadratic Gaussian
(LQG) Setting [91.43582419264763]
我々は不確実性に直面した楽観主義の原理に基づく新しい強化学習アルゴリズムLqgOptを提案する。
LqgOptはシステムのダイナミクスを効率的に探索し、モデルのパラメータを信頼区間まで推定し、最も楽観的なモデルのコントローラをデプロイする。
論文 参考訳(メタデータ) (2020-03-12T19:56:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。