論文の概要: Regret Analysis of Online LQR Control via Trajectory Prediction and
Tracking: Extended Version
- arxiv url: http://arxiv.org/abs/2302.10411v1
- Date: Tue, 21 Feb 2023 02:48:57 GMT
- ステータス: 処理完了
- システム内更新日: 2023-02-22 16:31:59.192040
- Title: Regret Analysis of Online LQR Control via Trajectory Prediction and
Tracking: Extended Version
- Title(参考訳): 軌道予測と追跡によるオンラインlqr制御の後悔分析:拡張版
- Authors: Yitian Chen, Timothy L. Molloy, Tyler Summers, Iman Shames
- Abstract要約: 本稿では,オンライン線形二次規制(LQR)制御の新しい手法の提案と解析を行う。
提案手法では,最適軌道の予測に利用可能なコスト行列と,その方向を追従するトラッキングコントローラを用いる。
提案手法は,従来のオンラインLQR法と比較して性能が向上することを示す。
- 参考スコア(独自算出の注目度): 1.6344851071810074
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: In this paper, we propose and analyze a new method for online linear
quadratic regulator (LQR) control with a priori unknown time-varying cost
matrices. The cost matrices are revealed sequentially with the potential for
future values to be previewed over a short window. Our novel method involves
using the available cost matrices to predict the optimal trajectory, and a
tracking controller to drive the system towards it. We adopted the notion of
dynamic regret to measure the performance of this proposed online LQR control
method, with our main result being that the (dynamic) regret of our method is
upper bounded by a constant. Moreover, the regret upper bound decays
exponentially with the preview window length, and is extendable to systems with
disturbances. We show in simulations that our proposed method offers improved
performance compared to other previously proposed online LQR methods.
- Abstract(参考訳): 本稿では,事前未知の時間変動コスト行列を用いたオンライン線形二次レギュレータ(lqr)制御手法を提案し,解析する。
コスト行列は、将来の値が短いウィンドウでプレビューされる可能性と共に順次明らかにされる。
提案手法では,利用可能なコスト行列を用いて最適軌道を予測し,トラッキングコントローラを用いてその方向を追従する。
提案するオンラインlqr制御手法の性能を測定するために動的後悔(dynamic regret)の概念を採用した。
さらに、後悔の上界はプレビューウィンドウの長さで指数関数的に崩壊し、外乱のあるシステムに拡張可能である。
提案手法は従来のオンラインLQR法と比較して性能が向上していることを示す。
関連論文リスト
- Regret Analysis of Policy Optimization over Submanifolds for Linearly
Constrained Online LQG [12.201535821920624]
制御器に与えられた線形制約を持つオンライン線形二次ガウス問題について検討する。
関数列の第1次および第2次情報に対する予測に基づいてオンラインコントローラを提供するオンライン楽観的ニュートン(OONM)を提案する。
論文 参考訳(メタデータ) (2024-03-13T14:06:18Z) - Online Nonsubmodular Minimization with Delayed Costs: From Full
Information to Bandit Feedback [98.7678704343537]
我々は,オンラインおよび近似的オンライン帯域勾配勾配アルゴリズムのいくつかの変種に対する後悔の保証を,特別な構造を持つ非部分モジュラ関数のクラスに焦点をあてる。
我々は,決定の選択と帰属費用の受け取りの遅れが無拘束である場合でも,エージェントの完全な情報と盗賊のフィードバック設定に対する後悔の限界を導出する。
論文 参考訳(メタデータ) (2022-05-15T08:27:12Z) - Stochastic Online Linear Regression: the Forward Algorithm to Replace
Ridge [24.880035784304834]
オンラインリッジ回帰とフォワードアルゴリズムに対して高い確率的後悔境界を導出する。
これにより、オンライン回帰アルゴリズムをより正確に比較し、有界な観測と予測の仮定を排除できる。
論文 参考訳(メタデータ) (2021-11-02T13:57:53Z) - Finite-time System Identification and Adaptive Control in Autoregressive
Exogenous Systems [79.67879934935661]
未知のARXシステムのシステム識別と適応制御の問題について検討する。
我々は,オープンループとクローズループの両方のデータ収集の下で,ARXシステムに対する有限時間学習保証を提供する。
論文 参考訳(メタデータ) (2021-08-26T18:00:00Z) - Regret-optimal Estimation and Control [52.28457815067461]
後悔最適推定器と後悔最適制御器は状態空間形式で導出可能であることを示す。
非線形力学系に対するモデル予測制御(MPC)と拡張KalmanFilter(EKF)の残差最適類似性を提案する。
論文 参考訳(メタデータ) (2021-06-22T23:14:21Z) - Regret Analysis of Distributed Online LQR Control for Unknown LTI
Systems [8.832969171530056]
線形時間不変(LTI)系に対する分散オンライン線形2次レギュレータ(LQR)問題について研究する。
本稿では,各エージェントが探索段階でシステム推定を計算するオンラインlqrアルゴリズムの分散型を提案する。
我々は,提案アルゴリズムが$tildeO(T2/3)$をスケールしていることを証明する。
論文 参考訳(メタデータ) (2021-05-15T23:02:58Z) - Adaptive Control and Regret Minimization in Linear Quadratic Gaussian
(LQG) Setting [91.43582419264763]
我々は不確実性に直面した楽観主義の原理に基づく新しい強化学習アルゴリズムLqgOptを提案する。
LqgOptはシステムのダイナミクスを効率的に探索し、モデルのパラメータを信頼区間まで推定し、最も楽観的なモデルのコントローラをデプロイする。
論文 参考訳(メタデータ) (2020-03-12T19:56:38Z) - Logarithmic Regret for Adversarial Online Control [56.12283443161479]
対数的後悔を伴う最初のアルゴリズムを任意対数外乱列に対して与える。
我々のアルゴリズムと分析はオフライン制御法の特徴を利用してオンライン制御問題を(遅延)オンライン学習に還元する。
論文 参考訳(メタデータ) (2020-02-29T06:29:19Z) - Regret Minimization in Partially Observable Linear Quadratic Control [91.43582419264763]
モデル力学が未知の先行性を持つ場合、部分的に観測可能な線形二次制御系における後悔の問題を考察する。
本稿では, 部分的に観測可能な線形二次制御のために, 後悔を分解し, 終端から終端までの後悔の上限を与える新しい方法を提案する。
論文 参考訳(メタデータ) (2020-01-31T22:35:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。