論文の概要: Towards a Dimension-Free Understanding of Adaptive Linear Control
- arxiv url: http://arxiv.org/abs/2103.10620v1
- Date: Fri, 19 Mar 2021 03:59:15 GMT
- ステータス: 処理完了
- システム内更新日: 2021-03-22 20:03:09.158951
- Title: Towards a Dimension-Free Understanding of Adaptive Linear Control
- Title(参考訳): 適応線形制御の次元自由理解に向けて
- Authors: Juan C. Perdomo, Max Simchowitz, Alekh Agarwal, Peter Bartlett
- Abstract要約: 我々は、非常に高次元、あるいは無限次元の系の線形二次制御器の適応制御の問題について研究する。
無限次元システムのためのLQRのための最初の後悔の境界を提供します。
- 参考スコア(独自算出の注目度): 49.741419094419946
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We study the problem of adaptive control of the linear quadratic regulator
for systems in very high, or even infinite dimension. We demonstrate that while
sublinear regret requires finite dimensional inputs, the ambient state
dimension of the system need not be bounded in order to perform online control.
We provide the first regret bounds for LQR which hold for infinite dimensional
systems, replacing dependence on ambient dimension with more natural notions of
problem complexity. Our guarantees arise from a novel perturbation bound for
certainty equivalence which scales with the prediction error in estimating the
system parameters, without requiring consistent parameter recovery in more
stringent measures like the operator norm. When specialized to finite
dimensional settings, our bounds recover near optimal dimension and time
horizon dependence.
- Abstract(参考訳): 超高次元あるいは無限次元の系に対する線形二次制御器の適応制御問題について検討する。
サブリニアな後悔は有限次元の入力を必要とするが、オンライン制御を行うためにシステムの環境状態次元は境界化される必要はない。
無限次元系を保ち、周囲次元への依存を問題複雑性のより自然な概念に置き換える LQR に対する最初の後悔境界を提供する。
この保証は、演算子ノルムのようなより厳密な尺度で一貫したパラメータ回復を必要とせず、システムパラメータの推定における予測誤差とスケールする、確実性同値に対する新しい摂動によって生じる。
有限次元の設定に特化すると、境界は最適次元と時間軸依存性に近く回復する。
関連論文リスト
- Stability Bounds for Learning-Based Adaptive Control of Discrete-Time
Multi-Dimensional Stochastic Linear Systems with Input Constraints [3.8004168340068336]
本研究では,有界制御入力制約と非有界障害を有する離散時間多次元システムの適応安定化問題について考察する。
本稿では,オンラインパラメータ推定と飽和線形制御を組み合わせた等価制御手法を提案する。
論文 参考訳(メタデータ) (2023-04-02T16:38:13Z) - Learning-Based Adaptive Control for Stochastic Linear Systems with Input
Constraints [3.8004168340068336]
そこで本研究では,加法的対象であるスカラー線形系の適応制御のための確実な等価性スキームを提案する。
系が極端に安定であると仮定すると、閉ループ系状態の平均二乗有界性は証明される。
論文 参考訳(メタデータ) (2022-09-15T04:49:06Z) - Regret Lower Bounds for Learning Linear Quadratic Gaussian Systems [6.261682379939611]
時間の地平線で等級$sqrtT$のスケーリングを示す、残念な低い境界を導出します。
私たちの境界は制御理論パラメータの役割を正確に捉えており、制御が難しいシステムも制御が難しいことを示すことができます。
論文 参考訳(メタデータ) (2022-01-05T16:19:16Z) - Finite-time System Identification and Adaptive Control in Autoregressive
Exogenous Systems [79.67879934935661]
未知のARXシステムのシステム識別と適応制御の問題について検討する。
我々は,オープンループとクローズループの両方のデータ収集の下で,ARXシステムに対する有限時間学習保証を提供する。
論文 参考訳(メタデータ) (2021-08-26T18:00:00Z) - Robust Online Control with Model Misspecification [96.23493624553998]
本研究では,未知の非線形力学系のモデル不特定性を考慮したオンライン制御について検討する。
本研究は, 線形近似からの偏差を許容できる程度に測定できるロバスト性に着目した。
論文 参考訳(メタデータ) (2021-07-16T07:04:35Z) - Dimension Free Generalization Bounds for Non Linear Metric Learning [61.193693608166114]
我々はスパース体制と非スパース体制という2つの体制に対して一様一般化境界を提供する。
解の異なる新しい性質を頼りにすることで、次元自由一般化保証を提供することができることを示す。
論文 参考訳(メタデータ) (2021-02-07T14:47:00Z) - Regret Bounds for Adaptive Nonlinear Control [14.489004143703825]
条件の不確実性を考慮した適応非線形制御のための最初の有限時間後悔境界を証明した。
モデル外乱の完全な知識を持つオラクルコントローラと比較して,一定の等価適応制御に苦しむ後悔は,期待して$widetildeO(sqrtT)$で上界となることを示す。
論文 参考訳(メタデータ) (2020-11-26T03:01:09Z) - Adaptive Regret for Control of Time-Varying Dynamics [31.319502238224334]
制御の分野に適応的後悔の尺度を導入する。
私たちの主な貢献は、新しい効率的なメタアルゴリズムです。
主要な技術的革新は、メモリを伴うオンライン凸最適化のより一般的なフレームワークに対する最初の適応的後悔のバウンドである。
論文 参考訳(メタデータ) (2020-07-08T19:40:34Z) - Adaptive Control and Regret Minimization in Linear Quadratic Gaussian
(LQG) Setting [91.43582419264763]
我々は不確実性に直面した楽観主義の原理に基づく新しい強化学習アルゴリズムLqgOptを提案する。
LqgOptはシステムのダイナミクスを効率的に探索し、モデルのパラメータを信頼区間まで推定し、最も楽観的なモデルのコントローラをデプロイする。
論文 参考訳(メタデータ) (2020-03-12T19:56:38Z) - Regret Minimization in Partially Observable Linear Quadratic Control [91.43582419264763]
モデル力学が未知の先行性を持つ場合、部分的に観測可能な線形二次制御系における後悔の問題を考察する。
本稿では, 部分的に観測可能な線形二次制御のために, 後悔を分解し, 終端から終端までの後悔の上限を与える新しい方法を提案する。
論文 参考訳(メタデータ) (2020-01-31T22:35:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。