論文の概要: Robust Online Control with Model Misspecification
- arxiv url: http://arxiv.org/abs/2107.07732v1
- Date: Fri, 16 Jul 2021 07:04:35 GMT
- ステータス: 処理完了
- システム内更新日: 2021-07-19 14:30:35.570190
- Title: Robust Online Control with Model Misspecification
- Title(参考訳): モデル誤特定によるロバストオンライン制御
- Authors: Xinyi Chen, Udaya Ghai, Elad Hazan, Alexandre Megretski
- Abstract要約: 本研究では,未知の非線形力学系のモデル不特定性を考慮したオンライン制御について検討する。
本研究は, 線形近似からの偏差を許容できる程度に測定できるロバスト性に着目した。
- 参考スコア(独自算出の注目度): 96.23493624553998
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We study online control of an unknown nonlinear dynamical system that is
approximated by a time-invariant linear system with model misspecification. Our
study focuses on robustness, which measures how much deviation from the assumed
linear approximation can be tolerated while maintaining a bounded $\ell_2$-gain
compared to the optimal control in hindsight. Some models cannot be stabilized
even with perfect knowledge of their coefficients: the robustness is limited by
the minimal distance between the assumed dynamics and the set of unstabilizable
dynamics. Therefore it is necessary to assume a lower bound on this distance.
Under this assumption, and with full observation of the $d$ dimensional state,
we describe an efficient controller that attains $\Omega(\frac{1}{\sqrt{d}})$
robustness together with an $\ell_2$-gain whose dimension dependence is near
optimal. We also give an inefficient algorithm that attains constant robustness
independent of the dimension, with a finite but sub-optimal $\ell_2$-gain.
- Abstract(参考訳): モデル誤特定を伴う時間不変線形系によって近似される未知の非線形力学系のオンライン制御について検討する。
本研究では,仮定線形近似からの逸脱を許容できるロバスト性に着目し,後見の最適制御と比較して有界な$\ell_2$-gainを維持した。
一部のモデルは、係数の完全な知識を持っても安定化できない: ロバスト性は、仮定されたダイナミクスと不安定なダイナミクスの集合の間の最小距離によって制限される。
そのため、この距離で下限を仮定する必要がある。
この仮定の下で、および$d$次元状態の完全な観察により、次元依存がほぼ最適である$\ell_2$-geinとともに$\Omega(\frac{1}{\sqrt{d}})$ロバスト性を達成する効率的なコントローラを記述する。
また, 有限だが準最適の$\ell_2$-geinで, 次元に依存しない一定のロバスト性を実現する非効率アルゴリズムも提供する。
関連論文リスト
- Pseudonorm Approachability and Applications to Regret Minimization [73.54127663296906]
我々は、高次元 $ell_infty$-approachability 問題を、低次元の擬ノルムアプローチ可能性問題に変換する。
我々は、$ell$や他のノルムに対するアプローチ可能性に関する以前の研究に類似した疑似ノルムアプローチ可能性のアルゴリズム理論を開発する。
論文 参考訳(メタデータ) (2023-02-03T03:19:14Z) - Efficient Online Linear Control with Stochastic Convex Costs and Unknown
Dynamics [0.0]
本稿では,最良安定化線形コントローラに対して,最適$sqrtT$後悔率を得る計算効率のよいアルゴリズムを提案する。
これまでの研究とは対照的に,我々のアルゴリズムは顔の不確実性パラダイムにおける最適化に基づいている。
論文 参考訳(メタデータ) (2022-03-02T15:19:20Z) - Regret Bounds for Adaptive Nonlinear Control [14.489004143703825]
条件の不確実性を考慮した適応非線形制御のための最初の有限時間後悔境界を証明した。
モデル外乱の完全な知識を持つオラクルコントローラと比較して,一定の等価適応制御に苦しむ後悔は,期待して$widetildeO(sqrtT)$で上界となることを示す。
論文 参考訳(メタデータ) (2020-11-26T03:01:09Z) - Information Theoretic Regret Bounds for Online Nonlinear Control [35.534829914047336]
未知の非線形力学系における逐次制御の問題について検討する。
この枠組みは、離散的かつ連続的な制御入力と非滑らかで微分不可能な力学を許容する一般的な設定を与える。
実験により, 非線形制御タスクへの応用を実証し, モデル力学の学習における探索の利点を実証する。
論文 参考訳(メタデータ) (2020-06-22T17:46:48Z) - Learning Stabilizing Controllers for Unstable Linear Quadratic
Regulators from a Single Trajectory [85.29718245299341]
線形2次制御器(LQR)としても知られる2次コストモデルの下で線形制御器を研究する。
楕円形不確実性集合内の全ての系を安定化させる制御器を構成する2つの異なる半定値プログラム(SDP)を提案する。
高い確率で安定化コントローラを迅速に識別できる効率的なデータ依存アルゴリズムであるtextsceXplorationを提案する。
論文 参考訳(メタデータ) (2020-06-19T08:58:57Z) - Neural Contraction Metrics for Robust Estimation and Control: A Convex
Optimization Approach [6.646482960350819]
本稿では,ニューラル・コントラクト・メトリック(NCM)の概念を用いて,ロバストな非線形推定と制御のための新しいディープラーニングベースのフレームワークを提案する。
NCMは、最適な収縮距離を大域的に近似するために、ディープロング短期記憶リカレントニューラルネットワークを使用する。
そこで本稿では,NCMを用いた非線形システムの最適推定器と制御器の設計について述べる。
論文 参考訳(メタデータ) (2020-06-08T05:29:38Z) - Sparse Identification of Nonlinear Dynamical Systems via Reweighted
$\ell_1$-regularized Least Squares [62.997667081978825]
本研究は, 非線形系の制御方程式をノイズ状態測定から復元するための繰り返しスパース規則化回帰法を提案する。
本研究の目的は、状態測定ノイズの存在下での手法の精度とロバスト性を改善することである。
論文 参考訳(メタデータ) (2020-05-27T08:30:15Z) - Adaptive Control and Regret Minimization in Linear Quadratic Gaussian
(LQG) Setting [91.43582419264763]
我々は不確実性に直面した楽観主義の原理に基づく新しい強化学習アルゴリズムLqgOptを提案する。
LqgOptはシステムのダイナミクスを効率的に探索し、モデルのパラメータを信頼区間まで推定し、最も楽観的なモデルのコントローラをデプロイする。
論文 参考訳(メタデータ) (2020-03-12T19:56:38Z) - Naive Exploration is Optimal for Online LQR [49.681825576239355]
最適後悔尺度は$widetildeTheta(sqrtd_mathbfu2 d_mathbfx T)$で、$T$は時間ステップの数、$d_mathbfu$は入力空間の次元、$d_mathbfx$はシステム状態の次元である。
我々の下界は、かつての$mathrmpoly(logT)$-regretアルゴリズムの可能性を排除する。
論文 参考訳(メタデータ) (2020-01-27T03:44:54Z) - Optimistic robust linear quadratic dual control [4.94950858749529]
本稿では, 一定の等価性の性能とロバスト性の実用性を両立させようとする二重制御戦略を提案する。
この定式化は、パラメトリック不確実性の表現における構造を保ち、制御タスクにおいて最も重要となるパラメータにおける不確実性の減少をコントローラが目標とすることを可能にする。
論文 参考訳(メタデータ) (2019-12-31T02:02:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。