論文の概要: Learning to Stabilize Unknown LTI Systems on a Single Trajectory under Stochastic Noise
- arxiv url: http://arxiv.org/abs/2406.00234v1
- Date: Fri, 31 May 2024 23:38:51 GMT
- ステータス: 処理完了
- システム内更新日: 2024-06-06 08:04:10.327698
- Title: Learning to Stabilize Unknown LTI Systems on a Single Trajectory under Stochastic Noise
- Title(参考訳): 確率雑音下での単一軌道上の未知LTIシステムの安定化学習
- Authors: Ziyi Zhang, Yorie Nakahira, Guannan Qu,
- Abstract要約: 本研究では,未知雑音の線形時間不変系(LTI)を単一軌道上で安定化させる学習の課題について検討する。
安定な部分空間からLTIシステムの不安定な部分空間を分離する新しいアルゴリズムを開発した。
状態ノルムが2O(k log n)$に達する前に系が安定化されることを証明し、k$は不安定部分空間の次元である。
- 参考スコア(独自算出の注目度): 11.679770353558041
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We study the problem of learning to stabilize unknown noisy Linear Time-Invariant (LTI) systems on a single trajectory. It is well known in the literature that the learn-to-stabilize problem suffers from exponential blow-up in which the state norm blows up in the order of $\Theta(2^n)$ where $n$ is the state space dimension. This blow-up is due to the open-loop instability when exploring the $n$-dimensional state space. To address this issue, we develop a novel algorithm that decouples the unstable subspace of the LTI system from the stable subspace, based on which the algorithm only explores and stabilizes the unstable subspace, the dimension of which can be much smaller than $n$. With a new singular-value-decomposition(SVD)-based analytical framework, we prove that the system is stabilized before the state norm reaches $2^{O(k \log n)}$, where $k$ is the dimension of the unstable subspace. Critically, this bound avoids exponential blow-up in state dimension in the order of $\Theta(2^n)$ as in the previous works, and to the best of our knowledge, this is the first paper to avoid exponential blow-up in dimension for stabilizing LTI systems with noise.
- Abstract(参考訳): 本研究では,未知雑音の線形時間不変系(LTI)を単一軌道上で安定化させる学習の課題について検討する。
文献では、学習と安定化の問題は、状態ノルムが$\Theta(2^n)$の順番で爆発する指数的爆発によって生じることが知られている。
この爆発は、$n$次元状態空間を探索する際の開ループ不安定性に起因する。
この問題に対処するために、安定部分空間からLTIシステムの不安定部分空間を分離する新しいアルゴリズムを開発し、そのアルゴリズムは不安定部分空間を探索・安定化するのみであり、その次元は$n$よりもはるかに小さくすることができる。
新しい特異値分解(SVD)に基づく解析フレームワークを用いて、状態ノルムが不安定な部分空間の次元である$k$のとき、状態ノルムが2^{O(k \log n)}$に達する前にシステムは安定であることを示す。
批判的に言えば、この境界は以前の研究と同様に$\Theta(2^n)$の順序で状態次元の指数的爆発を避けることができ、我々の知る限り、LTI系を雑音で安定化させるための指数的爆発を避けるための最初の論文である。
関連論文リスト
- Faster Computation of Stabilizer Extent [3.8061090528695543]
安定度を計算するための高速数値アルゴリズムを提案する。
我々のアルゴリズムは、ランダムな純状態に対する安定化器の忠実度と安定化器の範囲を最大$n=9$ qubitsまで計算することができる。
論文 参考訳(メタデータ) (2024-06-24T14:28:15Z) - Learning with Norm Constrained, Over-parameterized, Two-layer Neural Networks [54.177130905659155]
近年の研究では、再生カーネルヒルベルト空間(RKHS)がニューラルネットワークによる関数のモデル化に適した空間ではないことが示されている。
本稿では,有界ノルムを持つオーバーパラメータ化された2層ニューラルネットワークに適した関数空間について検討する。
論文 参考訳(メタデータ) (2024-04-29T15:04:07Z) - Krylov Cubic Regularized Newton: A Subspace Second-Order Method with
Dimension-Free Convergence Rate [83.3933097134767]
次元に依存しない大域収束率を$Oleft(frac1mk+frac1k2right)$とする,新しい部分空間正規化ニュートン法を導入する。
提案手法は,特に高次元問題に対して,既存のランダム部分空間法よりも高速に収束する。
論文 参考訳(メタデータ) (2024-01-05T20:24:18Z) - From Spectral Theorem to Statistical Independence with Application to
System Identification [11.98319841778396]
状態遷移行列 $|Ak|$ の有限パワーの崩壊率に関する最初の定量的ハンドルを提供する。
安定な力学系が 1 つの異なる固有値と差分しか持たないとき、$n-1$:$|A|$ は $n$ に依存することが示されている。
要素的誤差は、本質的にはよく知られたリトルウッド・オフォード問題の変種であることを示す。
論文 参考訳(メタデータ) (2023-10-16T15:40:43Z) - Learning the Dynamics of Autonomous Linear Systems From Multiple
Trajectories [2.2268031040603447]
自律線形系同定の学習速度と一貫性に関する既存の結果は、1つの長い軌道からの定常状態の挙動の観測に依存している。
定常状態の挙動が容易に観察できない複数の短い軌跡に基づく学習システムダイナミクスのシナリオを考察する。
厳密な安定系の学習速度は$mathcalO(sqrtfraclogNN)$、学習速度は$mathcalO(frac(logN)dsqrとなる。
論文 参考訳(メタデータ) (2022-03-24T01:29:53Z) - Efficient learning of hidden state LTI state space models of unknown
order [0.7614628596146599]
隠れ状態線形時間不変量(LTI)状態空間システムのセットアップに伴う2つの関連する推定問題に対処する。
すなわち、システムのマルコフパラメータの有限数の推定と、システムの最小化の推定である。
どちらの問題に対しても、様々な推定誤差上限、$rank$リカバリ条件、サンプル複雑性推定という形で統計的保証を提供する。
論文 参考訳(メタデータ) (2022-02-03T14:59:13Z) - Robust Online Control with Model Misspecification [96.23493624553998]
本研究では,未知の非線形力学系のモデル不特定性を考慮したオンライン制御について検討する。
本研究は, 線形近似からの偏差を許容できる程度に測定できるロバスト性に着目した。
論文 参考訳(メタデータ) (2021-07-16T07:04:35Z) - Learning Stabilizing Controllers for Unstable Linear Quadratic
Regulators from a Single Trajectory [85.29718245299341]
線形2次制御器(LQR)としても知られる2次コストモデルの下で線形制御器を研究する。
楕円形不確実性集合内の全ての系を安定化させる制御器を構成する2つの異なる半定値プログラム(SDP)を提案する。
高い確率で安定化コントローラを迅速に識別できる効率的なデータ依存アルゴリズムであるtextsceXplorationを提案する。
論文 参考訳(メタデータ) (2020-06-19T08:58:57Z) - Sparse Identification of Nonlinear Dynamical Systems via Reweighted
$\ell_1$-regularized Least Squares [62.997667081978825]
本研究は, 非線形系の制御方程式をノイズ状態測定から復元するための繰り返しスパース規則化回帰法を提案する。
本研究の目的は、状態測定ノイズの存在下での手法の精度とロバスト性を改善することである。
論文 参考訳(メタデータ) (2020-05-27T08:30:15Z) - Naive Exploration is Optimal for Online LQR [49.681825576239355]
最適後悔尺度は$widetildeTheta(sqrtd_mathbfu2 d_mathbfx T)$で、$T$は時間ステップの数、$d_mathbfu$は入力空間の次元、$d_mathbfx$はシステム状態の次元である。
我々の下界は、かつての$mathrmpoly(logT)$-regretアルゴリズムの可能性を排除する。
論文 参考訳(メタデータ) (2020-01-27T03:44:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。