論文の概要: Learning to Control Linear Systems can be Hard
- arxiv url: http://arxiv.org/abs/2205.14035v1
- Date: Fri, 27 May 2022 15:07:30 GMT
- ステータス: 処理完了
- システム内更新日: 2022-05-30 14:02:02.136225
- Title: Learning to Control Linear Systems can be Hard
- Title(参考訳): 線形システムを制御するための学習は難しい
- Authors: Anastasios Tsiamis, Ingvar Ziemann, Manfred Morari, Nikolai Matni,
George J. Pappas
- Abstract要約: 線形システムを制御するための学習の統計的困難さについて検討する。
我々は、学習の複雑さが制御可能性指数と最も指数関数的であることを証明した。
- 参考スコア(独自算出の注目度): 19.034920102339573
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In this paper, we study the statistical difficulty of learning to control
linear systems. We focus on two standard benchmarks, the sample complexity of
stabilization, and the regret of the online learning of the Linear Quadratic
Regulator (LQR). Prior results state that the statistical difficulty for both
benchmarks scales polynomially with the system state dimension up to
system-theoretic quantities. However, this does not reveal the whole picture.
By utilizing minimax lower bounds for both benchmarks, we prove that there
exist non-trivial classes of systems for which learning complexity scales
dramatically, i.e. exponentially, with the system dimension. This situation
arises in the case of underactuated systems, i.e. systems with fewer inputs
than states. Such systems are structurally difficult to control and their
system theoretic quantities can scale exponentially with the system dimension
dominating learning complexity. Under some additional structural assumptions
(bounding systems away from uncontrollability), we provide qualitatively
matching upper bounds. We prove that learning complexity can be at most
exponential with the controllability index of the system, that is the degree of
underactuation.
- Abstract(参考訳): 本稿では,線形システムを制御する学習の統計的困難さについて考察する。
2つの標準ベンチマーク、安定化のサンプル複雑性、LQR(Linear Quadratic Regulator)のオンライン学習への後悔に焦点を当てた。
両ベンチマークの統計的難易度はシステム状態の次元からシステム理論量まで多項式的にスケールする。
しかし、これは全体像を明らかにしていない。
両ベンチマークにミニマックス下限を用いることで、学習複雑性が劇的にスケールする、すなわち指数関数的にシステム次元を持つ非自明なシステムのクラスが存在することを証明した。
この状況は、過度なシステム、すなわち、状態よりも入力が少ないシステムで発生する。
このようなシステムは構造的に制御が困難であり、システム理論量は学習複雑性を支配するシステム次元と指数関数的にスケールすることができる。
いくつかの構造的仮定(可制御性から離れた系)の下では、定性的に一致する上界を提供する。
学習の複雑さはシステムの制御可能性指数、すなわち過度な操作の程度で指数関数的であることが証明される。
関連論文リスト
- On the Hardness of Learning to Stabilize Linear Systems [4.962316236417777]
線形時間不変系を安定化させる学習の統計的硬さについて検討する。
非退化ノイズプロセスのおかげで、識別が容易なシステムのクラスを提示する。
この結果は、ロバスト制御のアイデアを用いて、このクラスのシステムのコスタビライザビリティの難しさと結び付ける。
論文 参考訳(メタデータ) (2023-11-18T19:34:56Z) - Finite Sample Identification of Bilinear Dynamical Systems [29.973598501311233]
未知の双線形系を高い確率で所望の精度で推定する方法を示す。
サンプルの複雑性と統計的誤差率は, 軌道長, 系の寸法, 入力サイズで最適である。
論文 参考訳(メタデータ) (2022-08-29T22:34:22Z) - Online Control of Unknown Time-Varying Dynamical Systems [48.75672260851758]
非確率制御モデルにおいて、未知のダイナミクスを持つ時間変化線形系のオンライン制御について検討する。
本研究では,反省行動 (SLS) や反省反応 (Youla) , 線形フィードバック政策 (線形フィードバックポリシー) といった一般的な政策のクラスに関して, 後悔すべき境界について検討する。
論文 参考訳(メタデータ) (2022-02-16T06:57:14Z) - Regret Lower Bounds for Learning Linear Quadratic Gaussian Systems [6.261682379939611]
時間の地平線で等級$sqrtT$のスケーリングを示す、残念な低い境界を導出します。
私たちの境界は制御理論パラメータの役割を正確に捉えており、制御が難しいシステムも制御が難しいことを示すことができます。
論文 参考訳(メタデータ) (2022-01-05T16:19:16Z) - Sparsity in Partially Controllable Linear Systems [56.142264865866636]
本研究では, 部分制御可能な線形力学系について, 基礎となる空間パターンを用いて検討する。
最適制御には無関係な状態変数を特徴付ける。
論文 参考訳(メタデータ) (2021-10-12T16:41:47Z) - Linear Systems can be Hard to Learn [12.834033463883085]
線形システムクラスを統計的に習得するのは、システム次元のサンプル複雑性を持つ。
統計的に線形システムクラスを学習するのは、少なくともシステム次元に比例する最悪のサンプル複雑性を持つ。
論文 参考訳(メタデータ) (2021-04-02T15:58:30Z) - Controlling nonlinear dynamical systems into arbitrary states using
machine learning [77.34726150561087]
機械学習(ML)を活用した,新しい完全データ駆動制御方式を提案する。
最近開発されたMLに基づく複雑なシステムの予測機能により、非線形系は任意の初期状態から来る任意の動的対象状態に留まることが証明された。
必要なデータ量が少なく,柔軟性の高いコントロールスキームを備えることで,工学から医学まで幅広い応用の可能性について簡単に議論する。
論文 参考訳(メタデータ) (2021-02-23T16:58:26Z) - Learning Partially Observed Linear Dynamical Systems from Logarithmic
Number of Samples [4.7464518249313805]
本研究では,1つの試料軌道から部分的に観測された線形力学系を学習する問題について検討する。
その結果, 部分的に観察された線形力学系を学習することで, サンプルの複雑さを著しく向上させることができた。
論文 参考訳(メタデータ) (2020-10-08T14:23:48Z) - Active Learning for Nonlinear System Identification with Guarantees [102.43355665393067]
状態遷移が既知の状態-作用対の特徴埋め込みに線形に依存する非線形力学系のクラスについて検討する。
そこで本稿では, トラジェクティブ・プランニング, トラジェクティブ・トラッキング, システムの再推定という3つのステップを繰り返すことで, この問題を解決するためのアクティブ・ラーニング・アプローチを提案する。
本手法は, 非線形力学系を標準線形回帰の統計速度と同様, パラメトリック速度で推定する。
論文 参考訳(メタデータ) (2020-06-18T04:54:11Z) - Combining Machine Learning with Knowledge-Based Modeling for Scalable
Forecasting and Subgrid-Scale Closure of Large, Complex, Spatiotemporal
Systems [48.7576911714538]
我々は、過去のデータを予測に組み込む上で、機械学習を必須のツールとして活用しようと試みる。
i)並列機械学習予測手法と(ii)ハイブリッド手法の2つの手法を組み合わせて,知識ベースコンポーネントと機械学習ベースコンポーネントからなる複合予測システムを提案する。
i) と (ii) を組み合わせることで、非常に大規模なシステムに優れた性能を与えることができるだけでなく、並列機械学習コンポーネントを訓練するのに必要となる時系列データの長さが、並列化なしで必要なものよりも劇的に少ないことを実証した。
論文 参考訳(メタデータ) (2020-02-10T23:21:50Z) - Learning to Control PDEs with Differentiable Physics [102.36050646250871]
本稿では,ニューラルネットワークが長い時間をかけて複雑な非線形物理系の理解と制御を学べる新しい階層型予測器・相関器手法を提案する。
本手法は,複雑な物理系の理解に成功し,PDEに関わるタスクに対してそれらを制御できることを実証する。
論文 参考訳(メタデータ) (2020-01-21T11:58:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。