論文の概要: On the Hardness of Learning to Stabilize Linear Systems
- arxiv url: http://arxiv.org/abs/2311.11151v1
- Date: Sat, 18 Nov 2023 19:34:56 GMT
- ステータス: 処理完了
- システム内更新日: 2023-11-22 10:19:32.033330
- Title: On the Hardness of Learning to Stabilize Linear Systems
- Title(参考訳): 線形システムの安定化のための学習の難しさについて
- Authors: Xiong Zeng, Zexiang Liu, Zhe Du, Necmiye Ozay, Mario Sznaier
- Abstract要約: 線形時間不変系を安定化させる学習の統計的硬さについて検討する。
非退化ノイズプロセスのおかげで、識別が容易なシステムのクラスを提示する。
この結果は、ロバスト制御のアイデアを用いて、このクラスのシステムのコスタビライザビリティの難しさと結び付ける。
- 参考スコア(独自算出の注目度): 4.962316236417777
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Inspired by the work of Tsiamis et al. \cite{tsiamis2022learning}, in this
paper we study the statistical hardness of learning to stabilize linear
time-invariant systems. Hardness is measured by the number of samples required
to achieve a learning task with a given probability. The work in
\cite{tsiamis2022learning} shows that there exist system classes that are hard
to learn to stabilize with the core reason being the hardness of
identification. Here we present a class of systems that can be easy to
identify, thanks to a non-degenerate noise process that excites all modes, but
the sample complexity of stabilization still increases exponentially with the
system dimension. We tie this result to the hardness of co-stabilizability for
this class of systems using ideas from robust control.
- Abstract(参考訳): Tsiamisらの作品に触発された。
本稿では,線形時間不変システムを安定化する学習の統計的困難性について検討する。
ハードネスは、与えられた確率で学習タスクを達成するのに必要なサンプル数によって測定される。
cite{tsiamis2022learning}における研究は、識別の難しさを主な理由として、安定化しにくいシステムクラスが存在することを示している。
ここでは,すべてのモードを励起する非退化ノイズ処理により,識別が容易なシステムのクラスを示すが,安定化のサンプル複雑性はシステム次元とともに指数関数的に増加する。
この結果は、ロバスト制御のアイデアを用いて、このクラスのシステムのコスタビライザビリティの難しさと結び付ける。
関連論文リスト
- System stabilization with policy optimization on unstable latent manifolds [0.5261718469769449]
提案手法は,データサンプルの少ない複雑な物理システムを安定化する。
実験により、提案手法はデータサンプルの少ない複雑な物理システムを安定化させることを示した。
論文 参考訳(メタデータ) (2024-07-08T21:57:28Z) - A Domain-Agnostic Approach for Characterization of Lifelong Learning
Systems [128.63953314853327]
「生涯学習」システムには,1)継続的学習,2)伝達と適応,3)拡張性があります。
この一連のメトリクスは、様々な複雑な生涯学習システムの開発に役立てることができることを示す。
論文 参考訳(メタデータ) (2023-01-18T21:58:54Z) - Learning to Control Linear Systems can be Hard [19.034920102339573]
線形システムを制御するための学習の統計的困難さについて検討する。
我々は、学習の複雑さが制御可能性指数と最も指数関数的であることを証明した。
論文 参考訳(メタデータ) (2022-05-27T15:07:30Z) - Joint Learning-Based Stabilization of Multiple Unknown Linear Systems [3.453777970395065]
そこで本研究では,すべてのシステムにおける安定化ポリシーを高速に学習するための,共同学習に基づく安定化アルゴリズムを提案する。
提案手法は, 極めて短時間で力学系のファミリーを安定化させるなど, 顕著に有効であることが示されている。
論文 参考訳(メタデータ) (2022-01-01T15:30:44Z) - Bayesian Algorithms Learn to Stabilize Unknown Continuous-Time Systems [0.0]
線形力学系は、不確実な力学を持つ植物の学習に基づく制御のための標準モデルである。
この目的のための信頼性の高い安定化手順は、不安定なデータから有効に学習し、有限時間でシステムを安定化させることができない。
本研究では,未知の連続時間線形系を安定化する新しい学習アルゴリズムを提案する。
論文 参考訳(メタデータ) (2021-12-30T15:31:35Z) - Adversarially Robust Stability Certificates can be Sample-Efficient [14.658040519472646]
未知の非線形力学系に対する逆向きに頑健な安定性証明について考察する。
敵安定証明書を学習する統計的コストは,定型的安定性証明書を学習するのと同程度であることを示す。
論文 参考訳(メタデータ) (2021-12-20T17:23:31Z) - Contrastive learning of strong-mixing continuous-time stochastic
processes [53.82893653745542]
コントラスト学習(Contrastive Learning)は、ラベルのないデータから構築された分類タスクを解決するためにモデルを訓練する自己指導型の手法のファミリーである。
拡散の場合,小~中距離間隔の遷移カーネルを適切に構築したコントラスト学習タスクを用いて推定できることが示される。
論文 参考訳(メタデータ) (2021-03-03T23:06:47Z) - Training Generative Adversarial Networks by Solving Ordinary
Differential Equations [54.23691425062034]
GANトレーニングによって引き起こされる連続時間ダイナミクスについて検討する。
この観点から、GANのトレーニングにおける不安定性は積分誤差から生じると仮定する。
本研究では,有名なODEソルバ(Runge-Kutta など)がトレーニングを安定化できるかどうかを実験的に検証する。
論文 参考訳(メタデータ) (2020-10-28T15:23:49Z) - Reinforcement Learning with Fast Stabilization in Linear Dynamical
Systems [91.43582419264763]
未知の安定化線形力学系におけるモデルベース強化学習(RL)について検討する。
本研究では,環境を効果的に探索することで,基盤システムの高速安定化を証明できるアルゴリズムを提案する。
提案アルゴリズムはエージェント環境相互作用の時間ステップで$tildemathcalO(sqrtT)$ regretを達成した。
論文 参考訳(メタデータ) (2020-07-23T23:06:40Z) - Active Learning for Nonlinear System Identification with Guarantees [102.43355665393067]
状態遷移が既知の状態-作用対の特徴埋め込みに線形に依存する非線形力学系のクラスについて検討する。
そこで本稿では, トラジェクティブ・プランニング, トラジェクティブ・トラッキング, システムの再推定という3つのステップを繰り返すことで, この問題を解決するためのアクティブ・ラーニング・アプローチを提案する。
本手法は, 非線形力学系を標準線形回帰の統計速度と同様, パラメトリック速度で推定する。
論文 参考訳(メタデータ) (2020-06-18T04:54:11Z) - Learning Stable Deep Dynamics Models [91.90131512825504]
状態空間全体にわたって安定することが保証される力学系を学習するためのアプローチを提案する。
このような学習システムは、単純な力学系をモデル化することができ、複雑な力学を学習するために追加の深層生成モデルと組み合わせることができることを示す。
論文 参考訳(メタデータ) (2020-01-17T00:04:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。