論文の概要: Bayesian Algorithms Learn to Stabilize Unknown Continuous-Time Systems
- arxiv url: http://arxiv.org/abs/2112.15094v1
- Date: Thu, 30 Dec 2021 15:31:35 GMT
- ステータス: 処理完了
- システム内更新日: 2022-01-03 13:48:54.158169
- Title: Bayesian Algorithms Learn to Stabilize Unknown Continuous-Time Systems
- Title(参考訳): ベイズアルゴリズムは未知の連続時間システムの安定化を学ぶ
- Authors: Mohamad Kazem Shirani Faradonbeh, Mohamad Sadegh Shirani Faradonbeh
- Abstract要約: 線形力学系は、不確実な力学を持つ植物の学習に基づく制御のための標準モデルである。
この目的のための信頼性の高い安定化手順は、不安定なデータから有効に学習し、有限時間でシステムを安定化させることができない。
本研究では,未知の連続時間線形系を安定化する新しい学習アルゴリズムを提案する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Linear dynamical systems are canonical models for learning-based control of
plants with uncertain dynamics. The setting consists of a stochastic
differential equation that captures the state evolution of the plant
understudy, while the true dynamics matrices are unknown and need to be learned
from the observed data of state trajectory. An important issue is to ensure
that the system is stabilized and destabilizing control actions due to model
uncertainties are precluded as soon as possible. A reliable stabilization
procedure for this purpose that can effectively learn from unstable data to
stabilize the system in a finite time is not currently available. In this work,
we propose a novel Bayesian learning algorithm that stabilizes unknown
continuous-time stochastic linear systems. The presented algorithm is flexible
and exposes effective stabilization performance after a remarkably short time
period of interacting with the system.
- Abstract(参考訳): 線形力学系は、不確定なダイナミクスを持つ植物の学習に基づく制御のための標準モデルである。
この設定は、植物下層の状態進化を捉える確率微分方程式から成り、真の動力学行列は未知であり、観測された状態軌道のデータから学ぶ必要がある。
重要な問題は、モデルの不確実性による制御動作の安定化と不安定化をできるだけ早く防ぐことである。
この目的のための信頼性の高い安定化手順は、不安定なデータから有効に学習し、有限時間でシステムを安定化させることができない。
本研究では,未知の連続時間確率線形系を安定化するベイズ学習アルゴリズムを提案する。
提案アルゴリズムはフレキシブルで、システムとの相互作用が著しく短い後、効果的な安定化性能を公開する。
関連論文リスト
- Stochastic Reinforcement Learning with Stability Guarantees for Control of Unknown Nonlinear Systems [6.571209126567701]
本稿では,力学の局所線形表現を学習することでシステムを安定化する強化学習アルゴリズムを提案する。
本稿では,いくつかの高次元力学系におけるアルゴリズムの有効性を示す。
論文 参考訳(メタデータ) (2024-09-12T20:07:54Z) - Learning to Boost the Performance of Stable Nonlinear Systems [0.0]
クローズドループ安定性保証による性能ブースティング問題に対処する。
本手法は,安定な非線形システムのための性能ブースティング制御器のニューラルネットワーククラスを任意に学習することを可能にする。
論文 参考訳(メタデータ) (2024-05-01T21:11:29Z) - Stability-Certified Learning of Control Systems with Quadratic
Nonlinearities [9.599029891108229]
この研究は、主に低次元の力学モデルを構築することを目的とした演算子推論手法に焦点を当てている。
本研究の目的は,本質的な安定性を保証する2次制御力学系の推論を容易にする手法を開発することである。
論文 参考訳(メタデータ) (2024-03-01T16:26:47Z) - KCRL: Krasovskii-Constrained Reinforcement Learning with Guaranteed
Stability in Nonlinear Dynamical Systems [66.9461097311667]
形式的安定性を保証するモデルに基づく強化学習フレームワークを提案する。
提案手法は,特徴表現を用いて信頼区間までシステムダイナミクスを学習する。
我々は、KCRLが、基礎となる未知のシステムとの有限数の相互作用において安定化ポリシーを学ぶことが保証されていることを示す。
論文 参考訳(メタデータ) (2022-06-03T17:27:04Z) - Joint Learning-Based Stabilization of Multiple Unknown Linear Systems [3.453777970395065]
そこで本研究では,すべてのシステムにおける安定化ポリシーを高速に学習するための,共同学習に基づく安定化アルゴリズムを提案する。
提案手法は, 極めて短時間で力学系のファミリーを安定化させるなど, 顕著に有効であることが示されている。
論文 参考訳(メタデータ) (2022-01-01T15:30:44Z) - Probabilistic robust linear quadratic regulators with Gaussian processes [73.0364959221845]
ガウス過程(GP)のような確率モデルは、制御設計に続く使用のためのデータから未知の動的システムを学ぶための強力なツールです。
本稿では、確率的安定性マージンに関して堅牢なコントローラを生成する線形化GPダイナミクスのための新しいコントローラ合成について述べる。
論文 参考訳(メタデータ) (2021-05-17T08:36:18Z) - Stability and Identification of Random Asynchronous Linear
Time-Invariant Systems [81.02274958043883]
線形力学系の安定性に対するランダム化と非同期化の付加的な利点を示す。
未知のランダム化LTIシステムに対して,基礎となる力学を復元するための系統的同定手法を提案する。
論文 参考訳(メタデータ) (2020-12-08T02:00:04Z) - Training Generative Adversarial Networks by Solving Ordinary
Differential Equations [54.23691425062034]
GANトレーニングによって引き起こされる連続時間ダイナミクスについて検討する。
この観点から、GANのトレーニングにおける不安定性は積分誤差から生じると仮定する。
本研究では,有名なODEソルバ(Runge-Kutta など)がトレーニングを安定化できるかどうかを実験的に検証する。
論文 参考訳(メタデータ) (2020-10-28T15:23:49Z) - Robust Model-Free Learning and Control without Prior Knowledge [1.14219428942199]
本稿では,未知の離散時間線形系を頑健に学習し,安定化するモデルフリー制御アルゴリズムを提案する。
コントローラはシステムダイナミクス、障害、ノイズに関する事前の知識を必要としない。
一般化と簡易性にもかかわらず、制御器はクローズドループ性能がよいことを示すシミュレーション結果で結論を下す。
論文 参考訳(メタデータ) (2020-10-01T05:43:33Z) - Reinforcement Learning with Fast Stabilization in Linear Dynamical
Systems [91.43582419264763]
未知の安定化線形力学系におけるモデルベース強化学習(RL)について検討する。
本研究では,環境を効果的に探索することで,基盤システムの高速安定化を証明できるアルゴリズムを提案する。
提案アルゴリズムはエージェント環境相互作用の時間ステップで$tildemathcalO(sqrtT)$ regretを達成した。
論文 参考訳(メタデータ) (2020-07-23T23:06:40Z) - Learning Stabilizing Controllers for Unstable Linear Quadratic
Regulators from a Single Trajectory [85.29718245299341]
線形2次制御器(LQR)としても知られる2次コストモデルの下で線形制御器を研究する。
楕円形不確実性集合内の全ての系を安定化させる制御器を構成する2つの異なる半定値プログラム(SDP)を提案する。
高い確率で安定化コントローラを迅速に識別できる効率的なデータ依存アルゴリズムであるtextsceXplorationを提案する。
論文 参考訳(メタデータ) (2020-06-19T08:58:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。