論文の概要: Joint Learning-Based Stabilization of Multiple Unknown Linear Systems
- arxiv url: http://arxiv.org/abs/2201.01387v1
- Date: Sat, 1 Jan 2022 15:30:44 GMT
- ステータス: 処理完了
- システム内更新日: 2022-01-06 20:39:31.281914
- Title: Joint Learning-Based Stabilization of Multiple Unknown Linear Systems
- Title(参考訳): 連立学習に基づく複数の未知線形システムの安定化
- Authors: Mohamad Kazem Shirani Faradonbeh, Aditya Modi
- Abstract要約: そこで本研究では,すべてのシステムにおける安定化ポリシーを高速に学習するための,共同学習に基づく安定化アルゴリズムを提案する。
提案手法は, 極めて短時間で力学系のファミリーを安定化させるなど, 顕著に有効であることが示されている。
- 参考スコア(独自算出の注目度): 3.453777970395065
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Learning-based control of linear systems received a lot of attentions
recently. In popular settings, the true dynamical models are unknown to the
decision-maker and need to be interactively learned by applying control inputs
to the systems. Unlike the matured literature of efficient reinforcement
learning policies for adaptive control of a single system, results on joint
learning of multiple systems are not currently available. Especially, the
important problem of fast and reliable joint-stabilization remains unaddressed
and so is the focus of this work. We propose a novel joint learning-based
stabilization algorithm for quickly learning stabilizing policies for all
systems understudy, from the data of unstable state trajectories. The presented
procedure is shown to be notably effective such that it stabilizes the family
of dynamical systems in an extremely short time period.
- Abstract(参考訳): 近年,線形システムの学習に基づく制御が注目されている。
一般的な設定では、真の動的モデルは意思決定者に知られておらず、システムへの制御入力を適用することで対話的に学習する必要があります。
単一のシステムの適応制御のための効率的な強化学習方針の成熟した文献とは異なり、複数のシステムの合同学習の結果は、現在得られていない。
特に、高速で信頼性の高い共同安定化の重要な問題は未解決のままであり、この研究の焦点でもある。
不安定な状態軌跡のデータから,全てのシステムの安定化ポリシーを高速に学習するための,共同学習に基づく安定化アルゴリズムを提案する。
提案手法は, 極めて短時間で力学系のファミリーを安定化させるなど, 極めて効果的であることが示されている。
関連論文リスト
- Stochastic Reinforcement Learning with Stability Guarantees for Control of Unknown Nonlinear Systems [6.571209126567701]
本稿では,力学の局所線形表現を学習することでシステムを安定化する強化学習アルゴリズムを提案する。
本稿では,いくつかの高次元力学系におけるアルゴリズムの有効性を示す。
論文 参考訳(メタデータ) (2024-09-12T20:07:54Z) - System stabilization with policy optimization on unstable latent manifolds [0.5261718469769449]
提案手法は,データサンプルの少ない複雑な物理システムを安定化する。
実験により、提案手法はデータサンプルの少ない複雑な物理システムを安定化させることを示した。
論文 参考訳(メタデータ) (2024-07-08T21:57:28Z) - Learning to Boost the Performance of Stable Nonlinear Systems [0.0]
クローズドループ安定性保証による性能ブースティング問題に対処する。
本手法は,安定な非線形システムのための性能ブースティング制御器のニューラルネットワーククラスを任意に学習することを可能にする。
論文 参考訳(メタデータ) (2024-05-01T21:11:29Z) - A Domain-Agnostic Approach for Characterization of Lifelong Learning
Systems [128.63953314853327]
「生涯学習」システムには,1)継続的学習,2)伝達と適応,3)拡張性があります。
この一連のメトリクスは、様々な複雑な生涯学習システムの開発に役立てることができることを示す。
論文 参考訳(メタデータ) (2023-01-18T21:58:54Z) - KCRL: Krasovskii-Constrained Reinforcement Learning with Guaranteed
Stability in Nonlinear Dynamical Systems [66.9461097311667]
形式的安定性を保証するモデルに基づく強化学習フレームワークを提案する。
提案手法は,特徴表現を用いて信頼区間までシステムダイナミクスを学習する。
我々は、KCRLが、基礎となる未知のシステムとの有限数の相互作用において安定化ポリシーを学ぶことが保証されていることを示す。
論文 参考訳(メタデータ) (2022-06-03T17:27:04Z) - Bayesian Algorithms Learn to Stabilize Unknown Continuous-Time Systems [0.0]
線形力学系は、不確実な力学を持つ植物の学習に基づく制御のための標準モデルである。
この目的のための信頼性の高い安定化手順は、不安定なデータから有効に学習し、有限時間でシステムを安定化させることができない。
本研究では,未知の連続時間線形系を安定化する新しい学習アルゴリズムを提案する。
論文 参考訳(メタデータ) (2021-12-30T15:31:35Z) - Stabilizing Dynamical Systems via Policy Gradient Methods [32.88312419270879]
完全に観察された力学系を安定化するためのモデルフリーなアルゴリズムを提案する。
本研究では,線形システムの安定化制御を効率よく行うことを証明する。
我々は,共通制御ベンチマークにおけるアプローチの有効性を実証的に評価した。
論文 参考訳(メタデータ) (2021-10-13T00:58:57Z) - Supervised DKRC with Images for Offline System Identification [77.34726150561087]
現代の力学系はますます非線形で複雑なものになりつつある。
予測と制御のためのコンパクトで包括的な表現でこれらのシステムをモデル化するフレームワークが必要である。
本手法は,教師付き学習手法を用いてこれらの基礎関数を学習する。
論文 参考訳(メタデータ) (2021-09-06T04:39:06Z) - Reinforcement Learning with Fast Stabilization in Linear Dynamical
Systems [91.43582419264763]
未知の安定化線形力学系におけるモデルベース強化学習(RL)について検討する。
本研究では,環境を効果的に探索することで,基盤システムの高速安定化を証明できるアルゴリズムを提案する。
提案アルゴリズムはエージェント環境相互作用の時間ステップで$tildemathcalO(sqrtT)$ regretを達成した。
論文 参考訳(メタデータ) (2020-07-23T23:06:40Z) - Active Learning for Nonlinear System Identification with Guarantees [102.43355665393067]
状態遷移が既知の状態-作用対の特徴埋め込みに線形に依存する非線形力学系のクラスについて検討する。
そこで本稿では, トラジェクティブ・プランニング, トラジェクティブ・トラッキング, システムの再推定という3つのステップを繰り返すことで, この問題を解決するためのアクティブ・ラーニング・アプローチを提案する。
本手法は, 非線形力学系を標準線形回帰の統計速度と同様, パラメトリック速度で推定する。
論文 参考訳(メタデータ) (2020-06-18T04:54:11Z) - Learning Stable Deep Dynamics Models [91.90131512825504]
状態空間全体にわたって安定することが保証される力学系を学習するためのアプローチを提案する。
このような学習システムは、単純な力学系をモデル化することができ、複雑な力学を学習するために追加の深層生成モデルと組み合わせることができることを示す。
論文 参考訳(メタデータ) (2020-01-17T00:04:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。