論文の概要: LQGNet: Hybrid Model-Based and Data-Driven Linear Quadratic Stochastic
Control
- arxiv url: http://arxiv.org/abs/2210.12803v2
- Date: Tue, 25 Oct 2022 02:49:09 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-26 10:39:47.094308
- Title: LQGNet: Hybrid Model-Based and Data-Driven Linear Quadratic Stochastic
Control
- Title(参考訳): LQGNet:ハイブリッドモデルベースおよびデータ駆動線形二次確率制御
- Authors: Solomon Goldgraber Casspi, Oliver Husser, Guy Revach, and Nir
Shlezinger
- Abstract要約: 二次制御は、不確実性のある環境で、力学系のための最適な制御信号を見つけることを扱う。
LQGNetは、部分的に知られた動的操作のためにデータを活用するコントローラである。
LQGNetは、ミスマッチしたSSモデルを克服することで、古典的な制御よりも優れていることを示す。
- 参考スコア(独自算出の注目度): 24.413595920205907
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Stochastic control deals with finding an optimal control signal for a
dynamical system in a setting with uncertainty, playing a key role in numerous
applications. The linear quadratic Gaussian (LQG) is a widely-used setting,
where the system dynamics is represented as a linear Gaussian statespace (SS)
model, and the objective function is quadratic. For this setting, the optimal
controller is obtained in closed form by the separation principle. However, in
practice, the underlying system dynamics often cannot be faithfully captured by
a fully known linear Gaussian SS model, limiting its performance. Here, we
present LQGNet, a stochastic controller that leverages data to operate under
partially known dynamics. LQGNet augments the state tracking module of
separation-based control with a dedicated trainable algorithm. The resulting
system preserves the operation of classic LQG control while learning to cope
with partially known SS models without having to fully identify the dynamics.
We empirically show that LQGNet outperforms classic stochastic control by
overcoming mismatched SS models.
- Abstract(参考訳): 確率制御は、不確実性のある環境で力学系の最適制御信号を見つけ、多くの応用において重要な役割を果たす。
線形二次ガウス(LQG)は、システム力学を線形ガウス状態空間(SS)モデルとして表現し、目的関数を二次関数とする、広く用いられる集合である。
この設定では、最適制御装置は分離原理により閉じた形で得られる。
しかし実際には、基礎となるシステムダイナミクスは、完全に知られた線形ガウスSSモデルによって忠実に捉えられず、性能が制限される。
本稿では、LQGNetについて述べる。LQGNetは、部分的に既知の動的条件下での動作にデータを活用する確率的制御器である。
LQGNetは、分離ベースの制御のステートトラッキングモジュールを専用トレーニング可能なアルゴリズムで強化する。
得られたシステムは,従来のLQG制御の動作を,ダイナミックスを完全に識別することなく,部分的に既知のSSモデルに対応することを学習しながら維持する。
LQGNetは、ミスマッチしたSSモデルを克服することで、古典的な確率制御よりも優れていることを実証的に示す。
関連論文リスト
- Sample-efficient Model-based Reinforcement Learning for Quantum Control [0.2999888908665658]
ノイズの多い時間依存ゲート最適化のためのモデルベース強化学習(RL)手法を提案する。
標準モデルフリーRLに比べて,本手法のサンプル複雑性において,桁違いの優位性を示す。
提案アルゴリズムは,部分的特徴付き1量子ビット系と2量子ビット系の制御に適している。
論文 参考訳(メタデータ) (2023-04-19T15:05:19Z) - Bridging Model-based Safety and Model-free Reinforcement Learning
through System Identification of Low Dimensional Linear Models [16.511440197186918]
モデルベース安全性とモデルフリー強化学習を組み合わせた新しい手法を提案する。
閉ループ系の力学を捉えるためには,低次元の力学モデルが十分であることを示す。
検出された線形モデルは、安全クリティカルな最適制御フレームワークによる保証を提供することができることを示す。
論文 参考訳(メタデータ) (2022-05-11T22:03:18Z) - Sparsity in Partially Controllable Linear Systems [56.142264865866636]
本研究では, 部分制御可能な線形力学系について, 基礎となる空間パターンを用いて検討する。
最適制御には無関係な状態変数を特徴付ける。
論文 参考訳(メタデータ) (2021-10-12T16:41:47Z) - Finite-time System Identification and Adaptive Control in Autoregressive
Exogenous Systems [79.67879934935661]
未知のARXシステムのシステム識別と適応制御の問題について検討する。
我々は,オープンループとクローズループの両方のデータ収集の下で,ARXシステムに対する有限時間学習保証を提供する。
論文 参考訳(メタデータ) (2021-08-26T18:00:00Z) - KalmanNet: Neural Network Aided Kalman Filtering for Partially Known
Dynamics [84.18625250574853]
KalmanNetは、データから学習し、非線形力学の下でKalmanフィルタを実行するリアルタイム状態推定器である。
我々は、KalmanNetが非線形性とモデルミスマッチを克服し、古典的なフィルタリング手法より優れていることを数値的に示す。
論文 参考訳(メタデータ) (2021-07-21T12:26:46Z) - Gaussian Process-based Min-norm Stabilizing Controller for
Control-Affine Systems with Uncertain Input Effects and Dynamics [90.81186513537777]
本稿では,この問題の制御・アフィン特性を捉えた新しい化合物カーネルを提案する。
この結果の最適化問題は凸であることを示し、ガウス過程に基づく制御リャプノフ関数第二次コーンプログラム(GP-CLF-SOCP)と呼ぶ。
論文 参考訳(メタデータ) (2020-11-14T01:27:32Z) - Information Theoretic Regret Bounds for Online Nonlinear Control [35.534829914047336]
未知の非線形力学系における逐次制御の問題について検討する。
この枠組みは、離散的かつ連続的な制御入力と非滑らかで微分不可能な力学を許容する一般的な設定を与える。
実験により, 非線形制御タスクへの応用を実証し, モデル力学の学習における探索の利点を実証する。
論文 参考訳(メタデータ) (2020-06-22T17:46:48Z) - Logarithmic Regret Bound in Partially Observable Linear Dynamical
Systems [91.43582419264763]
部分的に観測可能な線形力学系におけるシステム同定と適応制御の問題について検討する。
開ループ系と閉ループ系の両方において有限時間保証付きの最初のモデル推定法を提案する。
AdaptOnは、未知の部分観測可能な線形力学系の適応制御において、$textpolylogleft(Tright)$ regretを達成する最初のアルゴリズムであることを示す。
論文 参考訳(メタデータ) (2020-03-25T06:00:33Z) - Adaptive Control and Regret Minimization in Linear Quadratic Gaussian
(LQG) Setting [91.43582419264763]
我々は不確実性に直面した楽観主義の原理に基づく新しい強化学習アルゴリズムLqgOptを提案する。
LqgOptはシステムのダイナミクスを効率的に探索し、モデルのパラメータを信頼区間まで推定し、最も楽観的なモデルのコントローラをデプロイする。
論文 参考訳(メタデータ) (2020-03-12T19:56:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。