論文の概要: Gaussian Process-based Min-norm Stabilizing Controller for
Control-Affine Systems with Uncertain Input Effects and Dynamics
- arxiv url: http://arxiv.org/abs/2011.07183v2
- Date: Tue, 23 Mar 2021 07:50:29 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-25 14:08:47.584673
- Title: Gaussian Process-based Min-norm Stabilizing Controller for
Control-Affine Systems with Uncertain Input Effects and Dynamics
- Title(参考訳): ガウス過程に基づく入力効果とダイナミクスの不確実性を有する制御アフィン系のミンノルム安定化制御
- Authors: Fernando Casta\~neda, Jason J. Choi, Bike Zhang, Claire J. Tomlin and
Koushil Sreenath
- Abstract要約: 本稿では,この問題の制御・アフィン特性を捉えた新しい化合物カーネルを提案する。
この結果の最適化問題は凸であることを示し、ガウス過程に基づく制御リャプノフ関数第二次コーンプログラム(GP-CLF-SOCP)と呼ぶ。
- 参考スコア(独自算出の注目度): 90.81186513537777
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This paper presents a method to design a min-norm Control Lyapunov Function
(CLF)-based stabilizing controller for a control-affine system with uncertain
dynamics using Gaussian Process (GP) regression. In order to estimate both
state and input-dependent model uncertainty, we propose a novel compound kernel
that captures the control-affine nature of the problem. Furthermore, by the use
of GP Upper Confidence Bound analysis, we provide probabilistic bounds of the
regression error, leading to the formulation of a CLF-based stability chance
constraint which can be incorporated in a min-norm optimization problem. We
show that this resulting optimization problem is convex, and we call it
Gaussian Process-based Control Lyapunov Function Second-Order Cone Program
(GP-CLF-SOCP). The data-collection process and the training of the GP
regression model are carried out in an episodic learning fashion. We validate
the proposed algorithm and controller in numerical simulations of an inverted
pendulum and a kinematic bicycle model, resulting in stable trajectories which
are very similar to the ones obtained if we actually knew the true plant
dynamics.
- Abstract(参考訳): 本稿では,ガウス過程(GP)回帰を用いた制御アフィン系に対する最小制御リアプノフ関数(CLF)に基づく安定化制御系の設計法を提案する。
状態と入力依存モデルの両方の不確かさを推定するために,問題の制御-アフィン特性を捉えた新しい複合カーネルを提案する。
さらに、GP上信頼境界解析を用いることで、回帰誤差の確率的境界を提供し、最小ノルム最適化問題に組み込むことができるCLFベースの安定確率制約を定式化する。
この最適化問題は凸であり,ガウス過程に基づく制御リャプノフ関数第二次コーンプログラム (GP-CLF-SOCP) と呼ぶ。
データ収集プロセスとGP回帰モデルのトレーニングは,エピソード学習方式で行う。
倒立振り子とキネマティックサイクリングモデルの数値シミュレーションにおいて,提案するアルゴリズムと制御器を検証し,実際のプラントダイナミクスを知っていれば得られるものと非常に類似した安定な軌道を導出する。
関連論文リスト
- Real-Time Adaptive Safety-Critical Control with Gaussian Processes in
High-Order Uncertain Models [14.790031018404942]
本稿では,不確実なパラメータを持つシステムを対象とした適応型オンライン学習フレームワークを提案する。
まず,差分スパースGPアルゴリズムを改良するために,まず忘れ係数を積分する。
第2フェーズでは,高次制御バリア関数に基づく安全フィルタを提案する。
論文 参考訳(メタデータ) (2024-02-29T08:25:32Z) - Sub-linear Regret in Adaptive Model Predictive Control [56.705978425244496]
本稿では,STT-MPC (Self-Tuning tube-based Model Predictive Control) について述べる。
システム力学を最初に認識したアルゴリズムと比較して,アルゴリズムの後悔を解析する。
論文 参考訳(メタデータ) (2023-10-07T15:07:10Z) - Neural Lyapunov Differentiable Predictive Control [2.042924346801313]
本稿では、確率的リアプノフに基づく安定性保証を備えた微分可能なプログラミングフレームワークを用いた学習に基づく予測制御手法を提案する。
この手法は、安定な力学で状態空間の領域を認証するリアプノフ関数を共同で学習する。
論文 参考訳(メタデータ) (2022-05-22T03:52:27Z) - Reliably-stabilizing piecewise-affine neural network controllers [5.203329540700177]
モデル予測制御(MPC)ポリシーのニューラルネットワーク(NN)近似に影響を与える一般的な問題は、NNベースのコントローラの動作の下でクローズドループシステムの安定性を評価するための分析ツールがないことである。
本稿では、そのような制御器の性能を定量化したり、与えられたMPCスキームの望ましい特性を保持する最小の複雑性NNを設計するための一般的な手順を提案する。
論文 参考訳(メタデータ) (2021-11-13T20:01:43Z) - Hybrid Gaussian Process Modeling Applied to Economic Stochastic Model
Predictive Control of Batch Processes [0.0]
植物モデルはしばしば第一原理から決定され、モデルの一部が物理的法則のみを用いて導出することが困難である。
本稿ではGPを用いて、第一原理を用いて記述が難しい動的システムのパーツをモデル化する。
この不確実性を制御アルゴリズムで考慮し、制約違反や性能劣化を防止することが不可欠である。
論文 参考訳(メタデータ) (2021-08-14T00:01:42Z) - Pointwise Feasibility of Gaussian Process-based Safety-Critical Control
under Model Uncertainty [77.18483084440182]
制御バリア関数(CBF)と制御リアプノフ関数(CLF)は、制御システムの安全性と安定性をそれぞれ強化するための一般的なツールである。
本稿では, CBF と CLF を用いた安全クリティカルコントローラにおいて, モデル不確実性に対処するためのガウスプロセス(GP)に基づくアプローチを提案する。
論文 参考訳(メタデータ) (2021-06-13T23:08:49Z) - Probabilistic robust linear quadratic regulators with Gaussian processes [73.0364959221845]
ガウス過程(GP)のような確率モデルは、制御設計に続く使用のためのデータから未知の動的システムを学ぶための強力なツールです。
本稿では、確率的安定性マージンに関して堅牢なコントローラを生成する線形化GPダイナミクスのための新しいコントローラ合成について述べる。
論文 参考訳(メタデータ) (2021-05-17T08:36:18Z) - Pushing the Envelope of Rotation Averaging for Visual SLAM [69.7375052440794]
視覚SLAMシステムのための新しい最適化バックボーンを提案する。
従来の単分子SLAMシステムの精度, 効率, 堅牢性を向上させるために, 平均化を活用している。
我々のアプローチは、公開ベンチマークの最先端技術に対して、同等の精度で最大10倍高速に表示することができる。
論文 参考訳(メタデータ) (2020-11-02T18:02:26Z) - Adaptive Control and Regret Minimization in Linear Quadratic Gaussian
(LQG) Setting [91.43582419264763]
我々は不確実性に直面した楽観主義の原理に基づく新しい強化学習アルゴリズムLqgOptを提案する。
LqgOptはシステムのダイナミクスを効率的に探索し、モデルのパラメータを信頼区間まで推定し、最も楽観的なモデルのコントローラをデプロイする。
論文 参考訳(メタデータ) (2020-03-12T19:56:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。