論文の概要: Differentially Flat Learning-based Model Predictive Control Using a
Stability, State, and Input Constraining Safety Filter
- arxiv url: http://arxiv.org/abs/2307.10541v1
- Date: Thu, 20 Jul 2023 02:42:23 GMT
- ステータス: 処理完了
- システム内更新日: 2023-07-21 15:10:22.804583
- Title: Differentially Flat Learning-based Model Predictive Control Using a
Stability, State, and Input Constraining Safety Filter
- Title(参考訳): 安定性, 状態, 入力制約型安全フィルタを用いた微分フラット学習モデル予測制御
- Authors: Adam W. Hall and Melissa Greeff and Angela P. Schoellig
- Abstract要約: 学習に基づく最適制御アルゴリズムは、過去の軌跡データとシステムダイナミクスの学習モデルを用いて未知のシステムを制御する。
本稿では、微分平坦性を利用して、最先端の学習ベースコントローラに類似した性能を実現する非線形制御器を提案する。
- 参考スコア(独自算出の注目度): 10.52705437098686
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Learning-based optimal control algorithms control unknown systems using past
trajectory data and a learned model of the system dynamics. These controllers
use either a linear approximation of the learned dynamics, trading performance
for faster computation, or nonlinear optimization methods, which typically
perform better but can limit real-time applicability. In this work, we present
a novel nonlinear controller that exploits differential flatness to achieve
similar performance to state-of-the-art learning-based controllers but with
significantly less computational effort. Differential flatness is a property of
dynamical systems whereby nonlinear systems can be exactly linearized through a
nonlinear input mapping. Here, the nonlinear transformation is learned as a
Gaussian process and is used in a safety filter that guarantees, with high
probability, stability as well as input and flat state constraint satisfaction.
This safety filter is then used to refine inputs from a flat model predictive
controller to perform constrained nonlinear learning-based optimal control
through two successive convex optimizations. We compare our method to
state-of-the-art learning-based control strategies and achieve similar
performance, but with significantly better computational efficiency, while also
respecting flat state and input constraints, and guaranteeing stability.
- Abstract(参考訳): 学習に基づく最適制御アルゴリズムは、過去の軌道データとシステムダイナミクスの学習モデルを用いて未知のシステムを制御する。
これらのコントローラは、学習したダイナミクスの線形近似、高速な計算のためのトレーディングパフォーマンス、あるいは一般的には性能は良いがリアルタイム適用性を制限する非線形最適化手法のいずれかを使用する。
本稿では,最先端の学習ベースコントローラと同様の性能を実現するために微分平坦性を利用した新しい非線形コントローラを提案する。
微分平坦性は、非線形入力写像によって非線形系を正確に線形化することができる力学系の特性である。
ここで、非線形変換はガウス過程として学習され、高い確率、安定性、入力および平らな状態制約満足度を保証する安全フィルタで使用される。
この安全フィルタは、フラットモデル予測制御器からの入力を洗練して、2つの連続凸最適化により制約付き非線形学習に基づく最適制御を行う。
本手法を最先端の学習ベースの制御戦略と比較し,同様の性能を実現するとともに,計算効率が大幅に向上するとともに,フラット状態と入力制約を尊重し,安定性を保証した。
関連論文リスト
- Learning to Boost the Performance of Stable Nonlinear Systems [0.0]
クローズドループ安定性保証による性能ブースティング問題に対処する。
本手法は,安定な非線形システムのための性能ブースティング制御器のニューラルネットワーククラスを任意に学習することを可能にする。
論文 参考訳(メタデータ) (2024-05-01T21:11:29Z) - A Priori Denoising Strategies for Sparse Identification of Nonlinear
Dynamical Systems: A Comparative Study [68.8204255655161]
本研究では, 局所的およびグローバルな平滑化手法の性能と, 状態測定値の偏差について検討・比較する。
一般に,測度データセット全体を用いたグローバルな手法は,局所点の周辺に隣接するデータサブセットを用いる局所的手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2022-01-29T23:31:25Z) - Learning over All Stabilizing Nonlinear Controllers for a
Partially-Observed Linear System [4.3012765978447565]
線形力学系に対する非線形出力フィードバックコントローラのパラメータ化を提案する。
提案手法は, 制約を満たすことなく, 部分的に観測可能な線形力学系の閉ループ安定性を保証する。
論文 参考訳(メタデータ) (2021-12-08T10:43:47Z) - Imitation Learning of Stabilizing Policies for Nonlinear Systems [1.52292571922932]
線形システムやコントローラ向けに開発された手法は,平方の和を用いて容易にコントローラに拡張できることが示されている。
予測勾配降下法とアルゴリズムの交互方向法を, 安定化模倣学習問題に対して提案する。
論文 参考訳(メタデータ) (2021-09-22T17:27:19Z) - Probabilistic robust linear quadratic regulators with Gaussian processes [73.0364959221845]
ガウス過程(GP)のような確率モデルは、制御設計に続く使用のためのデータから未知の動的システムを学ぶための強力なツールです。
本稿では、確率的安定性マージンに関して堅牢なコントローラを生成する線形化GPダイナミクスのための新しいコントローラ合成について述べる。
論文 参考訳(メタデータ) (2021-05-17T08:36:18Z) - Closing the Closed-Loop Distribution Shift in Safe Imitation Learning [80.05727171757454]
模倣学習問題において,安全な最適化に基づく制御戦略を専門家として扱う。
我々は、実行時に安価に評価でき、専門家と同じ安全保証を確実に満足する学習されたポリシーを訓練する。
論文 参考訳(メタデータ) (2021-02-18T05:11:41Z) - Reinforcement Learning Control of Constrained Dynamic Systems with
Uniformly Ultimate Boundedness Stability Guarantee [12.368097742148128]
強化学習(RL)は複雑な非線形制御問題に対して有望である。
データベースの学習アプローチは、安定性を保証していないことで悪名高い。
本稿では,古典的なリャプノフ法を用いて,データのみに基づいて一様極大境界性安定性(UUB)を解析する。
論文 参考訳(メタデータ) (2020-11-13T12:41:56Z) - Chance-Constrained Trajectory Optimization for Safe Exploration and
Learning of Nonlinear Systems [81.7983463275447]
学習に基づく制御アルゴリズムは、訓練のための豊富な監督を伴うデータ収集を必要とする。
本稿では,機会制約付き最適制御と動的学習とフィードバック制御を統合した安全な探索による最適動作計画のための新しいアプローチを提案する。
論文 参考訳(メタデータ) (2020-05-09T05:57:43Z) - Learning Constrained Adaptive Differentiable Predictive Control Policies
With Guarantees [1.1086440815804224]
本稿では,線形システムに対する制約付きニューラルコントロールポリシーの学習方法として,微分可能予測制御(DPC)を提案する。
我々は,モデル予測制御(MPC)損失関数の逆伝搬と,微分可能な閉ループ系力学モデルによるペナルティの制約により,直接的な政策勾配を求めるために,自動微分を用いる。
論文 参考訳(メタデータ) (2020-04-23T14:24:44Z) - Tracking Performance of Online Stochastic Learners [57.14673504239551]
オンラインアルゴリズムは、大規模なバッチにデータを保存したり処理したりすることなく、リアルタイムで更新を計算できるため、大規模な学習環境で人気がある。
一定のステップサイズを使用すると、これらのアルゴリズムはデータやモデル特性などの問題パラメータのドリフトに適応し、適切な精度で最適解を追跡する能力を持つ。
定常仮定に基づく定常状態性能とランダムウォークモデルによるオンライン学習者の追跡性能の関連性を確立する。
論文 参考訳(メタデータ) (2020-04-04T14:16:27Z) - Logarithmic Regret Bound in Partially Observable Linear Dynamical
Systems [91.43582419264763]
部分的に観測可能な線形力学系におけるシステム同定と適応制御の問題について検討する。
開ループ系と閉ループ系の両方において有限時間保証付きの最初のモデル推定法を提案する。
AdaptOnは、未知の部分観測可能な線形力学系の適応制御において、$textpolylogleft(Tright)$ regretを達成する最初のアルゴリズムであることを示す。
論文 参考訳(メタデータ) (2020-03-25T06:00:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。