論文の概要: Probabilistic robust linear quadratic regulators with Gaussian processes
- arxiv url: http://arxiv.org/abs/2105.07668v1
- Date: Mon, 17 May 2021 08:36:18 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-18 14:19:50.798078
- Title: Probabilistic robust linear quadratic regulators with Gaussian processes
- Title(参考訳): ガウス過程をもつ確率的ロバストな線形二次レギュレータ
- Authors: Alexander von Rohr, Matthias Neumann-Brosig, Sebastian Trimpe
- Abstract要約: ガウス過程(GP)のような確率モデルは、制御設計に続く使用のためのデータから未知の動的システムを学ぶための強力なツールです。
本稿では、確率的安定性マージンに関して堅牢なコントローラを生成する線形化GPダイナミクスのための新しいコントローラ合成について述べる。
- 参考スコア(独自算出の注目度): 73.0364959221845
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Probabilistic models such as Gaussian processes (GPs) are powerful tools to
learn unknown dynamical systems from data for subsequent use in control design.
While learning-based control has the potential to yield superior performance in
demanding applications, robustness to uncertainty remains an important
challenge. Since Bayesian methods quantify uncertainty of the learning results,
it is natural to incorporate these uncertainties into a robust design. In
contrast to most state-of-the-art approaches that consider worst-case
estimates, we leverage the learning method's posterior distribution in the
controller synthesis. The result is a more informed and, thus, more efficient
trade-off between performance and robustness. We present a novel controller
synthesis for linearized GP dynamics that yields robust controllers with
respect to a probabilistic stability margin. The formulation is based on a
recently proposed algorithm for linear quadratic control synthesis, which we
extend by giving probabilistic robustness guarantees in the form of credibility
bounds for the system's stability.Comparisons to existing methods based on
worst-case and certainty-equivalence designs reveal superior performance and
robustness properties of the proposed method.
- Abstract(参考訳): ガウス過程(GP)のような確率モデルは、未知の力学系をデータから学習する強力なツールであり、その後制御設計に使用される。
学習ベースの制御は要求されるアプリケーションにおいて優れたパフォーマンスをもたらす可能性があるが、不確実性に対する堅牢性は依然として重要な課題である。
ベイズ法は学習結果の不確実性を定量化するので、これらの不確実性を堅牢な設計に組み込むのは当然である。
最悪の場合の見積を考慮に入れるほとんどの最先端のアプローチとは対照的に,本手法の制御器合成における後方分布を利用する。
その結果は、よりインフォームドで、パフォーマンスと堅牢性の間のより効率的なトレードオフとなる。
本稿では,確率的安定性のマージンに対してロバストな制御を行う線形化gpダイナミクスのための新しい制御器合成法を提案する。
この定式化は,最近提案された線形二次制御合成アルゴリズムに基づいて,システムの安定性に対する信頼性境界の形で確率論的ロバスト性を保証する。
関連論文リスト
- Distributionally Robust Policy and Lyapunov-Certificate Learning [13.38077406934971]
不確実なシステムに対する安定性を保証するコントローラの設計における重要な課題は、オンラインデプロイメント中のモデルパラメトリック不確実性の変化の正確な決定と適応である。
我々は、リアプノフ証明書の単調な減少を保証するために、リアプノフ微分チャンス制約を分布的に頑健に定式化することで、この問題に取り組む。
得られた閉ループシステムに対して、その平衡のグローバルな安定性は、アウト・オブ・ディストリビューションの不確実性があっても高い信頼性で証明できることを示す。
論文 参考訳(メタデータ) (2024-04-03T18:57:54Z) - Provable Guarantees for Generative Behavior Cloning: Bridging Low-Level
Stability and High-Level Behavior [51.60683890503293]
生成モデルを用いた複雑な専門家による実演の行動クローニングに関する理論的枠組みを提案する。
任意の専門的軌跡の時間ごとのステップ分布に一致するトラジェクトリを生成することができることを示す。
論文 参考訳(メタデータ) (2023-07-27T04:27:26Z) - On Uncertainty Calibration and Selective Generation in Probabilistic
Neural Summarization: A Benchmark Study [14.041071717005362]
要約のための最新のディープモデルは、優れたベンチマーク性能を得るが、誤校正された予測の不確実性を生成する傾向にある。
これは、低品質の予測に高い信頼性を割り当て、現実世界のアプリケーションにおける信頼性と信頼性を損なうことを意味する。
確率的深層学習法は誤校正問題の一般的な解法であるが, 複雑な自己回帰的要約タスクにおける相対的有効性はよく理解されていない。
論文 参考訳(メタデータ) (2023-04-17T23:06:28Z) - Learning-Based Optimal Control with Performance Guarantees for Unknown Systems with Latent States [4.4820711784498]
本稿では,潜在状態を持つ未知非線形系に対する最適入力軌道の計算法を提案する。
提案手法の有効性を数値シミュレーションで示す。
論文 参考訳(メタデータ) (2023-03-31T11:06:09Z) - Probabilities Are Not Enough: Formal Controller Synthesis for Stochastic
Dynamical Models with Epistemic Uncertainty [68.00748155945047]
複雑な力学系のモデルにおける不確実性を捉えることは、安全なコントローラの設計に不可欠である。
いくつかのアプローチでは、安全と到達可能性に関する時間的仕様を満たすポリシーを形式的な抽象化を用いて合成する。
我々の貢献は、ノイズ、不確実なパラメータ、外乱を含む連続状態モデルに対する新しい抽象的制御法である。
論文 参考訳(メタデータ) (2022-10-12T07:57:03Z) - The Impact of Data on the Stability of Learning-Based Control- Extended
Version [63.97366815968177]
本稿では,Lyapunovをベースとした,認証制御性能に対するデータの影響の定量化手法を提案する。
ガウス過程を通じて未知系の力学をモデル化することにより、モデルの不確実性と安定性条件の満足度の間の相互関係を決定できる。
論文 参考訳(メタデータ) (2020-11-20T19:10:01Z) - Enforcing robust control guarantees within neural network policies [76.00287474159973]
本稿では、ニューラルネットワークによってパラメータ化され、ロバスト制御と同じ証明可能なロバスト性基準を適用した、一般的な非線形制御ポリシークラスを提案する。
提案手法は,複数の領域において有効であり,既存のロバスト制御法よりも平均ケース性能が向上し,(非ロバスト)深部RL法よりも最悪のケース安定性が向上した。
論文 参考訳(メタデータ) (2020-11-16T17:14:59Z) - Gaussian Process-based Min-norm Stabilizing Controller for
Control-Affine Systems with Uncertain Input Effects and Dynamics [90.81186513537777]
本稿では,この問題の制御・アフィン特性を捉えた新しい化合物カーネルを提案する。
この結果の最適化問題は凸であることを示し、ガウス過程に基づく制御リャプノフ関数第二次コーンプログラム(GP-CLF-SOCP)と呼ぶ。
論文 参考訳(メタデータ) (2020-11-14T01:27:32Z) - Reinforcement Learning Control of Constrained Dynamic Systems with
Uniformly Ultimate Boundedness Stability Guarantee [12.368097742148128]
強化学習(RL)は複雑な非線形制御問題に対して有望である。
データベースの学習アプローチは、安定性を保証していないことで悪名高い。
本稿では,古典的なリャプノフ法を用いて,データのみに基づいて一様極大境界性安定性(UUB)を解析する。
論文 参考訳(メタデータ) (2020-11-13T12:41:56Z) - Neural Lyapunov Model Predictive Control: Learning Safe Global
Controllers from Sub-optimal Examples [4.777323087050061]
多くの実世界の産業アプリケーションでは、例えば人間の操作者による実行など、既存の制御戦略を持つことが典型的である。
この研究の目的は、安全と安定性を維持する新しいコントローラを学習することで、この未知の、安全だが、最適でないポリシーを改善することである。
提案アルゴリズムは、端末コストを学習し、安定性基準に従ってMPCパラメータを更新する。
論文 参考訳(メタデータ) (2020-02-21T16:57:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。