論文の概要: Optimistic robust linear quadratic dual control
- arxiv url: http://arxiv.org/abs/1912.13143v1
- Date: Tue, 31 Dec 2019 02:02:11 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-16 21:18:49.152725
- Title: Optimistic robust linear quadratic dual control
- Title(参考訳): 最適ロバストな線形二次双対制御
- Authors: Jack Umenberger and Thomas B. Schon
- Abstract要約: 本稿では, 一定の等価性の性能とロバスト性の実用性を両立させようとする二重制御戦略を提案する。
この定式化は、パラメトリック不確実性の表現における構造を保ち、制御タスクにおいて最も重要となるパラメータにおける不確実性の減少をコントローラが目標とすることを可能にする。
- 参考スコア(独自算出の注目度): 4.94950858749529
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Recent work by Mania et al. has proved that certainty equivalent control
achieves nearly optimal regret for linear systems with quadratic costs.
However, when parameter uncertainty is large, certainty equivalence cannot be
relied upon to stabilize the true, unknown system. In this paper, we present a
dual control strategy that attempts to combine the performance of certainty
equivalence, with the practical utility of robustness. The formulation
preserves structure in the representation of parametric uncertainty, which
allows the controller to target reduction of uncertainty in the parameters that
`matter most' for the control task, while robustly stabilizing the uncertain
system. Control synthesis proceeds via convex optimization, and the method is
illustrated on a numerical example.
- Abstract(参考訳): Maniaらによる最近の研究は、2次コストの線形系に対して、確実な等価制御がほぼ最適に後悔することを示した。
しかし、パラメータの不確実性が大きい場合、真で未知のシステムを安定化するために確実性等価性は信頼できない。
本稿では、確実性等価性の性能とロバスト性の実用性を組み合わせた二重制御戦略を提案する。
この定式化はパラメトリック不確実性の表現において構造を保ち、制御タスクの'matter most'パラメータの不確かさの低減をコントローラがターゲットとし、不確実性システムを堅牢に安定化する。
制御合成は凸最適化によって進行し、数値的な例で示す。
関連論文リスト
- Robustness of Dynamic Quantum Control: Differential Sensitivity Bound [0.0]
パラメトリック不確実性に対するゲート忠実度誤差の差分感度に基づく新しいロバスト性尺度を提案する。
与えられた忠実度誤差を保証するハミルトンの不確かさの集合に対する最大許容摂動を確実に計算する方法が示される。
論文 参考訳(メタデータ) (2023-12-30T18:36:53Z) - Stability Bounds for Learning-Based Adaptive Control of Discrete-Time
Multi-Dimensional Stochastic Linear Systems with Input Constraints [3.8004168340068336]
本研究では,有界制御入力制約と非有界障害を有する離散時間多次元システムの適応安定化問題について考察する。
本稿では,オンラインパラメータ推定と飽和線形制御を組み合わせた等価制御手法を提案する。
論文 参考訳(メタデータ) (2023-04-02T16:38:13Z) - Probabilities Are Not Enough: Formal Controller Synthesis for Stochastic
Dynamical Models with Epistemic Uncertainty [68.00748155945047]
複雑な力学系のモデルにおける不確実性を捉えることは、安全なコントローラの設計に不可欠である。
いくつかのアプローチでは、安全と到達可能性に関する時間的仕様を満たすポリシーを形式的な抽象化を用いて合成する。
我々の貢献は、ノイズ、不確実なパラメータ、外乱を含む連続状態モデルに対する新しい抽象的制御法である。
論文 参考訳(メタデータ) (2022-10-12T07:57:03Z) - Robust Online Control with Model Misspecification [96.23493624553998]
本研究では,未知の非線形力学系のモデル不特定性を考慮したオンライン制御について検討する。
本研究は, 線形近似からの偏差を許容できる程度に測定できるロバスト性に着目した。
論文 参考訳(メタデータ) (2021-07-16T07:04:35Z) - Probabilistic robust linear quadratic regulators with Gaussian processes [73.0364959221845]
ガウス過程(GP)のような確率モデルは、制御設計に続く使用のためのデータから未知の動的システムを学ぶための強力なツールです。
本稿では、確率的安定性マージンに関して堅牢なコントローラを生成する線形化GPダイナミクスのための新しいコントローラ合成について述べる。
論文 参考訳(メタデータ) (2021-05-17T08:36:18Z) - Improper Learning with Gradient-based Policy Optimization [62.50997487685586]
未知のマルコフ決定過程に対して学習者がmベースコントローラを与えられる不適切な強化学習設定を考える。
制御器の不適切な混合のクラス上で動作する勾配に基づくアプローチを提案する。
論文 参考訳(メタデータ) (2021-02-16T14:53:55Z) - Enforcing robust control guarantees within neural network policies [76.00287474159973]
本稿では、ニューラルネットワークによってパラメータ化され、ロバスト制御と同じ証明可能なロバスト性基準を適用した、一般的な非線形制御ポリシークラスを提案する。
提案手法は,複数の領域において有効であり,既存のロバスト制御法よりも平均ケース性能が向上し,(非ロバスト)深部RL法よりも最悪のケース安定性が向上した。
論文 参考訳(メタデータ) (2020-11-16T17:14:59Z) - Learning Stabilizing Controllers for Unstable Linear Quadratic
Regulators from a Single Trajectory [85.29718245299341]
線形2次制御器(LQR)としても知られる2次コストモデルの下で線形制御器を研究する。
楕円形不確実性集合内の全ての系を安定化させる制御器を構成する2つの異なる半定値プログラム(SDP)を提案する。
高い確率で安定化コントローラを迅速に識別できる効率的なデータ依存アルゴリズムであるtextsceXplorationを提案する。
論文 参考訳(メタデータ) (2020-06-19T08:58:57Z) - Robust Learning-Based Control via Bootstrapped Multiplicative Noise [0.0]
本稿では,このような非漸近的不確かさを制御設計に明示的に組み込む頑健な適応制御アルゴリズムを提案する。
提案手法の主な利点は、システム識別とロバストな制御設計手順の両方が不確実性表現を使用することである。
論文 参考訳(メタデータ) (2020-02-24T04:12:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。