論文の概要: Robustness of Control Design via Bayesian Learning
- arxiv url: http://arxiv.org/abs/2205.06896v1
- Date: Fri, 13 May 2022 21:10:19 GMT
- ステータス: 処理完了
- システム内更新日: 2022-05-17 18:01:24.704159
- Title: Robustness of Control Design via Bayesian Learning
- Title(参考訳): ベイズ学習による制御設計のロバスト性
- Authors: Nardos Ayele Ashenafi and Wankun Sirichotiyakul and Aykut C. Satici
- Abstract要約: これらの知見に触発されて,制御探索課題におけるベイズ学習の頑健性を示す。
一次元開放ループ不安定系を安定化する線形制御器を求める。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In the realm of supervised learning, Bayesian learning has shown robust
predictive capabilities under input and parameter perturbations. Inspired by
these findings, we demonstrate the robustness properties of Bayesian learning
in the control search task. We seek to find a linear controller that stabilizes
a one-dimensional open-loop unstable stochastic system. We compare two methods
to deduce the controller: the first (deterministic) one assumes perfect
knowledge of system parameter and state, the second takes into account
uncertainties in both and employs Bayesian learning to compute a posterior
distribution for the controller.
- Abstract(参考訳): 教師あり学習の領域では、ベイズ学習は入力とパラメータの摂動の下で堅牢な予測能力を示した。
これらの知見に触発されて,制御探索課題におけるベイズ学習の頑健性を示す。
我々は,1次元開ループ不安定確率系を安定化する線形制御系を求める。
制御器を推定する2つの方法を比較する。第1(決定論的)は系のパラメータと状態の完全な知識を仮定し、第2は双方の不確実性を考慮し、制御器の後方分布を計算するためにベイズ学習を用いる。
関連論文リスト
- Actively Learning Reinforcement Learning: A Stochastic Optimal Control Approach [3.453622106101339]
本研究では,2つの相互に結びついた目的を達成するための枠組みを提案する。 (i) 積極的な探索と意図的な情報収集を伴う強化学習と, (ii) 最適制御法の計算的難易度を克服する枠組みである。
我々は、強化学習を用いて最適制御則を計算することにより、両方の目的にアプローチする。
一定の探索と搾取バランスとは異なり、学習プロセスが終了しても、警告と探索はリアルタイムでコントローラによって自動的に行われる。
論文 参考訳(メタデータ) (2023-09-18T18:05:35Z) - Learning Over Contracting and Lipschitz Closed-Loops for
Partially-Observed Nonlinear Systems (Extended Version) [1.2430809884830318]
本稿では非線形な部分観測力学系に対する学習に基づく制御のためのポリシーパラメータ化を提案する。
結果のYoula-RENパラメータ化は自動的に安定性(収縮)とユーザチューニング可能な堅牢性(Lipschitz)を満足することを示した。
We found that the Youla-REN are also like to existing learning-based and optimal control method, also ensure stability and exhibiting improve robustness to adversarial disturbances。
論文 参考訳(メタデータ) (2023-04-12T23:55:56Z) - Improving the Performance of Robust Control through Event-Triggered
Learning [74.57758188038375]
LQR問題における不確実性に直面していつ学習するかを決定するイベントトリガー学習アルゴリズムを提案する。
本研究では,ロバストな制御器ベースライン上での性能向上を数値例で示す。
論文 参考訳(メタデータ) (2022-07-28T17:36:37Z) - Learning Robust Output Control Barrier Functions from Safe Expert Demonstrations [50.37808220291108]
本稿では,専門家によるデモンストレーションの部分的な観察から,安全な出力フィードバック制御法を考察する。
まず,安全性を保証する手段として,ロバスト出力制御バリア関数(ROCBF)を提案する。
次に、安全なシステム動作を示す専門家による実証からROCBFを学習するための最適化問題を定式化する。
論文 参考訳(メタデータ) (2021-11-18T23:21:00Z) - Probabilistic robust linear quadratic regulators with Gaussian processes [73.0364959221845]
ガウス過程(GP)のような確率モデルは、制御設計に続く使用のためのデータから未知の動的システムを学ぶための強力なツールです。
本稿では、確率的安定性マージンに関して堅牢なコントローラを生成する線形化GPダイナミクスのための新しいコントローラ合成について述べる。
論文 参考訳(メタデータ) (2021-05-17T08:36:18Z) - Control Barrier Functions for Unknown Nonlinear Systems using Gaussian
Processes [17.870440210358847]
本稿では,安全制約を確保しつつ,未知の非線形システムに対する制御器の合成に焦点をあてる。
学習段階において、未知の制御アフィン非線形力学を学習するために、学習したモデルの精度に統計的に拘束されるように、データ駆動方式を用いる。
第2の制御器合成ステップでは,学習モデルの不確実性を考慮した制御障壁関数の計算方式を開発する。
論文 参考訳(メタデータ) (2020-10-12T16:12:52Z) - Learning Stabilizing Controllers for Unstable Linear Quadratic
Regulators from a Single Trajectory [85.29718245299341]
線形2次制御器(LQR)としても知られる2次コストモデルの下で線形制御器を研究する。
楕円形不確実性集合内の全ての系を安定化させる制御器を構成する2つの異なる半定値プログラム(SDP)を提案する。
高い確率で安定化コントローラを迅速に識別できる効率的なデータ依存アルゴリズムであるtextsceXplorationを提案する。
論文 参考訳(メタデータ) (2020-06-19T08:58:57Z) - Learning Control Barrier Functions from Expert Demonstrations [69.23675822701357]
制御障壁関数(CBF)に基づく安全な制御器合成のための学習に基づくアプローチを提案する。
最適化に基づくCBFの学習手法を解析し、基礎となる力学系のリプシッツ仮定の下で証明可能な安全保証を享受する。
私たちの知る限りでは、これらはデータから確実に安全な制御障壁関数を学習する最初の結果です。
論文 参考訳(メタデータ) (2020-04-07T12:29:06Z) - Adaptive Control and Regret Minimization in Linear Quadratic Gaussian
(LQG) Setting [91.43582419264763]
我々は不確実性に直面した楽観主義の原理に基づく新しい強化学習アルゴリズムLqgOptを提案する。
LqgOptはシステムのダイナミクスを効率的に探索し、モデルのパラメータを信頼区間まで推定し、最も楽観的なモデルのコントローラをデプロイする。
論文 参考訳(メタデータ) (2020-03-12T19:56:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。