Fugu-MT 論文翻訳(概要): Robust Learning-Based Control via Bootstrapped Multiplicative Noise

論文の概要: Robust Learning-Based Control via Bootstrapped Multiplicative Noise

arxiv url: http://arxiv.org/abs/2002.10069v3
Date: Wed, 11 Aug 2021 22:21:56 GMT
ステータス: 翻訳完了
システム内更新日: 2022-12-29 03:46:07.589460
Title: Robust Learning-Based Control via Bootstrapped Multiplicative Noise
Title（参考訳）: ブートストラップ型乗法雑音によるロバスト学習制御
Authors: Benjamin Gravell and Tyler Summers
Abstract要約: 本稿では,このような非漸近的不確かさを制御設計に明示的に組み込む頑健な適応制御アルゴリズムを提案する。提案手法の主な利点は、システム識別とロバストな制御設計手順の両方が不確実性表現を使用することである。
参考スコア（独自算出の注目度）: 0.0
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Despite decades of research and recent progress in adaptive control and reinforcement learning, there remains a fundamental lack of understanding in designing controllers that provide robustness to inherent non-asymptotic uncertainties arising from models estimated with finite, noisy data. We propose a robust adaptive control algorithm that explicitly incorporates such non-asymptotic uncertainties into the control design. The algorithm has three components: (1) a least-squares nominal model estimator; (2) a bootstrap resampling method that quantifies non-asymptotic variance of the nominal model estimate; and (3) a non-conventional robust control design method using an optimal linear quadratic regulator (LQR) with multiplicative noise. A key advantage of the proposed approach is that the system identification and robust control design procedures both use stochastic uncertainty representations, so that the actual inherent statistical estimation uncertainty directly aligns with the uncertainty the robust controller is being designed against. We show through numerical experiments that the proposed robust adaptive controller can significantly outperform the certainty equivalent controller on both expected regret and measures of regret risk.
Abstract（参考訳）: 数十年にわたる研究と最近の適応制御と強化学習の進歩にもかかわらず、有限なノイズデータで推定されたモデルから生じる固有の非漸近的不確実性に対する堅牢性を提供するコントローラの設計には、基本的な理解の欠如が残っている。本稿では,このような非漸近的不確かさを制御設計に明示的に組み込む頑健な適応制御アルゴリズムを提案する。このアルゴリズムは,(1)最小二乗モデル推定器,(2)名目モデル推定の非漸近的分散を定量化するブートストラップ再サンプリング法,(3)乗算雑音を持つ最適線形二次制御器(LQR)を用いた非従来型ロバストな制御設計法,の3成分を有する。提案手法の重要な利点は、システム同定とロバスト制御設計手順の両方が確率的不確かさ表現を用いており、実際の固有統計推定の不確実性はロバストコントローラが設計している不確実性と直接一致することである。提案するロバスト適応制御器は, 期待された後悔と後悔のリスクの尺度の両方において, 確実性同等の制御器を著しく上回ることができることを示す。

関連論文リスト

Automatically Adaptive Conformal Risk Control [49.95190019041905]
本稿では,テストサンプルの難易度に適応して,統計的リスクの近似的条件制御を実現する手法を提案する。我々のフレームワークは、ユーザが提供するコンディショニングイベントに基づく従来のコンディショニングリスク制御を超えて、コンディショニングに適した関数クラスのアルゴリズム的、データ駆動決定を行う。
論文参考訳（メタデータ） (2024-06-25T08:29:32Z)
Adaptive Robust Model Predictive Control via Uncertainty Cancellation [25.736296938185074]
本稿では,動的に重要な不確かさを補う学習に基づく頑健な予測制御アルゴリズムを提案する。我々は、一定の等価な「推定とキャンセル」制御法に着想を得た、非線形フィードバックポリシーのクラスを最適化する。
論文参考訳（メタデータ） (2022-12-02T18:54:23Z)
Probabilities Are Not Enough: Formal Controller Synthesis for Stochastic Dynamical Models with Epistemic Uncertainty [68.00748155945047]
複雑な力学系のモデルにおける不確実性を捉えることは、安全なコントローラの設計に不可欠である。いくつかのアプローチでは、安全と到達可能性に関する時間的仕様を満たすポリシーを形式的な抽象化を用いて合成する。我々の貢献は、ノイズ、不確実なパラメータ、外乱を含む連続状態モデルに対する新しい抽象的制御法である。
論文参考訳（メタデータ） (2022-10-12T07:57:03Z)
Robust Data-Driven Output Feedback Control via Bootstrapped Multiplicative Noise [1.0312968200748118]
本稿では,データ駆動型出力フィードバック制御アルゴリズムを提案する。提案手法の主な利点は、システム識別とロバストな制御設計手順の両方が不確実性表現を使用することである。提案したロバストなデータ駆動型出力フィードバック制御器は,数値実験により,一定の等価な制御器を大幅に上回ることを示す。
論文参考訳（メタデータ） (2022-05-10T18:47:14Z)
Regret-optimal Estimation and Control [52.28457815067461]
後悔最適推定器と後悔最適制御器は状態空間形式で導出可能であることを示す。非線形力学系に対するモデル予測制御(MPC)と拡張KalmanFilter(EKF)の残差最適類似性を提案する。
論文参考訳（メタデータ） (2021-06-22T23:14:21Z)
Probabilistic robust linear quadratic regulators with Gaussian processes [73.0364959221845]
ガウス過程(GP)のような確率モデルは、制御設計に続く使用のためのデータから未知の動的システムを学ぶための強力なツールです。本稿では、確率的安定性マージンに関して堅牢なコントローラを生成する線形化GPダイナミクスのための新しいコントローラ合成について述べる。
論文参考訳（メタデータ） (2021-05-17T08:36:18Z)
Adaptive Robust Model Predictive Control with Matched and Unmatched Uncertainty [28.10549712956161]
離散時間系のダイナミクスにおける大きな不確実性を扱うことができる学習ベースの堅牢な予測制御アルゴリズムを提案する。既存の学習に基づく予測制御アルゴリズムが大規模な不確実性が存在する場合の安全性を確保することができず、性能が大幅に向上する。
論文参考訳（メタデータ） (2021-04-16T17:47:02Z)
A Regret Minimization Approach to Iterative Learning Control [61.37088759497583]
我々は、標準的な不確実性の仮定を最悪の場合の後悔に置き換える新しいパフォーマンスメトリック、計画後悔を提案します。提案アルゴリズムがいくつかのベンチマークで既存の手法よりも優れているという理論的および実証的な証拠を提供します。
論文参考訳（メタデータ） (2021-02-26T13:48:49Z)
Adaptive Control and Regret Minimization in Linear Quadratic Gaussian (LQG) Setting [91.43582419264763]
我々は不確実性に直面した楽観主義の原理に基づく新しい強化学習アルゴリズムLqgOptを提案する。 LqgOptはシステムのダイナミクスを効率的に探索し、モデルのパラメータを信頼区間まで推定し、最も楽観的なモデルのコントローラをデプロイする。
論文参考訳（メタデータ） (2020-03-12T19:56:38Z)
Optimistic robust linear quadratic dual control [4.94950858749529]
本稿では, 一定の等価性の性能とロバスト性の実用性を両立させようとする二重制御戦略を提案する。この定式化は、パラメトリック不確実性の表現における構造を保ち、制御タスクにおいて最も重要となるパラメータにおける不確実性の減少をコントローラが目標とすることを可能にする。
論文参考訳（メタデータ） (2019-12-31T02:02:11Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。