論文の概要: Learning-enhanced robust controller synthesis with rigorous statistical
and control-theoretic guarantees
- arxiv url: http://arxiv.org/abs/2105.03397v1
- Date: Fri, 7 May 2021 17:11:33 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-10 12:22:28.458254
- Title: Learning-enhanced robust controller synthesis with rigorous statistical
and control-theoretic guarantees
- Title(参考訳): 厳密な統計的および制御論的保証を用いた学習強化型ロバストコントローラ合成
- Authors: Christian Fiedler, Carsten W. Scherer, Sebastian Trimpe
- Abstract要約: 事前のエンジニアリング知識の体系的な統合を可能にする学習強化ロバスト制御のためのフレームワークを提示する。
当社のアプローチは、さらなるデータによるパフォーマンス向上を実証していますが、保証は全期間にわたって維持されています。
- 参考スコア(独自算出の注目度): 4.738440567950876
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The combination of machine learning with control offers many opportunities,
in particular for robust control. However, due to strong safety and reliability
requirements in many real-world applications, providing rigorous statistical
and control-theoretic guarantees is of utmost importance, yet difficult to
achieve for learning-based control schemes. We present a general framework for
learning-enhanced robust control that allows for systematic integration of
prior engineering knowledge, is fully compatible with modern robust control and
still comes with rigorous and practically meaningful guarantees. Building on
the established Linear Fractional Representation and Integral Quadratic
Constraints framework, we integrate Gaussian Process Regression as a learning
component and state-of-the-art robust controller synthesis. In a concrete
robust control example, our approach is demonstrated to yield improved
performance with more data, while guarantees are maintained throughout.
- Abstract(参考訳): 機械学習と制御の組み合わせは多くの機会、特に堅牢な制御を提供する。
しかし、多くの現実世界のアプリケーションにおいて、安全性と信頼性の要求が強く、厳密な統計的および制御理論的な保証を提供することが最重要であり、学習ベースの制御スキームでは達成が困難である。
本稿では,事前の工学知識を体系的に統合し,近代的ロバスト制御と完全互換性を持ち,かつ,厳密かつ実質上有意義な保証をも備えた学習型ロバスト制御の汎用フレームワークを提案する。
確立された線形分数表現と積分二次制約フレームワークに基づいて,ガウス過程回帰を学習成分として統合し,最先端のロバスト制御合成を行う。
具体的ロバスト制御の例では、我々の手法はさらなるデータによる性能向上を実証し、保証は全期間にわたって維持される。
関連論文リスト
- A General Framework for Verification and Control of Dynamical Models via Certificate Synthesis [54.959571890098786]
システム仕様を符号化し、対応する証明書を定義するためのフレームワークを提供する。
コントローラと証明書を形式的に合成する自動化手法を提案する。
我々のアプローチは、ニューラルネットワークの柔軟性を利用して、制御のための安全な学習の幅広い分野に寄与する。
論文 参考訳(メタデータ) (2023-09-12T09:37:26Z) - Recursively Feasible Probabilistic Safe Online Learning with Control Barrier Functions [60.26921219698514]
CBFをベースとした安全クリティカルコントローラのモデル不確実性を考慮した再構成を提案する。
次に、結果の安全制御器のポイントワイズ実現可能性条件を示す。
これらの条件を利用して、イベントトリガーによるオンラインデータ収集戦略を考案する。
論文 参考訳(メタデータ) (2022-08-23T05:02:09Z) - Sample-efficient Safe Learning for Online Nonlinear Control with Control
Barrier Functions [35.9713619595494]
強化学習と連続非線形制御は、複雑なシーケンシャルな意思決定タスクの複数の領域にうまく展開されている。
学習過程の探索特性とモデル不確実性の存在を考えると、それらを安全クリティカルな制御タスクに適用することは困難である。
本稿では,オンライン制御タスクを対象とした,効率のよいエピソード型安全な学習フレームワークを提案する。
論文 参考訳(メタデータ) (2022-07-29T00:54:35Z) - Sparsity in Partially Controllable Linear Systems [56.142264865866636]
本研究では, 部分制御可能な線形力学系について, 基礎となる空間パターンを用いて検討する。
最適制御には無関係な状態変数を特徴付ける。
論文 参考訳(メタデータ) (2021-10-12T16:41:47Z) - Adaptive control of a mechatronic system using constrained residual
reinforcement learning [0.0]
本研究では,不確実な環境下での従来のコントローラの性能向上のための,シンプルで実用的で直感的な手法を提案する。
本手法は, 産業用モーションコントロールにおける従来の制御器が, 異なる動作条件に対応するために適応性よりも頑健であることを示す。
論文 参考訳(メタデータ) (2021-10-06T08:13:05Z) - Safe-Critical Modular Deep Reinforcement Learning with Temporal Logic
through Gaussian Processes and Control Barrier Functions [3.5897534810405403]
強化学習(Reinforcement Learning, RL)は,現実のアプリケーションに対して限られた成功を収める,有望なアプローチである。
本稿では,複数の側面からなる学習型制御フレームワークを提案する。
ECBFをベースとしたモジュラーディープRLアルゴリズムは,ほぼ完全な成功率を達成し,高い確率で安全性を保護することを示す。
論文 参考訳(メタデータ) (2021-09-07T00:51:12Z) - Closing the Closed-Loop Distribution Shift in Safe Imitation Learning [80.05727171757454]
模倣学習問題において,安全な最適化に基づく制御戦略を専門家として扱う。
我々は、実行時に安価に評価でき、専門家と同じ安全保証を確実に満足する学習されたポリシーを訓練する。
論文 参考訳(メタデータ) (2021-02-18T05:11:41Z) - Learning Robust Hybrid Control Barrier Functions for Uncertain Systems [68.30783663518821]
我々は,ロバストな安全を確保する制御則を合成する手段として,ロバストなハイブリッド制御障壁関数を提案する。
この概念に基づき,データからロバストなハイブリッド制御障壁関数を学習するための最適化問題を定式化する。
我々の技術は、モデル不確実性の対象となるコンパス歩行歩行者の魅力領域を安全に拡張することを可能にする。
論文 参考訳(メタデータ) (2021-01-16T17:53:35Z) - Enforcing robust control guarantees within neural network policies [76.00287474159973]
本稿では、ニューラルネットワークによってパラメータ化され、ロバスト制御と同じ証明可能なロバスト性基準を適用した、一般的な非線形制御ポリシークラスを提案する。
提案手法は,複数の領域において有効であり,既存のロバスト制御法よりも平均ケース性能が向上し,(非ロバスト)深部RL法よりも最悪のケース安定性が向上した。
論文 参考訳(メタデータ) (2020-11-16T17:14:59Z) - Imposing Robust Structured Control Constraint on Reinforcement Learning
of Linear Quadratic Regulator [0.0]
本稿では,分散学習制御の手法を編み出した汎用構造の設計について述べる。
方法論の開発には、強化学習(RL)と制御理論による十分な安定性と性能保証を併用した考え方を用いる。
6エージェントのマルチエージェントネットワーク上でのシミュレーションによる理論的結果の検証を行った。
論文 参考訳(メタデータ) (2020-11-12T00:31:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。