論文の概要: Safe Control and Learning Using Generalized Action Governor
- arxiv url: http://arxiv.org/abs/2211.12628v1
- Date: Tue, 22 Nov 2022 23:25:25 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-24 16:08:08.305737
- Title: Safe Control and Learning Using Generalized Action Governor
- Title(参考訳): 一般化アクションガバナを用いた安全制御と学習
- Authors: Nan Li, Yutong Li, Ilya Kolmanovsky, Anouck Girard, H. Eric Tseng,
Dimitar Filev
- Abstract要約: 本稿では,厳密な制約処理能力を備えた名目クローズドループシステムを強化するための監督スキームである一般行動管理者を紹介する。
リアルタイムデータを用いた制御パラメータを安全に進化させ,不確実なシステムの性能を向上させることを目的とした,安全なオンライン学習への応用について論じる。
- 参考スコア(独自算出の注目度): 5.7406123763046955
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This paper introduces the Generalized Action Governor, which is a supervisory
scheme for augmenting a nominal closed-loop system with the capability of
strictly handling constraints. After presenting its theory for general systems
and introducing tailored design approaches for linear and discrete systems, we
discuss its application to safe online learning, which aims to safely evolve
control parameters using real-time data to improve performance for uncertain
systems. In particular, we propose two safe learning algorithms based on
integration of reinforcement learning/data-driven Koopman operator-based
control with the generalized action governor. The developments are illustrated
with a numerical example.
- Abstract(参考訳): 本稿では,厳密な制約処理能力を備えた名目クローズドループシステムを強化するための監督スキームである一般行動管理者を紹介する。
汎用システムに対するその理論を提示し,線形および離散システムのための最適化設計アプローチを導入した後,リアルタイムデータを用いた制御パラメータを安全に発展させ,不確実性システムの性能を向上させることを目的とした,安全なオンライン学習への応用について論じる。
特に,強化学習/データ駆動型koopmanオペレータベースの制御と汎用アクションガバナの統合に基づく2つの安全な学習アルゴリズムを提案する。
発展は数値的な例で示される。
関連論文リスト
- Nonparametric Control-Koopman Operator Learning: Flexible and Scalable Models for Prediction and Control [2.7784144651669704]
非線形制御-アフィン系のクープマン演算子表現を学習するための非パラメトリックフレームワークを提案する。
また、ランダムなプロジェクションを活用することにより、制御クープマン作用素推定器のスケーラビリティも向上する。
予測タスクと制御タスクの両方において,新しいcKORアプローチの有効性を実証した。
論文 参考訳(メタデータ) (2024-05-12T15:46:52Z) - Decentralized Event-Triggered Online Learning for Safe Consensus of
Multi-Agent Systems with Gaussian Process Regression [3.405252606286664]
本稿では,補助力学によって強化された,学習に基づく分散制御法を提案する。
予測性能を継続的に向上するために、分散イベントトリガー機構を備えたデータ効率の高いオンライン学習戦略を提案する。
提案手法の有効性を示すため,従来の分散制御法とオフライン学習法を対比して比較分析を行った。
論文 参考訳(メタデータ) (2024-02-05T16:41:17Z) - In-Distribution Barrier Functions: Self-Supervised Policy Filters that
Avoid Out-of-Distribution States [84.24300005271185]
本稿では,任意の参照ポリシーをラップした制御フィルタを提案する。
本手法は、トップダウンとエゴセントリックの両方のビュー設定を含むシミュレーション環境における2つの異なるビズモータ制御タスクに有効である。
論文 参考訳(メタデータ) (2023-01-27T22:28:19Z) - Robust Action Governor for Uncertain Piecewise Affine Systems with
Non-convex Constraints and Safe Reinforcement Learning [5.7406123763046955]
Action Governorは、制御アクションを監視し、調整し、ポイントインタイムの状態と制約として表現された安全仕様を強制する名目制御ループへのアドオンスキームである。
非時間付加的不確実性として表現できるシステムのロバスト行動知事(RAG)を紹介する。
この開発により、環境の安全なリアルタイム進化と、システムパラメータの変化への適応が可能になる。
論文 参考訳(メタデータ) (2022-07-17T17:31:07Z) - Learning Robust Output Control Barrier Functions from Safe Expert Demonstrations [50.37808220291108]
本稿では,専門家によるデモンストレーションの部分的な観察から,安全な出力フィードバック制御法を考察する。
まず,安全性を保証する手段として,ロバスト出力制御バリア関数(ROCBF)を提案する。
次に、安全なシステム動作を示す専門家による実証からROCBFを学習するための最適化問題を定式化する。
論文 参考訳(メタデータ) (2021-11-18T23:21:00Z) - Sparsity in Partially Controllable Linear Systems [56.142264865866636]
本研究では, 部分制御可能な線形力学系について, 基礎となる空間パターンを用いて検討する。
最適制御には無関係な状態変数を特徴付ける。
論文 参考訳(メタデータ) (2021-10-12T16:41:47Z) - Adaptive control of a mechatronic system using constrained residual
reinforcement learning [0.0]
本研究では,不確実な環境下での従来のコントローラの性能向上のための,シンプルで実用的で直感的な手法を提案する。
本手法は, 産業用モーションコントロールにおける従来の制御器が, 異なる動作条件に対応するために適応性よりも頑健であることを示す。
論文 参考訳(メタデータ) (2021-10-06T08:13:05Z) - Closing the Closed-Loop Distribution Shift in Safe Imitation Learning [80.05727171757454]
模倣学習問題において,安全な最適化に基づく制御戦略を専門家として扱う。
我々は、実行時に安価に評価でき、専門家と同じ安全保証を確実に満足する学習されたポリシーを訓練する。
論文 参考訳(メタデータ) (2021-02-18T05:11:41Z) - Learning Hybrid Control Barrier Functions from Data [66.37785052099423]
ハイブリッドシステムの安全な制御法則を得るための体系的なツールが欠如していることから,データから確実に安全な制御法則を学習するための最適化ベースのフレームワークを提案する。
特に、システムダイナミクスが知られており、安全なシステム動作を示すデータが利用可能であるような設定を仮定する。
論文 参考訳(メタデータ) (2020-11-08T23:55:02Z) - Control Barrier Functions for Unknown Nonlinear Systems using Gaussian
Processes [17.870440210358847]
本稿では,安全制約を確保しつつ,未知の非線形システムに対する制御器の合成に焦点をあてる。
学習段階において、未知の制御アフィン非線形力学を学習するために、学習したモデルの精度に統計的に拘束されるように、データ駆動方式を用いる。
第2の制御器合成ステップでは,学習モデルの不確実性を考慮した制御障壁関数の計算方式を開発する。
論文 参考訳(メタデータ) (2020-10-12T16:12:52Z) - Anticipating the Long-Term Effect of Online Learning in Control [75.6527644813815]
AntLerは、学習を予想する学習ベースの制御法則の設計アルゴリズムである。
AntLer は確率 1 と任意に最適な解を近似することを示す。
論文 参考訳(メタデータ) (2020-07-24T07:00:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。