論文の概要: Risk-Awareness in Learning Neural Controllers for Temporal Logic
Objectives
- arxiv url: http://arxiv.org/abs/2210.07439v1
- Date: Fri, 14 Oct 2022 00:49:08 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-17 17:54:12.803341
- Title: Risk-Awareness in Learning Neural Controllers for Temporal Logic
Objectives
- Title(参考訳): 時間的論理目的のための学習神経制御系におけるリスクアウェアネス
- Authors: Navid Hashemi, Xin Qin, Jyotirmoy V. Deshmukh, Georgios Fainekos,
Bardh Hoxha, Danil Prokhorov, Tomoya Yamaguchi
- Abstract要約: 閉ループ系が一定の制約を満たすような不確実性が存在する場合の制御器の問題を考える。
制御障壁関数(CBF)の枠組みを利用して,STL目的のCBFをアルゴリズム的に取得する。
クワッドロータや一輪車のような非線形制御のよく知られた難解な例に対して,本手法の有効性を実証する。
- 参考スコア(独自算出の注目度): 2.047329787828792
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: In this paper, we consider the problem of synthesizing a controller in the
presence of uncertainty such that the resulting closed-loop system satisfies
certain hard constraints while optimizing certain (soft) performance
objectives. We assume that the hard constraints encoding safety or
mission-critical task objectives are expressed using Signal Temporal Logic
(STL), while performance is quantified using standard cost functions on system
trajectories. In order to prioritize the satisfaction of the hard STL
constraints, we utilize the framework of control barrier functions (CBFs) and
algorithmically obtain CBFs for STL objectives. We assume that the controllers
are modeled using neural networks (NNs) and provide an optimization algorithm
to learn the optimal parameters for the NN controller that optimize the
performance at a user-specified robustness margin for the safety
specifications. We use the formalism of risk measures to evaluate the risk
incurred by the trade-off between robustness margin of the system and its
performance. We demonstrate the efficacy of our approach on well-known
difficult examples for nonlinear control such as a quad-rotor and a unicycle,
where the mission objectives for each system include hard timing constraints
and safety objectives.
- Abstract(参考訳): 本稿では,特定の(ソフトな)性能目標を最適化しながら,結果として得られる閉ループシステムが一定の厳しい制約を満たすような不確実性の存在下でコントローラを合成する問題を考える。
安全性やミッションクリティカルなタスク目的を符号化するハード制約を信号時相論理(stl)を用いて表現し、システム軌道の標準コスト関数を用いて性能を定量化する。
ハードSTL制約の満足度を優先するために、制御障壁関数(CBF)の枠組みを利用し、STL目的のためのCBFをアルゴリズム的に取得する。
我々は,ニューラルネットワーク(nns)を用いてコントローラをモデル化し,安全仕様のロバスト性マージンで性能を最適化するnnコントローラの最適パラメータを学習するための最適化アルゴリズムを提供すると仮定する。
我々は,システムのロバスト性マージンと性能のトレードオフによって生じるリスクを評価するために,リスク対策の形式主義を用いる。
提案手法は,クワッドローターや一輪車などの非線形制御の難解な例に対して,各システムのミッション目標にハードタイミング制約や安全性目標が含まれている場合の有効性を示す。
関連論文リスト
- Hard-Constrained Neural Networks with Universal Approximation Guarantees [5.3663546125491735]
HardNetは、モデルキャパシティを犠牲にすることなく、本質的に厳しい制約を満たすニューラルネットワークを構築するためのフレームワークである。
ニューラルネットワークの普遍近似能力はHardNetが保持していることを示す。
論文 参考訳(メタデータ) (2024-10-14T17:59:24Z) - Reinforcement Learning-based Receding Horizon Control using Adaptive Control Barrier Functions for Safety-Critical Systems [14.166970599802324]
最適制御法は、安全クリティカルな問題に対する解決策を提供するが、容易に難解になる。
モデル予測制御を利用した強化学習に基づく回帰水平制御手法を提案する。
我々は、コネクテッド・アンド・オートマチック・ビークルにおける自動マージ制御問題に適用し、本手法の有効性を検証した。
論文 参考訳(メタデータ) (2024-03-26T02:49:08Z) - Integrating DeepRL with Robust Low-Level Control in Robotic Manipulators for Non-Repetitive Reaching Tasks [0.24578723416255746]
ロボット工学では、現代の戦略は学習に基づくもので、複雑なブラックボックスの性質と解釈可能性の欠如が特徴である。
本稿では, 深部強化学習(DRL)に基づく衝突のない軌道プランナと, 自動調整型低レベル制御戦略を統合することを提案する。
論文 参考訳(メタデータ) (2024-02-04T15:54:03Z) - Safe Neural Control for Non-Affine Control Systems with Differentiable
Control Barrier Functions [58.19198103790931]
本稿では,非アフィン制御系における安全クリティカル制御の問題に対処する。
制御バリア関数(CBF)を用いて,状態制約と制御制約の2次コストの最適化を2次プログラムのシーケンス(QP)にサブ最適化できることが示されている。
我々は,高次CBFをニューラル常微分方程式に基づく学習モデルに差分CBFとして組み込んで,非アフィン制御系の安全性を保証する。
論文 参考訳(メタデータ) (2023-09-06T05:35:48Z) - Learning Robust and Correct Controllers from Signal Temporal Logic
Specifications Using BarrierNet [5.809331819510702]
我々は,STL定量的セマンティクスを利用して,ロバスト満足度の概念を定義した。
本研究では,STLのフラグメント内の式を満足させる訓練可能な高次制御バリア関数(HOCBF)を構築する。
我々は、他のニューラルネットワークパラメータとともにHOCBFをトレーニングし、コントローラの堅牢性をさらに向上させる。
論文 参考訳(メタデータ) (2023-04-12T21:12:15Z) - Safe-Critical Modular Deep Reinforcement Learning with Temporal Logic
through Gaussian Processes and Control Barrier Functions [3.5897534810405403]
強化学習(Reinforcement Learning, RL)は,現実のアプリケーションに対して限られた成功を収める,有望なアプローチである。
本稿では,複数の側面からなる学習型制御フレームワークを提案する。
ECBFをベースとしたモジュラーディープRLアルゴリズムは,ほぼ完全な成功率を達成し,高い確率で安全性を保護することを示す。
論文 参考訳(メタデータ) (2021-09-07T00:51:12Z) - Pointwise Feasibility of Gaussian Process-based Safety-Critical Control
under Model Uncertainty [77.18483084440182]
制御バリア関数(CBF)と制御リアプノフ関数(CLF)は、制御システムの安全性と安定性をそれぞれ強化するための一般的なツールである。
本稿では, CBF と CLF を用いた安全クリティカルコントローラにおいて, モデル不確実性に対処するためのガウスプロセス(GP)に基づくアプローチを提案する。
論文 参考訳(メタデータ) (2021-06-13T23:08:49Z) - Enforcing robust control guarantees within neural network policies [76.00287474159973]
本稿では、ニューラルネットワークによってパラメータ化され、ロバスト制御と同じ証明可能なロバスト性基準を適用した、一般的な非線形制御ポリシークラスを提案する。
提案手法は,複数の領域において有効であり,既存のロバスト制御法よりも平均ケース性能が向上し,(非ロバスト)深部RL法よりも最悪のケース安定性が向上した。
論文 参考訳(メタデータ) (2020-11-16T17:14:59Z) - Chance-Constrained Trajectory Optimization for Safe Exploration and
Learning of Nonlinear Systems [81.7983463275447]
学習に基づく制御アルゴリズムは、訓練のための豊富な監督を伴うデータ収集を必要とする。
本稿では,機会制約付き最適制御と動的学習とフィードバック制御を統合した安全な探索による最適動作計画のための新しいアプローチを提案する。
論文 参考訳(メタデータ) (2020-05-09T05:57:43Z) - Learning Control Barrier Functions from Expert Demonstrations [69.23675822701357]
制御障壁関数(CBF)に基づく安全な制御器合成のための学習に基づくアプローチを提案する。
最適化に基づくCBFの学習手法を解析し、基礎となる力学系のリプシッツ仮定の下で証明可能な安全保証を享受する。
私たちの知る限りでは、これらはデータから確実に安全な制御障壁関数を学習する最初の結果です。
論文 参考訳(メタデータ) (2020-04-07T12:29:06Z) - Certified Reinforcement Learning with Logic Guidance [78.2286146954051]
線形時間論理(LTL)を用いて未知の連続状態/動作マルコフ決定過程(MDP)のゴールを定式化できるモデルフリーなRLアルゴリズムを提案する。
このアルゴリズムは、トレースが仕様を最大確率で満たす制御ポリシーを合成することが保証される。
論文 参考訳(メタデータ) (2019-02-02T20:09:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。