論文の概要: Learning Robust and Correct Controllers from Signal Temporal Logic
Specifications Using BarrierNet
- arxiv url: http://arxiv.org/abs/2304.06160v1
- Date: Wed, 12 Apr 2023 21:12:15 GMT
- ステータス: 処理完了
- システム内更新日: 2023-04-14 16:20:01.798236
- Title: Learning Robust and Correct Controllers from Signal Temporal Logic
Specifications Using BarrierNet
- Title(参考訳): BarrierNetを用いた信号時間論理仕様からのロバストと正しいコントローラの学習
- Authors: Wenliang Liu, Wei Xiao, Calin Belta
- Abstract要約: 我々は,STL定量的セマンティクスを利用して,ロバスト満足度の概念を定義した。
本研究では,STLのフラグメント内の式を満足させる訓練可能な高次制御バリア関数(HOCBF)を構築する。
我々は、他のニューラルネットワークパラメータとともにHOCBFをトレーニングし、コントローラの堅牢性をさらに向上させる。
- 参考スコア(独自算出の注目度): 5.809331819510702
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In this paper, we consider the problem of learning a neural network
controller for a system required to satisfy a Signal Temporal Logic (STL)
specification. We exploit STL quantitative semantics to define a notion of
robust satisfaction. Guaranteeing the correctness of a neural network
controller, i.e., ensuring the satisfaction of the specification by the
controlled system, is a difficult problem that received a lot of attention
recently. We provide a general procedure to construct a set of trainable High
Order Control Barrier Functions (HOCBFs) enforcing the satisfaction of formulas
in a fragment of STL. We use the BarrierNet, implemented by a differentiable
Quadratic Program (dQP) with HOCBF constraints, as the last layer of the neural
network controller, to guarantee the satisfaction of the STL formulas. We train
the HOCBFs together with other neural network parameters to further improve the
robustness of the controller. Simulation results demonstrate that our approach
ensures satisfaction and outperforms existing algorithms.
- Abstract(参考訳): 本稿では,信号時相論理(stl)仕様を満たすのに必要なシステムのためのニューラルネットワーク制御系を学習する問題を考察する。
我々は,stl量的意味論を用いてロバスト満足度の概念を定義する。
ニューラルネットワークコントローラの正確性を保証すること、すなわち、制御されたシステムによる仕様の満足度を保証することは、最近多くの注目を集めている難しい問題である。
stlの断片内の公式の満足度を高めるための訓練可能な高次制御障壁関数(hocbf)のセットを構築するための一般的な手順を提供する。
我々は、ニューラルネットワークコントローラの最終層としてhocbf制約付き微分可能二次プログラム(dqp)によって実装されたバリアネットを用いて、stl公式の満足度を保証する。
我々は、他のニューラルネットワークパラメータとともにHOCBFをトレーニングし、コントローラの堅牢性をさらに向上させる。
シミュレーションの結果,提案手法は既存のアルゴリズムよりも満足度が高く,優れることがわかった。
関連論文リスト
- Structured Deep Neural Network-Based Backstepping Trajectory Tracking Control for Lagrangian Systems [9.61674297336072]
提案したコントローラは、任意の互換性のあるニューラルネットワークパラメータに対してクローズループ安定性を確保することができる。
モデル近似誤差や外乱の存在下では、閉ループ安定性と追従制御性能が保証されることが示されている。
論文 参考訳(メタデータ) (2024-03-01T09:09:37Z) - Robust Stochastically-Descending Unrolled Networks [85.6993263983062]
Deep Unrolling(ディープ・アンローリング)は、トレーニング可能なニューラルネットワークの層に切り捨てられた反復アルゴリズムをアンロールする、新たな学習最適化手法である。
アンロールネットワークの収束保証と一般化性は、いまだにオープンな理論上の問題であることを示す。
提案した制約の下で訓練されたアンロールアーキテクチャを2つの異なるアプリケーションで数値的に評価する。
論文 参考訳(メタデータ) (2023-12-25T18:51:23Z) - Sub-linear Regret in Adaptive Model Predictive Control [56.705978425244496]
本稿では,STT-MPC (Self-Tuning tube-based Model Predictive Control) について述べる。
システム力学を最初に認識したアルゴリズムと比較して,アルゴリズムの後悔を解析する。
論文 参考訳(メタデータ) (2023-10-07T15:07:10Z) - Signal Temporal Logic Neural Predictive Control [15.540490027770621]
本稿では,信号時相論理(STL)に規定される要件を満たすためにニューラルネットワークコントローラを学習する手法を提案する。
我々のコントローラは、トレーニングにおけるSTLロバストネススコアを最大化するために軌道のロールアウトを学習する。
バックアップポリシは、コントローラがフェールした場合の安全性を保証するように設計されています。
論文 参考訳(メタデータ) (2023-09-10T20:31:25Z) - Safe Neural Control for Non-Affine Control Systems with Differentiable
Control Barrier Functions [58.19198103790931]
本稿では,非アフィン制御系における安全クリティカル制御の問題に対処する。
制御バリア関数(CBF)を用いて,状態制約と制御制約の2次コストの最適化を2次プログラムのシーケンス(QP)にサブ最適化できることが示されている。
我々は,高次CBFをニューラル常微分方程式に基づく学習モデルに差分CBFとして組み込んで,非アフィン制御系の安全性を保証する。
論文 参考訳(メタデータ) (2023-09-06T05:35:48Z) - A Neurosymbolic Approach to the Verification of Temporal Logic
Properties of Learning enabled Control Systems [0.0]
本稿では,一般的なSTL仕様に対するニューラルネットワーク(NN)コントローラの検証モデルを提案する。
また、一般的なアクティベーション機能を持つニューラルネットワークコントローラに対する新しいアプローチを提案する。
論文 参考訳(メタデータ) (2023-03-07T04:08:33Z) - Neural Controller Synthesis for Signal Temporal Logic Specifications
Using Encoder-Decoder Structured Networks [0.7874708385247353]
ニューラルネットワーク(NN)を用いた信号時間論理(STL)仕様の制御合成法を提案する。
我々は3つのNN構造(シーケンシャル、ツリー構造、グラフ構造NN)を考える。
全てのモデルパラメータは、STLの公式の定量的意味論として知られる期待されるロバスト性を最大化するために、エンドツーエンドで訓練される。
論文 参考訳(メタデータ) (2022-12-10T04:44:25Z) - Risk-Awareness in Learning Neural Controllers for Temporal Logic
Objectives [2.047329787828792]
閉ループ系が一定の制約を満たすような不確実性が存在する場合の制御器の問題を考える。
制御障壁関数(CBF)の枠組みを利用して,STL目的のCBFをアルゴリズム的に取得する。
クワッドロータや一輪車のような非線形制御のよく知られた難解な例に対して,本手法の有効性を実証する。
論文 参考訳(メタデータ) (2022-10-14T00:49:08Z) - Power Control for a URLLC-enabled UAV system incorporated with DNN-Based
Channel Estimation [82.16169603954663]
この手紙は、ディープニューラルネットワーク(DNN)に基づくチャネル推定を組み込んだ超信頼性低遅延通信(URLLC)有効無人航空機(UAV)システムの電力制御に関するものである。
論文 参考訳(メタデータ) (2020-11-14T02:31:04Z) - Toward fast and accurate human pose estimation via soft-gated skip
connections [97.06882200076096]
本稿では,高精度かつ高効率な人間のポーズ推定について述べる。
我々は、最先端技術よりも精度と効率を両立させる文脈において、この設計選択を再分析する。
本モデルでは,MPII と LSP のデータセットから最先端の結果が得られる。
論文 参考訳(メタデータ) (2020-02-25T18:51:51Z) - Certified Reinforcement Learning with Logic Guidance [78.2286146954051]
線形時間論理(LTL)を用いて未知の連続状態/動作マルコフ決定過程(MDP)のゴールを定式化できるモデルフリーなRLアルゴリズムを提案する。
このアルゴリズムは、トレースが仕様を最大確率で満たす制御ポリシーを合成することが保証される。
論文 参考訳(メタデータ) (2019-02-02T20:09:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。