Fugu-MT 論文翻訳(概要): Stability Verification in Stochastic Control Systems via Neural Network Supermartingales

論文の概要: Stability Verification in Stochastic Control Systems via Neural Network Supermartingales

arxiv url: http://arxiv.org/abs/2112.09495v1
Date: Fri, 17 Dec 2021 13:05:14 GMT
ステータス: 翻訳完了
システム内更新日: 2021-12-20 15:46:28.960014
Title: Stability Verification in Stochastic Control Systems via Neural Network Supermartingales
Title（参考訳）: ニューラルネットワークによる確率制御系の安定性検証
Authors: Mathias Lechner, {\DJ}or{\dj}e \v{Z}ikeli\'c, Krishnendu Chatterjee, Thomas A. Henzinger
Abstract要約: 2つの新しい側面を持つ一般非線形制御問題に対するアプローチを提案する。我々は、A.s.asymptotic stabilityの証明にランキング・スーパーガレス(RSM)を使用し、ニューラルネットワークの学習方法を提案する。
参考スコア（独自算出の注目度）: 17.558766911646263
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: We consider the problem of formally verifying almost-sure (a.s.) asymptotic stability in discrete-time nonlinear stochastic control systems. While verifying stability in deterministic control systems is extensively studied in the literature, verifying stability in stochastic control systems is an open problem. The few existing works on this topic either consider only specialized forms of stochasticity or make restrictive assumptions on the system, rendering them inapplicable to learning algorithms with neural network policies. In this work, we present an approach for general nonlinear stochastic control problems with two novel aspects: (a) instead of classical stochastic extensions of Lyapunov functions, we use ranking supermartingales (RSMs) to certify a.s.~asymptotic stability, and (b) we present a method for learning neural network RSMs. We prove that our approach guarantees a.s.~asymptotic stability of the system and provides the first method to obtain bounds on the stabilization time, which stochastic Lyapunov functions do not. Finally, we validate our approach experimentally on a set of nonlinear stochastic reinforcement learning environments with neural network policies.
Abstract（参考訳）: 離散時間非線形確率制御系における近距離漸近安定性を正式に検証する問題を考察する。決定論的制御系の安定性の検証は文献で広く研究されているが、確率的制御システムの安定性の検証はオープンな問題である。このトピックに関する既存の著作は、特殊形式の確率性のみを考慮するか、システムの制約的な仮定を行うかのどちらかであり、ニューラルネットワークポリシーを用いた学習アルゴリズムには適用できない。本稿では, 2つの新しい側面を持つ一般非線形確率制御問題に対するアプローチを提案する。 (a) リアプノフ関数の古典的確率拡張の代わりに、a.s.~漸近安定性の証明にランク付きスーパーマーチンガル(RSMs)を用いる。 b)ニューラルネットワークRSMの学習方法を提案する。我々は,本手法がシステムの漸近安定性を保証することを証明し,確率的リャプノフ関数が持たない安定化時間の境界を求める最初の方法を提供する。最後に,ニューラルネットワークポリシーを用いた非線形確率強化学習環境について実験的検討を行った。

関連論文リスト

Learning Controlled Stochastic Differential Equations [61.82896036131116]
本研究では,非一様拡散を伴う連続多次元非線形微分方程式のドリフト係数と拡散係数の両方を推定する新しい手法を提案する。我々は、(L2)、(Linfty)の有限サンプル境界や、係数の正則性に適応する学習率を持つリスクメトリクスを含む、強力な理論的保証を提供する。当社のメソッドはオープンソースPythonライブラリとして利用可能です。
論文参考訳（メタデータ） (2024-11-04T11:09:58Z)
Stochastic Reinforcement Learning with Stability Guarantees for Control of Unknown Nonlinear Systems [6.571209126567701]
本稿では,力学の局所線形表現を学習することでシステムを安定化する強化学習アルゴリズムを提案する。本稿では,いくつかの高次元力学系におけるアルゴリズムの有効性を示す。
論文参考訳（メタデータ） (2024-09-12T20:07:54Z)
Lyapunov-stable Neural Control for State and Output Feedback: A Novel Formulation [67.63756749551924]
学習ベースのニューラルネットワーク(NN)制御ポリシは、ロボット工学と制御の幅広いタスクにおいて、印象的な経験的パフォーマンスを示している。非線形力学系を持つNNコントローラのトラクション領域(ROA)に対するリアプノフ安定性の保証は困難である。我々は、高速な経験的ファルシフィケーションと戦略的正則化を用いて、Lyapunov証明書とともにNNコントローラを学習するための新しいフレームワークを実証する。
論文参考訳（メタデータ） (2024-04-11T17:49:15Z)
Neural Lyapunov Control of Unknown Nonlinear Systems with Stability Guarantees [4.786698731084036]
本稿では,未知の非線形システムをニューラルネットワークで安定化させ,ニューラルリアプノフ関数を学習するための学習フレームワークを提案する。未知の非線形システムに対する閉ループ安定性の観点から,提案手法の理論的保証を提供する。
論文参考訳（メタデータ） (2022-06-04T05:57:31Z)
KCRL: Krasovskii-Constrained Reinforcement Learning with Guaranteed Stability in Nonlinear Dynamical Systems [66.9461097311667]
形式的安定性を保証するモデルに基づく強化学習フレームワークを提案する。提案手法は,特徴表現を用いて信頼区間までシステムダイナミクスを学習する。我々は、KCRLが、基礎となる未知のシステムとの有限数の相互作用において安定化ポリシーを学ぶことが保証されていることを示す。
論文参考訳（メタデータ） (2022-06-03T17:27:04Z)
Bayesian Algorithms Learn to Stabilize Unknown Continuous-Time Systems [0.0]
線形力学系は、不確実な力学を持つ植物の学習に基づく制御のための標準モデルである。この目的のための信頼性の高い安定化手順は、不安定なデータから有効に学習し、有限時間でシステムを安定化させることができない。本研究では,未知の連続時間線形系を安定化する新しい学習アルゴリズムを提案する。
論文参考訳（メタデータ） (2021-12-30T15:31:35Z)
Robust Stability of Neural-Network Controlled Nonlinear Systems with Parametric Variability [2.0199917525888895]
ニューラルネットワーク制御非線形システムの安定性と安定化性の理論を考案する。このような頑健な安定化NNコントローラの計算には、安定性保証トレーニング(SGT)も提案されている。
論文参考訳（メタデータ） (2021-09-13T05:09:30Z)
Recurrent Neural Network Controllers Synthesis with Stability Guarantees for Partially Observed Systems [6.234005265019845]
本稿では、不確実な部分観測システムのための動的制御系として、リカレントニューラルネットワーク(RNN)の重要なクラスを考える。本稿では、再パラメータ化空間における安定性条件を反復的に強制する計画的ポリシー勾配法を提案する。数値実験により,本手法は,より少ないサンプルを用いて制御器の安定化を学習し,政策勾配よりも高い最終性能を達成することを示す。
論文参考訳（メタデータ） (2021-09-08T18:21:56Z)
Probabilistic robust linear quadratic regulators with Gaussian processes [73.0364959221845]
ガウス過程(GP)のような確率モデルは、制御設計に続く使用のためのデータから未知の動的システムを学ぶための強力なツールです。本稿では、確率的安定性マージンに関して堅牢なコントローラを生成する線形化GPダイナミクスのための新しいコントローラ合成について述べる。
論文参考訳（メタデータ） (2021-05-17T08:36:18Z)
Gaussian Process-based Min-norm Stabilizing Controller for Control-Affine Systems with Uncertain Input Effects and Dynamics [90.81186513537777]
本稿では,この問題の制御・アフィン特性を捉えた新しい化合物カーネルを提案する。この結果の最適化問題は凸であることを示し、ガウス過程に基づく制御リャプノフ関数第二次コーンプログラム(GP-CLF-SOCP)と呼ぶ。
論文参考訳（メタデータ） (2020-11-14T01:27:32Z)
Fine-Grained Analysis of Stability and Generalization for Stochastic Gradient Descent [55.85456985750134]
我々は,SGDの反復的リスクによって制御される新しい境界を開発する,平均モデル安定性と呼ばれる新しい安定性尺度を導入する。これにより、最良のモデルの振舞いによって一般化境界が得られ、低雑音環境における最初の既知の高速境界が導かれる。我々の知る限りでは、このことはSGDの微分不能な損失関数でさえも初めて知られている安定性と一般化を与える。
論文参考訳（メタデータ） (2020-06-15T06:30:19Z)
Adaptive Control and Regret Minimization in Linear Quadratic Gaussian (LQG) Setting [91.43582419264763]
我々は不確実性に直面した楽観主義の原理に基づく新しい強化学習アルゴリズムLqgOptを提案する。 LqgOptはシステムのダイナミクスを効率的に探索し、モデルのパラメータを信頼区間まで推定し、最も楽観的なモデルのコントローラをデプロイする。
論文参考訳（メタデータ） (2020-03-12T19:56:38Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。