論文の概要: A Framework for Adaptive Stabilisation of Nonlinear Stochastic Systems
- arxiv url: http://arxiv.org/abs/2511.17436v1
- Date: Fri, 21 Nov 2025 17:33:00 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-24 18:08:19.145605
- Title: A Framework for Adaptive Stabilisation of Nonlinear Stochastic Systems
- Title(参考訳): 非線形確率系の適応安定化のためのフレームワーク
- Authors: Seth Siriya, Jingge Zhu, Dragan Nešić, Ye Pu,
- Abstract要約: 線形パラメータ化不確実性を持つ離散時間非線形系に対する適応制御問題を考察する。
本稿では,一定の等価学習に基づく適応制御戦略を提案する。
状態空間全体が情報的であり、コントローラのファミリーが適切に選択されたパラメータでグローバルに安定化している場合、高い確率安定性を保証することが示される。
- 参考スコア(独自算出の注目度): 10.266286487433584
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We consider the adaptive control problem for discrete-time, nonlinear stochastic systems with linearly parameterised uncertainty. Assuming access to a parameterised family of controllers that can stabilise the system in a bounded set within an informative region of the state space when the parameter is well-chosen, we propose a certainty equivalence learning-based adaptive control strategy, and subsequently derive stability bounds on the closed-loop system that hold for some probabilities. We then show that if the entire state space is informative, and the family of controllers is globally stabilising with appropriately chosen parameters, high probability stability guarantees can be derived.
- Abstract(参考訳): 線形パラメータ化不確実性を持つ離散時間非線形確率系に対する適応制御問題を考察する。
パラメータが良好であるとき、状態空間の情報領域内の有界集合内のシステムを安定化可能なパラメータ化されたコントローラ群へのアクセスを仮定し、一定の等価学習に基づく適応制御戦略を提案し、その後、いくつかの確率を保った閉ループ系に安定性を導出する。
次に、状態空間全体が情報的であり、コントローラのファミリーが適切に選択されたパラメータでグローバルに安定化している場合、高い確率安定性を保証することができることを示す。
関連論文リスト
- Non-Asymptotic Bounds for Closed-Loop Identification of Unstable Nonlinear Stochastic Systems [5.102311052155507]
単軌道データから最小2乗パラメータを推定する問題を考える。
我々は,この領域で状態軌跡が進化する際の推定誤差について,漸近的でない保証を確立する。
状態空間全体が情報的であれば、エラーホールドが常に高い確率で保証される。
論文 参考訳(メタデータ) (2024-12-05T13:45:35Z) - Stability Bounds for Learning-Based Adaptive Control of Discrete-Time
Multi-Dimensional Stochastic Linear Systems with Input Constraints [3.8004168340068336]
本研究では,有界制御入力制約と非有界障害を有する離散時間多次元システムの適応安定化問題について考察する。
本稿では,オンラインパラメータ推定と飽和線形制御を組み合わせた等価制御手法を提案する。
論文 参考訳(メタデータ) (2023-04-02T16:38:13Z) - KCRL: Krasovskii-Constrained Reinforcement Learning with Guaranteed
Stability in Nonlinear Dynamical Systems [66.9461097311667]
形式的安定性を保証するモデルに基づく強化学習フレームワークを提案する。
提案手法は,特徴表現を用いて信頼区間までシステムダイナミクスを学習する。
我々は、KCRLが、基礎となる未知のシステムとの有限数の相互作用において安定化ポリシーを学ぶことが保証されていることを示す。
論文 参考訳(メタデータ) (2022-06-03T17:27:04Z) - Robust Stability of Neural-Network Controlled Nonlinear Systems with
Parametric Variability [2.0199917525888895]
ニューラルネットワーク制御非線形システムの安定性と安定化性の理論を考案する。
このような頑健な安定化NNコントローラの計算には、安定性保証トレーニング(SGT)も提案されている。
論文 参考訳(メタデータ) (2021-09-13T05:09:30Z) - Pointwise Feasibility of Gaussian Process-based Safety-Critical Control
under Model Uncertainty [77.18483084440182]
制御バリア関数(CBF)と制御リアプノフ関数(CLF)は、制御システムの安全性と安定性をそれぞれ強化するための一般的なツールである。
本稿では, CBF と CLF を用いた安全クリティカルコントローラにおいて, モデル不確実性に対処するためのガウスプロセス(GP)に基づくアプローチを提案する。
論文 参考訳(メタデータ) (2021-06-13T23:08:49Z) - Improper Learning with Gradient-based Policy Optimization [62.50997487685586]
未知のマルコフ決定過程に対して学習者がmベースコントローラを与えられる不適切な強化学習設定を考える。
制御器の不適切な混合のクラス上で動作する勾配に基づくアプローチを提案する。
論文 参考訳(メタデータ) (2021-02-16T14:53:55Z) - Gaussian Process-based Min-norm Stabilizing Controller for
Control-Affine Systems with Uncertain Input Effects and Dynamics [90.81186513537777]
本稿では,この問題の制御・アフィン特性を捉えた新しい化合物カーネルを提案する。
この結果の最適化問題は凸であることを示し、ガウス過程に基づく制御リャプノフ関数第二次コーンプログラム(GP-CLF-SOCP)と呼ぶ。
論文 参考訳(メタデータ) (2020-11-14T01:27:32Z) - Learning Stabilizing Controllers for Unstable Linear Quadratic
Regulators from a Single Trajectory [85.29718245299341]
線形2次制御器(LQR)としても知られる2次コストモデルの下で線形制御器を研究する。
楕円形不確実性集合内の全ての系を安定化させる制御器を構成する2つの異なる半定値プログラム(SDP)を提案する。
高い確率で安定化コントローラを迅速に識別できる効率的なデータ依存アルゴリズムであるtextsceXplorationを提案する。
論文 参考訳(メタデータ) (2020-06-19T08:58:57Z) - Adaptive Control and Regret Minimization in Linear Quadratic Gaussian
(LQG) Setting [91.43582419264763]
我々は不確実性に直面した楽観主義の原理に基づく新しい強化学習アルゴリズムLqgOptを提案する。
LqgOptはシステムのダイナミクスを効率的に探索し、モデルのパラメータを信頼区間まで推定し、最も楽観的なモデルのコントローラをデプロイする。
論文 参考訳(メタデータ) (2020-03-12T19:56:38Z) - Optimistic robust linear quadratic dual control [4.94950858749529]
本稿では, 一定の等価性の性能とロバスト性の実用性を両立させようとする二重制御戦略を提案する。
この定式化は、パラメトリック不確実性の表現における構造を保ち、制御タスクにおいて最も重要となるパラメータにおける不確実性の減少をコントローラが目標とすることを可能にする。
論文 参考訳(メタデータ) (2019-12-31T02:02:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。