Fugu-MT 論文翻訳(概要): Stability Bounds for Learning-Based Adaptive Control of Discrete-Time Multi-Dimensional Stochastic Linear Systems with Input Constraints

論文の概要: Stability Bounds for Learning-Based Adaptive Control of Discrete-Time Multi-Dimensional Stochastic Linear Systems with Input Constraints

arxiv url: http://arxiv.org/abs/2304.00569v1
Date: Sun, 2 Apr 2023 16:38:13 GMT
ステータス: 翻訳完了
システム内更新日: 2023-04-04 17:19:52.176539
Title: Stability Bounds for Learning-Based Adaptive Control of Discrete-Time Multi-Dimensional Stochastic Linear Systems with Input Constraints
Title（参考訳）: 入力制約付き離散時間多次元確率線形システムの学習型適応制御のための安定性境界
Authors: Seth Siriya, Jingge Zhu, Dragan Ne\v{s}i\'c, Ye Pu
Abstract要約: 本研究では,有界制御入力制約と非有界障害を有する離散時間多次元システムの適応安定化問題について考察する。本稿では,オンラインパラメータ推定と飽和線形制御を組み合わせた等価制御手法を提案する。
参考スコア（独自算出の注目度）: 3.8004168340068336
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: We consider the problem of adaptive stabilization for discrete-time, multi-dimensional linear systems with bounded control input constraints and unbounded stochastic disturbances, where the parameters of the true system are unknown. To address this challenge, we propose a certainty-equivalent control scheme which combines online parameter estimation with saturated linear control. We establish the existence of a high probability stability bound on the closed-loop system, under additional assumptions on the system and noise processes. Finally, numerical examples are presented to illustrate our results.
Abstract（参考訳）: 実システムのパラメータが不明な有界制御入力制約と非有界確率障害を有する離散時間多次元線形系の適応安定化問題を考える。そこで本研究では,オンラインパラメータ推定と飽和線形制御を組み合わせた等価な制御手法を提案する。閉ループ系に束縛された高確率安定性の存在を,システムおよびノイズプロセスに関する追加の仮定の下で確立する。最後に, この結果を示す数値的な例を示す。

関連論文リスト

Learning Controlled Stochastic Differential Equations [61.82896036131116]
本研究では,非一様拡散を伴う連続多次元非線形微分方程式のドリフト係数と拡散係数の両方を推定する新しい手法を提案する。我々は、(L2)、(Linfty)の有限サンプル境界や、係数の正則性に適応する学習率を持つリスクメトリクスを含む、強力な理論的保証を提供する。当社のメソッドはオープンソースPythonライブラリとして利用可能です。
論文参考訳（メタデータ） (2024-11-04T11:09:58Z)
A least-square method for non-asymptotic identification in linear switching control [17.938732931331064]
基礎となる部分観測線形力学系は、既知の候補モデルの有限集合内にあることが知られている。線形最小二乗法の非漸近解析における最近の進歩を活用して、この問題の有限時間サンプル複雑性を特徴づける。基礎となるシステムの未知のパラメータを識別するデータ駆動型スイッチング戦略を提案する。
論文参考訳（メタデータ） (2024-04-11T20:55:38Z)
Distributionally Robust Policy and Lyapunov-Certificate Learning [13.38077406934971]
不確実なシステムに対する安定性を保証するコントローラの設計における重要な課題は、オンラインデプロイメント中のモデルパラメトリック不確実性の変化の正確な決定と適応である。我々は、リアプノフ証明書の単調な減少を保証するために、リアプノフ微分チャンス制約を分布的に頑健に定式化することで、この問題に取り組む。得られた閉ループシステムに対して、その平衡のグローバルな安定性は、アウト・オブ・ディストリビューションの不確実性があっても高い信頼性で証明できることを示す。
論文参考訳（メタデータ） (2024-04-03T18:57:54Z)
Formal Controller Synthesis for Markov Jump Linear Systems with Uncertain Dynamics [64.72260320446158]
マルコフジャンプ線形系に対する制御器の合成法を提案する。本手法は,MJLSの離散(モードジャンピング)と連続(確率線形)の両方の挙動を捉える有限状態抽象化に基づいている。本手法を複数の現実的なベンチマーク問題,特に温度制御と航空機の配送問題に適用する。
論文参考訳（メタデータ） (2022-12-01T17:36:30Z)
Learning-Based Adaptive Control for Stochastic Linear Systems with Input Constraints [3.8004168340068336]
そこで本研究では,加法的対象であるスカラー線形系の適応制御のための確実な等価性スキームを提案する。系が極端に安定であると仮定すると、閉ループ系状態の平均二乗有界性は証明される。
論文参考訳（メタデータ） (2022-09-15T04:49:06Z)
Robust stabilization of polytopic systems via fast and reliable neural network-based approximations [2.2299983745857896]
ポリトピック不確実性を有する線形システムに対する従来の安定化制御器の高速かつ信頼性の高いニューラルネットワーク(NN)に基づく近似設計について検討する。訓練された修正線形単位(ReLU)に基づく近似が従来の制御系に取って代わる場合、線形不確かさシステムの閉ループ安定性と性能を証明する。
論文参考訳（メタデータ） (2022-04-27T21:58:07Z)
Stability Verification in Stochastic Control Systems via Neural Network Supermartingales [17.558766911646263]
2つの新しい側面を持つ一般非線形制御問題に対するアプローチを提案する。我々は、A.s.asymptotic stabilityの証明にランキング・スーパーガレス(RSM)を使用し、ニューラルネットワークの学習方法を提案する。
論文参考訳（メタデータ） (2021-12-17T13:05:14Z)
Probabilistic robust linear quadratic regulators with Gaussian processes [73.0364959221845]
ガウス過程(GP)のような確率モデルは、制御設計に続く使用のためのデータから未知の動的システムを学ぶための強力なツールです。本稿では、確率的安定性マージンに関して堅牢なコントローラを生成する線形化GPダイナミクスのための新しいコントローラ合成について述べる。
論文参考訳（メタデータ） (2021-05-17T08:36:18Z)
Gaussian Process-based Min-norm Stabilizing Controller for Control-Affine Systems with Uncertain Input Effects and Dynamics [90.81186513537777]
本稿では,この問題の制御・アフィン特性を捉えた新しい化合物カーネルを提案する。この結果の最適化問題は凸であることを示し、ガウス過程に基づく制御リャプノフ関数第二次コーンプログラム(GP-CLF-SOCP)と呼ぶ。
論文参考訳（メタデータ） (2020-11-14T01:27:32Z)
Learning Stabilizing Controllers for Unstable Linear Quadratic Regulators from a Single Trajectory [85.29718245299341]
線形2次制御器(LQR)としても知られる2次コストモデルの下で線形制御器を研究する。楕円形不確実性集合内の全ての系を安定化させる制御器を構成する2つの異なる半定値プログラム(SDP)を提案する。高い確率で安定化コントローラを迅速に識別できる効率的なデータ依存アルゴリズムであるtextsceXplorationを提案する。
論文参考訳（メタデータ） (2020-06-19T08:58:57Z)
Adaptive Control and Regret Minimization in Linear Quadratic Gaussian (LQG) Setting [91.43582419264763]
我々は不確実性に直面した楽観主義の原理に基づく新しい強化学習アルゴリズムLqgOptを提案する。 LqgOptはシステムのダイナミクスを効率的に探索し、モデルのパラメータを信頼区間まで推定し、最も楽観的なモデルのコントローラをデプロイする。
論文参考訳（メタデータ） (2020-03-12T19:56:38Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。