論文の概要: On Regularizability and its Application to Online Control of Unstable
LTI Systems
- arxiv url: http://arxiv.org/abs/2006.00125v3
- Date: Wed, 19 Jan 2022 21:04:25 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-27 00:06:32.913468
- Title: On Regularizability and its Application to Online Control of Unstable
LTI Systems
- Title(参考訳): 不安定ltiシステムの規則化可能性とそのオンライン制御への応用
- Authors: Shahriar Talebi, Siavash Alemzadeh, Niyousha Rahimi and Mehran Mesbahi
- Abstract要約: 本稿では,初期安定化制御器やPE入力出力データに事前アクセスすることなく,未知の線形システムのオンライン制御について検討する。
入力行列にのみアクセス可能なデータガイドレギュレーション(Data-Guided Regulation, DGR)手法を提案する。
我々は、ランクワン更新によるDGRの計算性能をさらに向上させ、X-29航空機のオンライン制御におけるその実用性を実証する。
- 参考スコア(独自算出の注目度): 0.5735035463793007
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Learning, say through direct policy updates, often requires assumptions such
as knowing a priori that the initial policy (gain) is stabilizing, or
persistently exciting (PE) input-output data, is available. In this paper, we
examine online regulation of (possibly unstable) partially unknown linear
systems with no prior access to an initial stabilizing controller nor PE
input-output data; we instead leverage the knowledge of the input matrix for
online regulation. First, we introduce and characterize the notion of
"regularizability" for linear systems that gauges the extent by which a system
can be regulated in finite-time in contrast to its asymptotic behavior
(commonly characterized by stabilizability/controllability). Next, having
access only to the input matrix, we propose the Data-Guided Regulation (DGR)
synthesis procedure that -- as its name suggests -- regulates the underlying
state while also generating informative data that can subsequently be used for
data-driven stabilization or system identification. We further improve the
computational performance of DGR via a rank-one update and demonstrate its
utility in online regulation of the X-29 aircraft.
- Abstract(参考訳): 直接ポリシー更新を通じて学ぶには、初期ポリシー(gain)が安定化しているか、あるいは持続的にエキサイティングな(pe)入力出力データがあることを事前に知るといった仮定が必要となる。
本稿では,初期安定化制御器やPE入力出力データへの事前アクセスのない(不安定な)部分未知の線形システムのオンライン制御について検討し,その代わりに入力行列の知識をオンライン制御に活用する。
まず,線形系に対する「正規化可能性」の概念を導入し,その漸近的挙動(一般に安定化性/制御性によって特徴づけられる)と対照的に,系が有限時間で制御できる範囲を測る。
次に、入力行列にのみアクセス可能なデータガイドレギュレーション(DGR)合成手順を提案し、データ駆動安定化やシステム識別に使用可能な情報データを生成する。
さらに,ランクワンアップデートによりdgrの計算性能をさらに向上させ,x-29航空機のオンライン制御における有用性を示す。
関連論文リスト
- Implicit Bias of Policy Gradient in Linear Quadratic Control: Extrapolation to Unseen Initial States [52.56827348431552]
勾配降下はしばしば暗黙のバイアスを示し、目に見えないデータに優れたパフォーマンスをもたらす。
本稿では,初期状態に対する外挿の観点から,政策勾配の暗黙バイアスを理論的に検討する。
論文 参考訳(メタデータ) (2024-02-12T18:41:31Z) - Data-Guided Regulator for Adaptive Nonlinear Control [0.27195102129094995]
本稿では,複雑な非線形システムに対するデータ駆動型フィードバックコントローラの問題に対処する。
目標は、直接的なポリシー更新を通じて、システム状態の有限時間規制を達成することである。
論文 参考訳(メタデータ) (2023-11-20T23:02:39Z) - Non-asymptotic System Identification for Linear Systems with Nonlinear
Policies [17.420749574975368]
本稿では,一般非線形および/又は時変ポリシーの下での線形系に対する単一軌道系同定問題について考察する。
非線形および/または時間変化のポリシーによってデータ軌跡が生成されるとき、最小二乗推定のために非漸近誤差を与える。
論文 参考訳(メタデータ) (2023-06-17T15:05:59Z) - LMI-based Data-Driven Robust Model Predictive Control [0.1473281171535445]
入力制約と状態制約を考慮したデータ駆動型ロバストな線形行列不等式モデル予測制御手法を提案する。
コントローラは閉ループシステムを安定化し、制約満足度を保証する。
論文 参考訳(メタデータ) (2023-03-08T18:20:06Z) - Learning-Based Adaptive Control for Stochastic Linear Systems with Input
Constraints [3.8004168340068336]
そこで本研究では,加法的対象であるスカラー線形系の適応制御のための確実な等価性スキームを提案する。
系が極端に安定であると仮定すると、閉ループ系状態の平均二乗有界性は証明される。
論文 参考訳(メタデータ) (2022-09-15T04:49:06Z) - Stable Online Control of Linear Time-Varying Systems [49.41696101740271]
COCO-LQは、大規模なLTVシステムの入出力安定性を保証する効率的なオンライン制御アルゴリズムである。
COCO-LQの性能を実証実験とパワーシステム周波数制御の両例で実証した。
論文 参考訳(メタデータ) (2021-04-29T06:18:49Z) - Controlling nonlinear dynamical systems into arbitrary states using
machine learning [77.34726150561087]
機械学習(ML)を活用した,新しい完全データ駆動制御方式を提案する。
最近開発されたMLに基づく複雑なシステムの予測機能により、非線形系は任意の初期状態から来る任意の動的対象状態に留まることが証明された。
必要なデータ量が少なく,柔軟性の高いコントロールスキームを備えることで,工学から医学まで幅広い応用の可能性について簡単に議論する。
論文 参考訳(メタデータ) (2021-02-23T16:58:26Z) - The Impact of Data on the Stability of Learning-Based Control- Extended
Version [63.97366815968177]
本稿では,Lyapunovをベースとした,認証制御性能に対するデータの影響の定量化手法を提案する。
ガウス過程を通じて未知系の力学をモデル化することにより、モデルの不確実性と安定性条件の満足度の間の相互関係を決定できる。
論文 参考訳(メタデータ) (2020-11-20T19:10:01Z) - Learning Stabilizing Controllers for Unstable Linear Quadratic
Regulators from a Single Trajectory [85.29718245299341]
線形2次制御器(LQR)としても知られる2次コストモデルの下で線形制御器を研究する。
楕円形不確実性集合内の全ての系を安定化させる制御器を構成する2つの異なる半定値プログラム(SDP)を提案する。
高い確率で安定化コントローラを迅速に識別できる効率的なデータ依存アルゴリズムであるtextsceXplorationを提案する。
論文 参考訳(メタデータ) (2020-06-19T08:58:57Z) - Active Learning for Nonlinear System Identification with Guarantees [102.43355665393067]
状態遷移が既知の状態-作用対の特徴埋め込みに線形に依存する非線形力学系のクラスについて検討する。
そこで本稿では, トラジェクティブ・プランニング, トラジェクティブ・トラッキング, システムの再推定という3つのステップを繰り返すことで, この問題を解決するためのアクティブ・ラーニング・アプローチを提案する。
本手法は, 非線形力学系を標準線形回帰の統計速度と同様, パラメトリック速度で推定する。
論文 参考訳(メタデータ) (2020-06-18T04:54:11Z) - Learning Constrained Adaptive Differentiable Predictive Control Policies
With Guarantees [1.1086440815804224]
本稿では,線形システムに対する制約付きニューラルコントロールポリシーの学習方法として,微分可能予測制御(DPC)を提案する。
我々は,モデル予測制御(MPC)損失関数の逆伝搬と,微分可能な閉ループ系力学モデルによるペナルティの制約により,直接的な政策勾配を求めるために,自動微分を用いる。
論文 参考訳(メタデータ) (2020-04-23T14:24:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。