論文の概要: On the Sample Complexity of Decentralized Linear Quadratic Regulator
with Partially Nested Information Structure
- arxiv url: http://arxiv.org/abs/2110.07112v1
- Date: Thu, 14 Oct 2021 01:48:07 GMT
- ステータス: 処理完了
- システム内更新日: 2021-10-15 15:28:37.198583
- Title: On the Sample Complexity of Decentralized Linear Quadratic Regulator
with Partially Nested Information Structure
- Title(参考訳): 部分ネスト情報構造を持つ分散線形二次レギュレータのサンプル複雑性について
- Authors: Lintao Ye, Hao Zhu, Vijay Gupta
- Abstract要約: 部分ネスト情報構造を持つ分散状態フィードバック線形二次制御における制御ポリシー設計の問題点について検討する。
最小二乗推定を用いて,有限長の単一系軌道から未知の系モデルを推定する。
制御ポリシと最適分散制御ポリシのサブ最適性ギャップは,システムモデルの推定誤差と線形にスケールすることを示す。
- 参考スコア(独自算出の注目度): 4.922268203017287
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We study the problem of control policy design for decentralized
state-feedback linear quadratic control with a partially nested information
structure, when the system model is unknown. We propose a model-based learning
solution, which consists of two steps. First, we estimate the unknown system
model from a single system trajectory of finite length, using least squares
estimation. Next, based on the estimated system model, we design a control
policy that satisfies the desired information structure. We show that the
suboptimality gap between our control policy and the optimal decentralized
control policy (designed using accurate knowledge of the system model) scales
linearly with the estimation error of the system model. Using this result, we
provide an end-to-end sample complexity result for learning decentralized
controllers for a linear quadratic control problem with a partially nested
information structure.
- Abstract(参考訳): システムモデルが不明な場合, 部分ネスト情報構造を持つ分散状態フィードバック線形二次制御における制御ポリシー設計の問題点について検討する。
2つのステップからなるモデルベース学習ソリューションを提案する。
まず,最小二乗推定を用いて,有限長の単一系軌道から未知の系モデルを推定する。
次に、推定システムモデルに基づいて、所望の情報構造を満たす制御ポリシーを設計する。
制御ポリシと最適分散制御ポリシ(システムモデルの正確な知識を用いて設計された)の最適性差は,システムモデルの推定誤差と線形にスケールすることを示す。
この結果を用いて,部分ネストした情報構造を持つ線形二次制御問題の分散制御を学習するための,エンドツーエンドのサンプル複雑性結果を提供する。
関連論文リスト
- Active Learning for Control-Oriented Identification of Nonlinear Systems [26.231260751633307]
本稿では,非線形力学の一般クラスに適した能動学習アルゴリズムの最初の有限サンプル解析について述べる。
ある設定では、アルゴリズムの過剰な制御コストは、対数係数まで、最適な速度を達成する。
我々は,非線形システムの制御におけるアクティブな制御指向探索の利点を示すとともに,シミュレーションにおける我々のアプローチを検証する。
論文 参考訳(メタデータ) (2024-04-13T15:40:39Z) - A least-square method for non-asymptotic identification in linear switching control [17.938732931331064]
基礎となる部分観測線形力学系は、既知の候補モデルの有限集合内にあることが知られている。
線形最小二乗法の非漸近解析における最近の進歩を活用して、この問題の有限時間サンプル複雑性を特徴づける。
基礎となるシステムの未知のパラメータを識別するデータ駆動型スイッチング戦略を提案する。
論文 参考訳(メタデータ) (2024-04-11T20:55:38Z) - Data-driven Nonlinear Model Reduction using Koopman Theory: Integrated
Control Form and NMPC Case Study [56.283944756315066]
そこで本研究では,遅延座標符号化と全状態復号化を組み合わせた汎用モデル構造を提案し,Koopmanモデリングと状態推定を統合した。
ケーススタディでは,本手法が正確な制御モデルを提供し,高純度極低温蒸留塔のリアルタイム非線形予測制御を可能にすることを実証している。
論文 参考訳(メタデータ) (2024-01-09T11:54:54Z) - LMI-based Data-Driven Robust Model Predictive Control [0.1473281171535445]
入力制約と状態制約を考慮したデータ駆動型ロバストな線形行列不等式モデル予測制御手法を提案する。
コントローラは閉ループシステムを安定化し、制約満足度を保証する。
論文 参考訳(メタデータ) (2023-03-08T18:20:06Z) - Regret Analysis of Online Gradient Descent-based Iterative Learning
Control with Model Mismatch [4.922572106422331]
不正確な勾配情報を用いたオンライン勾配差に基づくスキームの性能を解析した。
本手法の基本的限界と適応機構との統合について検討した。
論文 参考訳(メタデータ) (2022-04-10T16:35:27Z) - Deep Learning Approximation of Diffeomorphisms via Linear-Control
Systems [91.3755431537592]
我々は、制御に線形に依存する$dot x = sum_i=1lF_i(x)u_i$という形の制御系を考える。
対応するフローを用いて、コンパクトな点のアンサンブル上の微分同相写像の作用を近似する。
論文 参考訳(メタデータ) (2021-10-24T08:57:46Z) - Neural-iLQR: A Learning-Aided Shooting Method for Trajectory
Optimization [17.25824905485415]
制約のない制御空間上の学習支援シューティング手法であるNeural-iLQRを提案する。
システムモデルにおける不正確さの存在下で、従来のiLQRよりも著しく優れていることが示されている。
論文 参考訳(メタデータ) (2020-11-21T07:17:28Z) - Stein Variational Model Predictive Control [130.60527864489168]
不確実性の下での意思決定は、現実の自律システムにとって極めて重要である。
モデル予測制御 (MPC) 法は, 複雑な分布を扱う場合, 適用範囲が限られている。
この枠組みが、挑戦的で非最適な制御問題における計画の成功に繋がることを示す。
論文 参考訳(メタデータ) (2020-11-15T22:36:59Z) - Control as Hybrid Inference [62.997667081978825]
本稿では、反復推論と償却推論のバランスを自然に仲介するCHIの実装について述べる。
連続的な制御ベンチマークでアルゴリズムのスケーラビリティを検証し、強力なモデルフリーおよびモデルベースラインを上回る性能を示す。
論文 参考訳(メタデータ) (2020-07-11T19:44:09Z) - How Training Data Impacts Performance in Learning-based Control [67.7875109298865]
本稿では,トレーニングデータの密度と制御性能の関係を考察する。
データセットの品質尺度を定式化し、$rho$-gap と呼ぶ。
フィードバック線形化制御法に$rho$-gapを適用する方法を示す。
論文 参考訳(メタデータ) (2020-05-25T12:13:49Z) - Adaptive Control and Regret Minimization in Linear Quadratic Gaussian
(LQG) Setting [91.43582419264763]
我々は不確実性に直面した楽観主義の原理に基づく新しい強化学習アルゴリズムLqgOptを提案する。
LqgOptはシステムのダイナミクスを効率的に探索し、モデルのパラメータを信頼区間まで推定し、最も楽観的なモデルのコントローラをデプロイする。
論文 参考訳(メタデータ) (2020-03-12T19:56:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。