論文の概要: Suboptimality analysis of receding horizon quadratic control with
unknown linear systems and its applications in learning-based control
- arxiv url: http://arxiv.org/abs/2301.07876v1
- Date: Thu, 19 Jan 2023 04:33:19 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-20 15:45:24.229917
- Title: Suboptimality analysis of receding horizon quadratic control with
unknown linear systems and its applications in learning-based control
- Title(参考訳): 未知線形系を用いた後退水平2次制御の準最適解析と学習ベース制御への応用
- Authors: Shengling Shi, Anastasios Tsiamis, Bart De Schutter
- Abstract要約: 本稿では, モデル誤差, 終値関数誤差, 予測地平線とのトレードオフがLQ制御器の性能に及ぼす影響を解析する。
多くの場合、予測地平線は、モデリング誤差と端末値関数誤差との相対差に応じて、制御性能を改善するために1または無限にすべきである。
- 参考スコア(独自算出の注目度): 17.877960083005227
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: For a receding-horizon controller with a known system and with an approximate
terminal value function, it is well-known that increasing the prediction
horizon can improve its control performance. However, when the prediction model
is inexact, a larger prediction horizon also causes propagation and
accumulation of the prediction error. In this work, we aim to analyze the
effect of the above trade-off between the modeling error, the terminal value
function error, and the prediction horizon on the performance of a nominal
receding-horizon linear quadratic (LQ) controller. By developing a novel
perturbation result of the Riccati difference equation, a performance upper
bound is obtained and suggests that for many cases, the prediction horizon
should be either 1 or infinity to improve the control performance, depending on
the relative difference between the modeling error and the terminal value
function error. The obtained suboptimality performance bound is also applied to
provide end-to-end performance guarantees, e.g., regret bounds, for nominal
receding-horizon LQ controllers in a learning-based setting.
- Abstract(参考訳): 既知のシステムと近似端末値関数を備えた後退水平制御系では,予測水平線の増加が制御性能を向上させることが知られている。
しかし、予測モデルが不正確である場合、予測地平線が大きくなると予測誤差の伝播と蓄積が引き起こされる。
本研究は, モデル誤差, 終端値関数誤差, 予測地平線とのトレードオフが, 定式整流ホリゾン線形二次(lq)コントローラの性能に及ぼす影響を解析することを目的としたものである。
リカティ差分方程式の新たな摂動結果を開発することにより、性能上界を求め、多くの場合、予測水平線は、モデリング誤差と端末値関数誤差との相対的な差に応じて、制御性能を改善するために1またはinfinityであるべきであることを示唆する。
得られた準最適性能バウンダリは、例えば、学習ベースの設定で名目上の遅延水平LQコントローラに対して、後悔境界などのエンドツーエンドのパフォーマンス保証を提供するためにも適用される。
関連論文リスト
- Accelerated zero-order SGD under high-order smoothness and overparameterized regime [79.85163929026146]
凸最適化問題を解くための新しい勾配のないアルゴリズムを提案する。
このような問題は医学、物理学、機械学習で発生する。
両種類の雑音下で提案アルゴリズムの収束保証を行う。
論文 参考訳(メタデータ) (2024-11-21T10:26:17Z) - Target Networks and Over-parameterization Stabilize Off-policy Bootstrapping with Function Approximation [47.08004958269403]
オフ・プライシ・データにおいても,ブートストラップ値推定の収束条件が弱くなることを証明する。
計算結果をトラジェクトリによる学習に拡張し、小さな修正を施した全てのタスクに対して収束が達成可能であることを示す。
論文 参考訳(メタデータ) (2024-05-31T17:36:16Z) - Dimensionality Collapse: Optimal Measurement Selection for Low-Error
Infinite-Horizon Forecasting [3.5788754401889022]
我々は,Clam'er-Raolow bound (CRLB) の時間平均トレースをコストとして予測することで,連続線形測定設計を無限水平問題として解決する。
自然指数族からの付加雑音による測定に関する理論的結果を導入することにより、局所的な次元減少を導出できる等価な問題を構築する。
この別の定式化は、多くの微分方程式の極限挙動に固有の次元の将来の崩壊に基づいており、予測のためのCRLBの低ランク構造で直接観察することができる。
論文 参考訳(メタデータ) (2023-03-27T17:25:04Z) - Calibrating Segmentation Networks with Margin-based Label Smoothing [19.669173092632]
現状のキャリブレーション損失に対する統一的制約最適化の視点を提供する。
これらの損失は、ロジット距離に等しい制約を課す線形ペナルティの近似と見なすことができる。
我々は不等式制約に基づく単純で柔軟な一般化を提案し、ロジット距離に制御可能なマージンを課す。
論文 参考訳(メタデータ) (2022-09-09T20:21:03Z) - Error-based Knockoffs Inference for Controlled Feature Selection [49.99321384855201]
本手法では, ノックオフ特徴量, エラーベース特徴重要度統計量, ステップダウン手順を一体化して, エラーベースのノックオフ推定手法を提案する。
提案手法では回帰モデルを指定する必要はなく,理論的保証で特徴選択を処理できる。
論文 参考訳(メタデータ) (2022-03-09T01:55:59Z) - Improving Generalization via Uncertainty Driven Perturbations [107.45752065285821]
トレーニングデータポイントの不確実性による摂動について考察する。
損失駆動摂動とは異なり、不確実性誘導摂動は決定境界を越えてはならない。
線形モデルにおいて,UDPがロバスト性マージン決定を達成することが保証されていることを示す。
論文 参考訳(メタデータ) (2022-02-11T16:22:08Z) - The Devil is in the Margin: Margin-based Label Smoothing for Network
Calibration [21.63888208442176]
ディープニューラルネットワークの優位な性能にもかかわらず、最近の研究では、それらが十分に校正されていないことが示されている。
現状のキャリブレーション損失に対する統一的制約最適化の視点を提供する。
我々は不等式制約に基づく単純で柔軟な一般化を提案し、ロジット距離に制御可能なマージンを課す。
論文 参考訳(メタデータ) (2021-11-30T14:21:47Z) - Regret-optimal Estimation and Control [52.28457815067461]
後悔最適推定器と後悔最適制御器は状態空間形式で導出可能であることを示す。
非線形力学系に対するモデル予測制御(MPC)と拡張KalmanFilter(EKF)の残差最適類似性を提案する。
論文 参考訳(メタデータ) (2021-06-22T23:14:21Z) - Reinforcement Learning of the Prediction Horizon in Model Predictive
Control [1.536989504296526]
強化学習(RL)を用いた状態関数としての最適予測地平線学習を提案する。
本稿では,RL学習問題を定式化して2つの制御タスクでテストする方法を示し,固定地平線MPC方式に対する改善点を示す。
論文 参考訳(メタデータ) (2021-02-22T15:52:32Z) - Regret-Optimal Filtering [57.51328978669528]
後悔最適化レンズによる線形状態空間モデルにおけるフィルタの問題を検討する。
我々は, 透視推定器の誤差エネルギー推定における後悔の概念に基づいて, フィルタ設計のための新しい基準を定式化する。
3つのリッキー方程式と1つのリャプノフ方程式を解くことで、後悔と最適推定が容易に実現できることを示す。
論文 参考訳(メタデータ) (2021-01-25T19:06:52Z) - Adaptive Control and Regret Minimization in Linear Quadratic Gaussian
(LQG) Setting [91.43582419264763]
我々は不確実性に直面した楽観主義の原理に基づく新しい強化学習アルゴリズムLqgOptを提案する。
LqgOptはシステムのダイナミクスを効率的に探索し、モデルのパラメータを信頼区間まで推定し、最も楽観的なモデルのコントローラをデプロイする。
論文 参考訳(メタデータ) (2020-03-12T19:56:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。