論文の概要: Suboptimality analysis of receding horizon quadratic control with
unknown linear systems and its applications in learning-based control
- arxiv url: http://arxiv.org/abs/2301.07876v1
- Date: Thu, 19 Jan 2023 04:33:19 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-20 15:45:24.229917
- Title: Suboptimality analysis of receding horizon quadratic control with
unknown linear systems and its applications in learning-based control
- Title(参考訳): 未知線形系を用いた後退水平2次制御の準最適解析と学習ベース制御への応用
- Authors: Shengling Shi, Anastasios Tsiamis, Bart De Schutter
- Abstract要約: 本稿では, モデル誤差, 終値関数誤差, 予測地平線とのトレードオフがLQ制御器の性能に及ぼす影響を解析する。
多くの場合、予測地平線は、モデリング誤差と端末値関数誤差との相対差に応じて、制御性能を改善するために1または無限にすべきである。
- 参考スコア(独自算出の注目度): 17.877960083005227
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: For a receding-horizon controller with a known system and with an approximate
terminal value function, it is well-known that increasing the prediction
horizon can improve its control performance. However, when the prediction model
is inexact, a larger prediction horizon also causes propagation and
accumulation of the prediction error. In this work, we aim to analyze the
effect of the above trade-off between the modeling error, the terminal value
function error, and the prediction horizon on the performance of a nominal
receding-horizon linear quadratic (LQ) controller. By developing a novel
perturbation result of the Riccati difference equation, a performance upper
bound is obtained and suggests that for many cases, the prediction horizon
should be either 1 or infinity to improve the control performance, depending on
the relative difference between the modeling error and the terminal value
function error. The obtained suboptimality performance bound is also applied to
provide end-to-end performance guarantees, e.g., regret bounds, for nominal
receding-horizon LQ controllers in a learning-based setting.
- Abstract(参考訳): 既知のシステムと近似端末値関数を備えた後退水平制御系では,予測水平線の増加が制御性能を向上させることが知られている。
しかし、予測モデルが不正確である場合、予測地平線が大きくなると予測誤差の伝播と蓄積が引き起こされる。
本研究は, モデル誤差, 終端値関数誤差, 予測地平線とのトレードオフが, 定式整流ホリゾン線形二次(lq)コントローラの性能に及ぼす影響を解析することを目的としたものである。
リカティ差分方程式の新たな摂動結果を開発することにより、性能上界を求め、多くの場合、予測水平線は、モデリング誤差と端末値関数誤差との相対的な差に応じて、制御性能を改善するために1またはinfinityであるべきであることを示唆する。
得られた準最適性能バウンダリは、例えば、学習ベースの設定で名目上の遅延水平LQコントローラに対して、後悔境界などのエンドツーエンドのパフォーマンス保証を提供するためにも適用される。
関連論文リスト
- ExtremeCast: Boosting Extreme Value Prediction for Global Weather
Forecast [61.138475638813354]
非対称な最適化を行い、極端な天気予報を得るために極端な値を強調する新しい損失関数であるExlossを導入する。
また,ExEnsembleという名称のトレーニングフリーな極値拡張戦略を導入し,画素値のばらつきを増大させ,予測ロバスト性を向上させる。
提案手法は,上位中距離予測モデルに匹敵する全体的な予測精度を維持しつつ,極端気象予測における最先端性能を達成することができる。
論文 参考訳(メタデータ) (2024-02-02T10:34:13Z) - Dimensionality Collapse: Optimal Measurement Selection for Low-Error
Infinite-Horizon Forecasting [3.5788754401889022]
我々は,Clam'er-Raolow bound (CRLB) の時間平均トレースをコストとして予測することで,連続線形測定設計を無限水平問題として解決する。
自然指数族からの付加雑音による測定に関する理論的結果を導入することにより、局所的な次元減少を導出できる等価な問題を構築する。
この別の定式化は、多くの微分方程式の極限挙動に固有の次元の将来の崩壊に基づいており、予測のためのCRLBの低ランク構造で直接観察することができる。
論文 参考訳(メタデータ) (2023-03-27T17:25:04Z) - Loss-Controlling Calibration for Predictive Models [5.51361762392299]
交換可能なデータに対する損失制御予測を行うための予測モデルの校正のための学習フレームワークを提案する。
対照的に、損失制御手法によって構築された予測器は、設定された予測器に限らない。
提案手法は,選択的回帰および高影響気象予報問題に適用する。
論文 参考訳(メタデータ) (2023-01-11T09:44:55Z) - Error-based Knockoffs Inference for Controlled Feature Selection [49.99321384855201]
本手法では, ノックオフ特徴量, エラーベース特徴重要度統計量, ステップダウン手順を一体化して, エラーベースのノックオフ推定手法を提案する。
提案手法では回帰モデルを指定する必要はなく,理論的保証で特徴選択を処理できる。
論文 参考訳(メタデータ) (2022-03-09T01:55:59Z) - Domain-Adjusted Regression or: ERM May Already Learn Features Sufficient
for Out-of-Distribution Generalization [52.7137956951533]
既存の特徴から予測器を学習するためのよりシンプルな手法を考案することは、将来の研究にとって有望な方向である、と我々は主張する。
本稿では,線形予測器を学習するための凸目標である領域調整回帰(DARE)を紹介する。
自然モデルの下では、DARE解が制限されたテスト分布の集合に対する最小最適予測器であることを証明する。
論文 参考訳(メタデータ) (2022-02-14T16:42:16Z) - The Devil is in the Margin: Margin-based Label Smoothing for Network
Calibration [21.63888208442176]
ディープニューラルネットワークの優位な性能にもかかわらず、最近の研究では、それらが十分に校正されていないことが示されている。
現状のキャリブレーション損失に対する統一的制約最適化の視点を提供する。
我々は不等式制約に基づく単純で柔軟な一般化を提案し、ロジット距離に制御可能なマージンを課す。
論文 参考訳(メタデータ) (2021-11-30T14:21:47Z) - Regret-optimal Estimation and Control [52.28457815067461]
後悔最適推定器と後悔最適制御器は状態空間形式で導出可能であることを示す。
非線形力学系に対するモデル予測制御(MPC)と拡張KalmanFilter(EKF)の残差最適類似性を提案する。
論文 参考訳(メタデータ) (2021-06-22T23:14:21Z) - Reinforcement Learning of the Prediction Horizon in Model Predictive
Control [1.536989504296526]
強化学習(RL)を用いた状態関数としての最適予測地平線学習を提案する。
本稿では,RL学習問題を定式化して2つの制御タスクでテストする方法を示し,固定地平線MPC方式に対する改善点を示す。
論文 参考訳(メタデータ) (2021-02-22T15:52:32Z) - Gaussian Process-based Min-norm Stabilizing Controller for
Control-Affine Systems with Uncertain Input Effects and Dynamics [90.81186513537777]
本稿では,この問題の制御・アフィン特性を捉えた新しい化合物カーネルを提案する。
この結果の最適化問題は凸であることを示し、ガウス過程に基づく制御リャプノフ関数第二次コーンプログラム(GP-CLF-SOCP)と呼ぶ。
論文 参考訳(メタデータ) (2020-11-14T01:27:32Z) - Probabilistic error estimation for non-intrusive reduced models learned
from data of systems governed by linear parabolic partial differential
equations [0.0]
この研究は、非侵入的モデル還元で学習した縮小モデルに対する残差に基づく後誤差推定器を導出する。
誤差推定器に必要な量は、非侵襲的な方法で最小二乗問題の解として正確に得ることができる。
論文 参考訳(メタデータ) (2020-05-12T16:08:05Z) - Adaptive Control and Regret Minimization in Linear Quadratic Gaussian
(LQG) Setting [91.43582419264763]
我々は不確実性に直面した楽観主義の原理に基づく新しい強化学習アルゴリズムLqgOptを提案する。
LqgOptはシステムのダイナミクスを効率的に探索し、モデルのパラメータを信頼区間まで推定し、最も楽観的なモデルのコントローラをデプロイする。
論文 参考訳(メタデータ) (2020-03-12T19:56:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。