論文の概要: Suboptimality analysis of receding horizon quadratic control with unknown linear systems and its applications in learning-based control
- arxiv url: http://arxiv.org/abs/2301.07876v2
- Date: Tue, 9 Apr 2024 03:11:26 GMT
- ステータス: 処理完了
- システム内更新日: 2024-04-10 20:45:54.760558
- Title: Suboptimality analysis of receding horizon quadratic control with unknown linear systems and its applications in learning-based control
- Title(参考訳): 未知線形系を用いた後退水平2次制御の準最適解析と学習ベース制御への応用
- Authors: Shengling Shi, Anastasios Tsiamis, Bart De Schutter,
- Abstract要約: モデル誤差, 終値関数誤差, 予測水平線とのトレードオフがLQ制御器の性能にどのように影響するかを解析する。
無限の地平線が望まれる場合、制御可能性指数よりも大きい有限予測地平線は、ほぼ最適性能を達成するのに十分であることを示す。
- 参考スコア(独自算出の注目度): 14.279848166377668
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In this work, we aim to analyze how the trade-off between the modeling error, the terminal value function error, and the prediction horizon affects the performance of a nominal receding-horizon linear quadratic (LQ) controller. By developing a novel perturbation result of the Riccati difference equation, a novel performance upper bound is obtained and suggests that for many cases, the prediction horizon can be either one or infinity to improve the control performance, depending on the relative difference between the modeling error and the terminal value function error. The result also shows that when an infinite horizon is desired, a finite prediction horizon that is larger than the controllability index can be sufficient for achieving a near-optimal performance, revealing a close relation between the prediction horizon and controllability. The obtained suboptimality performance bound is also applied to provide novel sample complexity and regret guarantees for nominal receding-horizon LQ controllers in a learning-based setting.
- Abstract(参考訳): 本研究では, モデル誤差, 終値関数誤差, 予測水平線のトレードオフがLQコントローラの性能にどのように影響するかを解析することを目的とする。
リカティ差分方程式の新たな摂動結果を開発することにより、新しい性能上限を求め、多くの場合、予測水平線を1つまたは無限にし、モデリング誤差と終値関数誤差との相対的な差に応じて制御性能を改善することを提案する。
また、無限の地平線を求める場合、制御可能性指数よりも大きい有限予測地平線は、ほぼ最適性能を達成するのに十分であり、予測地平線と制御可能性との密接な関係を明らかにすることも示している。
得られた準最適性能バウンダリは、学習ベースの設定で、名目上の後退水平LQコントローラに対して、新しいサンプルの複雑さと後悔の保証を提供するためにも適用される。
関連論文リスト
- Accelerated zero-order SGD under high-order smoothness and overparameterized regime [79.85163929026146]
凸最適化問題を解くための新しい勾配のないアルゴリズムを提案する。
このような問題は医学、物理学、機械学習で発生する。
両種類の雑音下で提案アルゴリズムの収束保証を行う。
論文 参考訳(メタデータ) (2024-11-21T10:26:17Z) - Target Networks and Over-parameterization Stabilize Off-policy Bootstrapping with Function Approximation [47.08004958269403]
オフ・プライシ・データにおいても,ブートストラップ値推定の収束条件が弱くなることを証明する。
計算結果をトラジェクトリによる学習に拡張し、小さな修正を施した全てのタスクに対して収束が達成可能であることを示す。
論文 参考訳(メタデータ) (2024-05-31T17:36:16Z) - Dimensionality Collapse: Optimal Measurement Selection for Low-Error
Infinite-Horizon Forecasting [3.5788754401889022]
我々は,Clam'er-Raolow bound (CRLB) の時間平均トレースをコストとして予測することで,連続線形測定設計を無限水平問題として解決する。
自然指数族からの付加雑音による測定に関する理論的結果を導入することにより、局所的な次元減少を導出できる等価な問題を構築する。
この別の定式化は、多くの微分方程式の極限挙動に固有の次元の将来の崩壊に基づいており、予測のためのCRLBの低ランク構造で直接観察することができる。
論文 参考訳(メタデータ) (2023-03-27T17:25:04Z) - Calibrating Segmentation Networks with Margin-based Label Smoothing [19.669173092632]
現状のキャリブレーション損失に対する統一的制約最適化の視点を提供する。
これらの損失は、ロジット距離に等しい制約を課す線形ペナルティの近似と見なすことができる。
我々は不等式制約に基づく単純で柔軟な一般化を提案し、ロジット距離に制御可能なマージンを課す。
論文 参考訳(メタデータ) (2022-09-09T20:21:03Z) - Error-based Knockoffs Inference for Controlled Feature Selection [49.99321384855201]
本手法では, ノックオフ特徴量, エラーベース特徴重要度統計量, ステップダウン手順を一体化して, エラーベースのノックオフ推定手法を提案する。
提案手法では回帰モデルを指定する必要はなく,理論的保証で特徴選択を処理できる。
論文 参考訳(メタデータ) (2022-03-09T01:55:59Z) - Improving Generalization via Uncertainty Driven Perturbations [107.45752065285821]
トレーニングデータポイントの不確実性による摂動について考察する。
損失駆動摂動とは異なり、不確実性誘導摂動は決定境界を越えてはならない。
線形モデルにおいて,UDPがロバスト性マージン決定を達成することが保証されていることを示す。
論文 参考訳(メタデータ) (2022-02-11T16:22:08Z) - The Devil is in the Margin: Margin-based Label Smoothing for Network
Calibration [21.63888208442176]
ディープニューラルネットワークの優位な性能にもかかわらず、最近の研究では、それらが十分に校正されていないことが示されている。
現状のキャリブレーション損失に対する統一的制約最適化の視点を提供する。
我々は不等式制約に基づく単純で柔軟な一般化を提案し、ロジット距離に制御可能なマージンを課す。
論文 参考訳(メタデータ) (2021-11-30T14:21:47Z) - Regret-optimal Estimation and Control [52.28457815067461]
後悔最適推定器と後悔最適制御器は状態空間形式で導出可能であることを示す。
非線形力学系に対するモデル予測制御(MPC)と拡張KalmanFilter(EKF)の残差最適類似性を提案する。
論文 参考訳(メタデータ) (2021-06-22T23:14:21Z) - Reinforcement Learning of the Prediction Horizon in Model Predictive
Control [1.536989504296526]
強化学習(RL)を用いた状態関数としての最適予測地平線学習を提案する。
本稿では,RL学習問題を定式化して2つの制御タスクでテストする方法を示し,固定地平線MPC方式に対する改善点を示す。
論文 参考訳(メタデータ) (2021-02-22T15:52:32Z) - Regret-Optimal Filtering [57.51328978669528]
後悔最適化レンズによる線形状態空間モデルにおけるフィルタの問題を検討する。
我々は, 透視推定器の誤差エネルギー推定における後悔の概念に基づいて, フィルタ設計のための新しい基準を定式化する。
3つのリッキー方程式と1つのリャプノフ方程式を解くことで、後悔と最適推定が容易に実現できることを示す。
論文 参考訳(メタデータ) (2021-01-25T19:06:52Z) - Adaptive Control and Regret Minimization in Linear Quadratic Gaussian
(LQG) Setting [91.43582419264763]
我々は不確実性に直面した楽観主義の原理に基づく新しい強化学習アルゴリズムLqgOptを提案する。
LqgOptはシステムのダイナミクスを効率的に探索し、モデルのパラメータを信頼区間まで推定し、最も楽観的なモデルのコントローラをデプロイする。
論文 参考訳(メタデータ) (2020-03-12T19:56:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。