Fugu-MT 論文翻訳(概要): Suboptimality analysis of receding horizon quadratic control with unknown linear systems and its applications in learning-based control

論文の概要: Suboptimality analysis of receding horizon quadratic control with unknown linear systems and its applications in learning-based control

arxiv url: http://arxiv.org/abs/2301.07876v1
Date: Thu, 19 Jan 2023 04:33:19 GMT
ステータス: 翻訳完了
システム内更新日: 2023-01-20 15:45:24.229917
Title: Suboptimality analysis of receding horizon quadratic control with unknown linear systems and its applications in learning-based control
Title（参考訳）: 未知線形系を用いた後退水平2次制御の準最適解析と学習ベース制御への応用
Authors: Shengling Shi, Anastasios Tsiamis, Bart De Schutter
Abstract要約: 本稿では, モデル誤差, 終値関数誤差, 予測地平線とのトレードオフがLQ制御器の性能に及ぼす影響を解析する。多くの場合、予測地平線は、モデリング誤差と端末値関数誤差との相対差に応じて、制御性能を改善するために1または無限にすべきである。
参考スコア（独自算出の注目度）: 17.877960083005227
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: For a receding-horizon controller with a known system and with an approximate terminal value function, it is well-known that increasing the prediction horizon can improve its control performance. However, when the prediction model is inexact, a larger prediction horizon also causes propagation and accumulation of the prediction error. In this work, we aim to analyze the effect of the above trade-off between the modeling error, the terminal value function error, and the prediction horizon on the performance of a nominal receding-horizon linear quadratic (LQ) controller. By developing a novel perturbation result of the Riccati difference equation, a performance upper bound is obtained and suggests that for many cases, the prediction horizon should be either 1 or infinity to improve the control performance, depending on the relative difference between the modeling error and the terminal value function error. The obtained suboptimality performance bound is also applied to provide end-to-end performance guarantees, e.g., regret bounds, for nominal receding-horizon LQ controllers in a learning-based setting.
Abstract（参考訳）: 既知のシステムと近似端末値関数を備えた後退水平制御系では,予測水平線の増加が制御性能を向上させることが知られている。しかし、予測モデルが不正確である場合、予測地平線が大きくなると予測誤差の伝播と蓄積が引き起こされる。本研究は, モデル誤差, 終端値関数誤差, 予測地平線とのトレードオフが, 定式整流ホリゾン線形二次(lq)コントローラの性能に及ぼす影響を解析することを目的としたものである。リカティ差分方程式の新たな摂動結果を開発することにより、性能上界を求め、多くの場合、予測水平線は、モデリング誤差と端末値関数誤差との相対的な差に応じて、制御性能を改善するために1またはinfinityであるべきであることを示唆する。得られた準最適性能バウンダリは、例えば、学習ベースの設定で名目上の遅延水平LQコントローラに対して、後悔境界などのエンドツーエンドのパフォーマンス保証を提供するためにも適用される。

関連論文リスト

Error-quantified Conformal Inference for Time Series [40.438171912992864]
時系列予測の不確かさの定量化は、時系列データの時間的依存と分布シフトのために困難である。量子化損失関数をスムースにすることで,iError-quantified Conformal Inference (ECI)を提案する。 ECIは有効な誤発見制御と、他のベースラインよりも厳密な予測セットを出力することができる。
論文参考訳（メタデータ） (2025-02-02T15:02:36Z)
Accelerated zero-order SGD under high-order smoothness and overparameterized regime [79.85163929026146]
凸最適化問題を解くための新しい勾配のないアルゴリズムを提案する。このような問題は医学、物理学、機械学習で発生する。両種類の雑音下で提案アルゴリズムの収束保証を行う。
論文参考訳（メタデータ） (2024-11-21T10:26:17Z)
Target Networks and Over-parameterization Stabilize Off-policy Bootstrapping with Function Approximation [47.08004958269403]
オフ・プライシ・データにおいても,ブートストラップ値推定の収束条件が弱くなることを証明する。計算結果をトラジェクトリによる学習に拡張し、小さな修正を施した全てのタスクに対して収束が達成可能であることを示す。
論文参考訳（メタデータ） (2024-05-31T17:36:16Z)
Loss Shaping Constraints for Long-Term Time Series Forecasting [79.3533114027664]
本稿では,長期時系列予測のための制約付き学習手法を提案する。提案手法は, 予測ウィンドウ上でエラーを発生させながら, 時系列ベンチマークにおける競合平均性能を示すことを示すための, 実用的なプリマル・デュアルアルゴリズムを提案する。
論文参考訳（メタデータ） (2024-02-14T18:20:44Z)
Dimensionality Collapse: Optimal Measurement Selection for Low-Error Infinite-Horizon Forecasting [3.5788754401889022]
我々は,Clam'er-Raolow bound (CRLB) の時間平均トレースをコストとして予測することで,連続線形測定設計を無限水平問題として解決する。自然指数族からの付加雑音による測定に関する理論的結果を導入することにより、局所的な次元減少を導出できる等価な問題を構築する。この別の定式化は、多くの微分方程式の極限挙動に固有の次元の将来の崩壊に基づいており、予測のためのCRLBの低ランク構造で直接観察することができる。
論文参考訳（メタデータ） (2023-03-27T17:25:04Z)
Calibrating Segmentation Networks with Margin-based Label Smoothing [19.669173092632]
現状のキャリブレーション損失に対する統一的制約最適化の視点を提供する。これらの損失は、ロジット距離に等しい制約を課す線形ペナルティの近似と見なすことができる。我々は不等式制約に基づく単純で柔軟な一般化を提案し、ロジット距離に制御可能なマージンを課す。
論文参考訳（メタデータ） (2022-09-09T20:21:03Z)
Error-based Knockoffs Inference for Controlled Feature Selection [49.99321384855201]
本手法では, ノックオフ特徴量, エラーベース特徴重要度統計量, ステップダウン手順を一体化して, エラーベースのノックオフ推定手法を提案する。提案手法では回帰モデルを指定する必要はなく,理論的保証で特徴選択を処理できる。
論文参考訳（メタデータ） (2022-03-09T01:55:59Z)
Domain-Adjusted Regression or: ERM May Already Learn Features Sufficient for Out-of-Distribution Generalization [52.7137956951533]
既存の特徴から予測器を学習するためのよりシンプルな手法を考案することは、将来の研究にとって有望な方向である、と我々は主張する。本稿では,線形予測器を学習するための凸目標である領域調整回帰(DARE)を紹介する。自然モデルの下では、DARE解が制限されたテスト分布の集合に対する最小最適予測器であることを証明する。
論文参考訳（メタデータ） (2022-02-14T16:42:16Z)
Improving Generalization via Uncertainty Driven Perturbations [107.45752065285821]
トレーニングデータポイントの不確実性による摂動について考察する。損失駆動摂動とは異なり、不確実性誘導摂動は決定境界を越えてはならない。線形モデルにおいて,UDPがロバスト性マージン決定を達成することが保証されていることを示す。
論文参考訳（メタデータ） (2022-02-11T16:22:08Z)
The Devil is in the Margin: Margin-based Label Smoothing for Network Calibration [21.63888208442176]
ディープニューラルネットワークの優位な性能にもかかわらず、最近の研究では、それらが十分に校正されていないことが示されている。現状のキャリブレーション損失に対する統一的制約最適化の視点を提供する。我々は不等式制約に基づく単純で柔軟な一般化を提案し、ロジット距離に制御可能なマージンを課す。
論文参考訳（メタデータ） (2021-11-30T14:21:47Z)
Regret-optimal Estimation and Control [52.28457815067461]
後悔最適推定器と後悔最適制御器は状態空間形式で導出可能であることを示す。非線形力学系に対するモデル予測制御(MPC)と拡張KalmanFilter(EKF)の残差最適類似性を提案する。
論文参考訳（メタデータ） (2021-06-22T23:14:21Z)
Reinforcement Learning of the Prediction Horizon in Model Predictive Control [1.536989504296526]
強化学習(RL)を用いた状態関数としての最適予測地平線学習を提案する。本稿では,RL学習問題を定式化して2つの制御タスクでテストする方法を示し,固定地平線MPC方式に対する改善点を示す。
論文参考訳（メタデータ） (2021-02-22T15:52:32Z)
Regret-Optimal Filtering [57.51328978669528]
後悔最適化レンズによる線形状態空間モデルにおけるフィルタの問題を検討する。我々は, 透視推定器の誤差エネルギー推定における後悔の概念に基づいて, フィルタ設計のための新しい基準を定式化する。 3つのリッキー方程式と1つのリャプノフ方程式を解くことで、後悔と最適推定が容易に実現できることを示す。
論文参考訳（メタデータ） (2021-01-25T19:06:52Z)
Adaptive Control and Regret Minimization in Linear Quadratic Gaussian (LQG) Setting [91.43582419264763]
我々は不確実性に直面した楽観主義の原理に基づく新しい強化学習アルゴリズムLqgOptを提案する。 LqgOptはシステムのダイナミクスを効率的に探索し、モデルのパラメータを信頼区間まで推定し、最も楽観的なモデルのコントローラをデプロイする。
論文参考訳（メタデータ） (2020-03-12T19:56:38Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。