論文の概要: Robust-Adaptive Control of Linear Systems: beyond Quadratic Costs
- arxiv url: http://arxiv.org/abs/2002.10816v2
- Date: Wed, 21 Oct 2020 15:15:40 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-28 21:10:30.761452
- Title: Robust-Adaptive Control of Linear Systems: beyond Quadratic Costs
- Title(参考訳): 線形系のロバスト適応制御--二次コストを超えて
- Authors: Edouard Leurent and Denis Efimov and Odalric-Ambrym Maillard
- Abstract要約: 線形システムのロバストかつ適応的なモデル予測制御(MPC)の問題を考える。
この設定に対して、最初のエンドツーエンドのサブ最適トラクティリティ解析を提供する。
- 参考スコア(独自算出の注目度): 14.309243378538012
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We consider the problem of robust and adaptive model predictive control (MPC)
of a linear system, with unknown parameters that are learned along the way
(adaptive), in a critical setting where failures must be prevented (robust).
This problem has been studied from different perspectives by different
communities. However, the existing theory deals only with the case of quadratic
costs (the LQ problem), which limits applications to stabilisation and tracking
tasks only. In order to handle more general (non-convex) costs that naturally
arise in many practical problems, we carefully select and bring together
several tools from different communities, namely non-asymptotic linear
regression, recent results in interval prediction, and tree-based planning.
Combining and adapting the theoretical guarantees at each layer is non trivial,
and we provide the first end-to-end suboptimality analysis for this setting.
Interestingly, our analysis naturally adapts to handle many models and combines
with a data-driven robust model selection strategy, which enables to relax the
modelling assumptions. Last, we strive to preserve tractability at any stage of
the method, that we illustrate on two challenging simulated environments.
- Abstract(参考訳): 本稿では,線形システムの堅牢かつ適応的なモデル予測制御(MPC)の問題について考察する。
この問題は異なるコミュニティによって異なる視点から研究されてきた。
しかし、既存の理論は2次コスト(LQ問題)の場合のみを扱うため、アプリケーションの安定化と追跡はタスクのみに制限される。
多くの実践的な問題で自然に発生するより一般的な(非凸)コストに対処するために、我々は、異なるコミュニティから、特に非漸近線形回帰、近年のインターバル予測の結果、およびツリーベースプランニングを慎重に選択し、まとめる。
各層における理論的保証の組み合わせと適応は自明なものではなく、この設定に対する最初のエンドツーエンドの準最適解析を提供する。
興味深いことに、私たちの分析は自然に多くのモデルに対応し、データ駆動のロバストなモデル選択戦略と組み合わせて、モデリングの仮定を緩和します。
最後に,提案手法のどの段階でもトラクタビリティを保ちながら,二つの困難なシミュレーション環境について説明する。
関連論文リスト
- A successive approximation method in functional spaces for hierarchical optimal control problems and its application to learning [0.0]
本研究では,高次元非線形関数をモデル化するための点推定の学習問題について考察する。
デューコースにおける推定パラメータは、異なるモデル検証データセット上で許容できる予測精度を提供する。
最適化段階における一般化と正規化の両方を適切に考慮する枠組みを提供する。
論文 参考訳(メタデータ) (2024-10-27T22:28:07Z) - Learning Deterministic Surrogates for Robust Convex QCQPs [0.0]
本稿では,ロバストな意思決定損失に関する予測モデルをトレーニングするための二重暗黙層モデルを提案する。
第1の層は問題の決定論的バージョンを解き、第2の層は不確実性集合に対する最悪のケース実現を評価する。
これにより、テスト時に単純な決定論的問題を解くだけで、堅牢な決定につながるモデルのパラメータ化を学ぶことができます。
論文 参考訳(メタデータ) (2023-12-19T16:56:13Z) - Likelihood Ratio Confidence Sets for Sequential Decision Making [51.66638486226482]
確率に基づく推論の原理を再検討し、確率比を用いて妥当な信頼シーケンスを構築することを提案する。
本手法は, 精度の高い問題に特に適している。
提案手法は,オンライン凸最適化への接続に光を当てることにより,推定器の最適シーケンスを確実に選択する方法を示す。
論文 参考訳(メタデータ) (2023-11-08T00:10:21Z) - On data-driven chance constraint learning for mixed-integer optimization
problems [0.0]
本稿では,混合整数線形最適化問題に着目したCCL手法を提案する。
CCLは線形化可能な機械学習モデルを使用して、学習変数の条件量子を推定する。
実践者が使用するオープンアクセスソフトウェアが開発されている。
論文 参考訳(メタデータ) (2022-07-08T11:54:39Z) - Time varying regression with hidden linear dynamics [74.9914602730208]
線形力学系に従って未知のパラメータが進化することを前提とした時間変化線形回帰モデルを再検討する。
反対に、基礎となる力学が安定である場合、このモデルのパラメータは2つの通常の最小二乗推定と組み合わせることで、データから推定できることが示される。
論文 参考訳(メタデータ) (2021-12-29T23:37:06Z) - A Surrogate Objective Framework for Prediction+Optimization with Soft
Constraints [29.962390392493507]
SPO+や直接最適化のような決定に焦点をあてた予測手法が、このギャップを埋めるために提案されている。
本稿では,実世界の線形および半定値負の二次計画問題に対して,解析的に微分可能な主観的フレームワークを提案する。
論文 参考訳(メタデータ) (2021-11-22T17:09:57Z) - Modeling the Second Player in Distributionally Robust Optimization [90.25995710696425]
我々は、最悪のケース分布を特徴付けるために神経生成モデルを使うことを議論する。
このアプローチは多くの実装と最適化の課題をもたらします。
提案されたアプローチは、同等のベースラインよりも堅牢なモデルを生み出す。
論文 参考訳(メタデータ) (2021-03-18T14:26:26Z) - Stein Variational Model Predictive Control [130.60527864489168]
不確実性の下での意思決定は、現実の自律システムにとって極めて重要である。
モデル予測制御 (MPC) 法は, 複雑な分布を扱う場合, 適用範囲が限られている。
この枠組みが、挑戦的で非最適な制御問題における計画の成功に繋がることを示す。
論文 参考訳(メタデータ) (2020-11-15T22:36:59Z) - Constrained Model-based Reinforcement Learning with Robust Cross-Entropy
Method [30.407700996710023]
本稿では,制約違反に対するスパースインジケータ信号を用いた制約/安全強化学習問題について検討する。
本稿では,ニューラルネットワークアンサンブルモデルを用いて予測の不確実性を推定し,モデル予測制御を基本制御フレームワークとして利用する。
その結果,本手法は現状のベースラインよりもはるかに少ない制約違反数でタスクを完了させることが判明した。
論文 参考訳(メタデータ) (2020-10-15T18:19:35Z) - The Risks of Invariant Risk Minimization [52.7137956951533]
不変リスク最小化(Invariant Risk Minimization)は、データの深い不変性を学ぶという考え方に基づく目標である。
我々は、IRMの目的に基づく分類の最初の分析と、最近提案されたこれらの代替案について、かなり自然で一般的なモデルで分析する。
IRMは、テストデータがトレーニング分布と十分に類似していない限り、破滅的に失敗する可能性がある。
論文 参考訳(メタデータ) (2020-10-12T14:54:32Z) - Adaptive Control and Regret Minimization in Linear Quadratic Gaussian
(LQG) Setting [91.43582419264763]
我々は不確実性に直面した楽観主義の原理に基づく新しい強化学習アルゴリズムLqgOptを提案する。
LqgOptはシステムのダイナミクスを効率的に探索し、モデルのパラメータを信頼区間まで推定し、最も楽観的なモデルのコントローラをデプロイする。
論文 参考訳(メタデータ) (2020-03-12T19:56:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。