論文の概要: Robust-Adaptive Control of Linear Systems: beyond Quadratic Costs
- arxiv url: http://arxiv.org/abs/2002.10816v2
- Date: Wed, 21 Oct 2020 15:15:40 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-28 21:10:30.761452
- Title: Robust-Adaptive Control of Linear Systems: beyond Quadratic Costs
- Title(参考訳): 線形系のロバスト適応制御--二次コストを超えて
- Authors: Edouard Leurent and Denis Efimov and Odalric-Ambrym Maillard
- Abstract要約: 線形システムのロバストかつ適応的なモデル予測制御(MPC)の問題を考える。
この設定に対して、最初のエンドツーエンドのサブ最適トラクティリティ解析を提供する。
- 参考スコア(独自算出の注目度): 14.309243378538012
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We consider the problem of robust and adaptive model predictive control (MPC)
of a linear system, with unknown parameters that are learned along the way
(adaptive), in a critical setting where failures must be prevented (robust).
This problem has been studied from different perspectives by different
communities. However, the existing theory deals only with the case of quadratic
costs (the LQ problem), which limits applications to stabilisation and tracking
tasks only. In order to handle more general (non-convex) costs that naturally
arise in many practical problems, we carefully select and bring together
several tools from different communities, namely non-asymptotic linear
regression, recent results in interval prediction, and tree-based planning.
Combining and adapting the theoretical guarantees at each layer is non trivial,
and we provide the first end-to-end suboptimality analysis for this setting.
Interestingly, our analysis naturally adapts to handle many models and combines
with a data-driven robust model selection strategy, which enables to relax the
modelling assumptions. Last, we strive to preserve tractability at any stage of
the method, that we illustrate on two challenging simulated environments.
- Abstract(参考訳): 本稿では,線形システムの堅牢かつ適応的なモデル予測制御(MPC)の問題について考察する。
この問題は異なるコミュニティによって異なる視点から研究されてきた。
しかし、既存の理論は2次コスト(LQ問題)の場合のみを扱うため、アプリケーションの安定化と追跡はタスクのみに制限される。
多くの実践的な問題で自然に発生するより一般的な(非凸)コストに対処するために、我々は、異なるコミュニティから、特に非漸近線形回帰、近年のインターバル予測の結果、およびツリーベースプランニングを慎重に選択し、まとめる。
各層における理論的保証の組み合わせと適応は自明なものではなく、この設定に対する最初のエンドツーエンドの準最適解析を提供する。
興味深いことに、私たちの分析は自然に多くのモデルに対応し、データ駆動のロバストなモデル選択戦略と組み合わせて、モデリングの仮定を緩和します。
最後に,提案手法のどの段階でもトラクタビリティを保ちながら,二つの困難なシミュレーション環境について説明する。
関連論文リスト
- Smart Predict-then-Optimize Method with Dependent Data: Risk Bounds and Calibration of Autoregression [7.369846475695131]
本稿では,決定段階における最適化問題を直接対象とする自己回帰型SPO手法を提案する。
我々は, 絶対損失と最小二乗損失と比較して, SPO+サロゲートの有効性を示す実験を行った。
論文 参考訳(メタデータ) (2024-11-19T17:02:04Z) - Optimization-Driven Adaptive Experimentation [7.948144726705323]
実世界の実験には、バッチで遅延したフィードバック、非定常性、複数の目的と制約、そして(時には)パーソナライゼーションが含まれる。
これらの課題にプロブレム単位で対処するための適応的手法の調整は不可能であり、静的設計はデファクトスタンダードのままである。
本稿では,多種多様な目的,制約,統計的手順を柔軟に組み込む数学的プログラミングの定式化について述べる。
論文 参考訳(メタデータ) (2024-08-08T16:29:09Z) - Learning Deterministic Surrogates for Robust Convex QCQPs [0.0]
本稿では,ロバストな意思決定損失に関する予測モデルをトレーニングするための二重暗黙層モデルを提案する。
第1の層は問題の決定論的バージョンを解き、第2の層は不確実性集合に対する最悪のケース実現を評価する。
これにより、テスト時に単純な決定論的問題を解くだけで、堅牢な決定につながるモデルのパラメータ化を学ぶことができます。
論文 参考訳(メタデータ) (2023-12-19T16:56:13Z) - Likelihood Ratio Confidence Sets for Sequential Decision Making [51.66638486226482]
確率に基づく推論の原理を再検討し、確率比を用いて妥当な信頼シーケンスを構築することを提案する。
本手法は, 精度の高い問題に特に適している。
提案手法は,オンライン凸最適化への接続に光を当てることにより,推定器の最適シーケンスを確実に選択する方法を示す。
論文 参考訳(メタデータ) (2023-11-08T00:10:21Z) - A Novel Plug-and-Play Approach for Adversarially Robust Generalization [38.72514422694518]
本稿では,MLモデルを摂動テストデータから保護するために,逆向きに堅牢なトレーニングを採用する頑健なフレームワークを提案する。
私たちの貢献は、計算学と統計学の両方の観点から見ることができます。
論文 参考訳(メタデータ) (2022-08-19T17:02:55Z) - Time varying regression with hidden linear dynamics [74.9914602730208]
線形力学系に従って未知のパラメータが進化することを前提とした時間変化線形回帰モデルを再検討する。
反対に、基礎となる力学が安定である場合、このモデルのパラメータは2つの通常の最小二乗推定と組み合わせることで、データから推定できることが示される。
論文 参考訳(メタデータ) (2021-12-29T23:37:06Z) - A Surrogate Objective Framework for Prediction+Optimization with Soft
Constraints [29.962390392493507]
SPO+や直接最適化のような決定に焦点をあてた予測手法が、このギャップを埋めるために提案されている。
本稿では,実世界の線形および半定値負の二次計画問題に対して,解析的に微分可能な主観的フレームワークを提案する。
論文 参考訳(メタデータ) (2021-11-22T17:09:57Z) - Modeling the Second Player in Distributionally Robust Optimization [90.25995710696425]
我々は、最悪のケース分布を特徴付けるために神経生成モデルを使うことを議論する。
このアプローチは多くの実装と最適化の課題をもたらします。
提案されたアプローチは、同等のベースラインよりも堅牢なモデルを生み出す。
論文 参考訳(メタデータ) (2021-03-18T14:26:26Z) - Stein Variational Model Predictive Control [130.60527864489168]
不確実性の下での意思決定は、現実の自律システムにとって極めて重要である。
モデル予測制御 (MPC) 法は, 複雑な分布を扱う場合, 適用範囲が限られている。
この枠組みが、挑戦的で非最適な制御問題における計画の成功に繋がることを示す。
論文 参考訳(メタデータ) (2020-11-15T22:36:59Z) - The Risks of Invariant Risk Minimization [52.7137956951533]
不変リスク最小化(Invariant Risk Minimization)は、データの深い不変性を学ぶという考え方に基づく目標である。
我々は、IRMの目的に基づく分類の最初の分析と、最近提案されたこれらの代替案について、かなり自然で一般的なモデルで分析する。
IRMは、テストデータがトレーニング分布と十分に類似していない限り、破滅的に失敗する可能性がある。
論文 参考訳(メタデータ) (2020-10-12T14:54:32Z) - Adaptive Control and Regret Minimization in Linear Quadratic Gaussian
(LQG) Setting [91.43582419264763]
我々は不確実性に直面した楽観主義の原理に基づく新しい強化学習アルゴリズムLqgOptを提案する。
LqgOptはシステムのダイナミクスを効率的に探索し、モデルのパラメータを信頼区間まで推定し、最も楽観的なモデルのコントローラをデプロイする。
論文 参考訳(メタデータ) (2020-03-12T19:56:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。