論文の概要: Regret-optimal control in dynamic environments
- arxiv url: http://arxiv.org/abs/2010.10473v2
- Date: Mon, 1 Feb 2021 22:29:37 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-05 08:05:44.740474
- Title: Regret-optimal control in dynamic environments
- Title(参考訳): 動的環境における後悔最適制御
- Authors: Gautam Goel, Babak Hassibi
- Abstract要約: 我々は、後から選択した制御行動の最良の動的シーケンスに対する後悔を最小限に抑えるオンラインコントローラを設計する問題に焦点をあてる。
我々は,新たなH_infty$制御への還元により,後悔最適制御系の状態空間構造を導出する。
本稿では,H_infty$-Optimal コントローラの性能と対向環境との相補性を示す数値実験について述べる。
- 参考スコア(独自算出の注目度): 39.76359052907755
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We consider control in linear time-varying dynamical systems from the
perspective of regret minimization. Unlike most prior work in this area, we
focus on the problem of designing an online controller which minimizes regret
against the best dynamic sequence of control actions selected in hindsight
(dynamic regret), instead of the best fixed controller in some specific class
of controllers (static regret). This formulation is attractive when the
environment changes over time and no single controller achieves good
performance over the entire time horizon. We derive the state-space structure
of the regret-optimal controller via a novel reduction to $H_{\infty}$ control
and present a tight data-dependent bound on its regret in terms of the energy
of the disturbance. Our results easily extend to the model-predictive setting
where the controller can anticipate future disturbances and to settings where
the controller only affects the system dynamics after a fixed delay. We present
numerical experiments which show that our regret-optimal controller
interpolates between the performance of the $H_2$-optimal and
$H_{\infty}$-optimal controllers across stochastic and adversarial
environments.
- Abstract(参考訳): 後悔最小化の観点から線形時間変動力学系の制御を考察する。
この領域における多くの先行研究とは違って、特定の種類のコントローラにおいて最高の固定コントローラではなく、後方視(動的後悔)で選択された制御アクションの最良の動的シーケンスに対する後悔を最小限に抑えるオンラインコントローラを設計する問題に焦点を当てる(静的後悔)。
この定式化は、環境が経時的に変化しても魅力的であり、単一のコントローラが時間軸全体にわたって優れたパフォーマンスを達成することはない。
我々は,新たなH_{\infty}$制御による後悔最適制御系の状態空間構造を導出し,乱れのエネルギーの観点から,その後悔に基づく厳密なデータ依存境界を提示する。
この結果は,制御器が将来の乱れを予測できるモデル予測設定や,固定遅延後のシステムダイナミクスにのみ影響する設定に容易に拡張できる。
そこで本研究では,確率的および敵対的環境における$h_2$-optimal と $h_{\infty}$-optimal controller の性能を相互に補間する数値実験を行った。
関連論文リスト
- On Controller Tuning with Time-Varying Bayesian Optimization [74.57758188038375]
制御対象とその変更に関する適切な事前知識を用いて、時間変化最適化(TVBO)を用いて、変更環境におけるコントローラのオンラインチューニングを行う。
本研究では,不確実性注入(UI)を用いたTVBO戦略を提案する。
我々のモデルはTVBOの最先端手法よりも優れており、後悔の軽減と不安定なパラメータ構成の低減を実現している。
論文 参考訳(メタデータ) (2022-07-22T14:54:13Z) - Competitive Control [52.28457815067461]
我々は,オンラインコントローラの設計に重点を置き,オフラインの最適コントローラと競合するオンラインコントローラの設計に重点を置いている。
この設定における自然なパフォーマンス指標は、オンラインコントローラが引き起こしたコストとオフラインの最適コントローラが引き起こしたコストとの比である競争比である。
論文 参考訳(メタデータ) (2021-07-28T22:26:27Z) - Regret-optimal Estimation and Control [52.28457815067461]
後悔最適推定器と後悔最適制御器は状態空間形式で導出可能であることを示す。
非線形力学系に対するモデル予測制御(MPC)と拡張KalmanFilter(EKF)の残差最適類似性を提案する。
論文 参考訳(メタデータ) (2021-06-22T23:14:21Z) - Regret-Optimal LQR Control [37.99652162611661]
すべてのエネルギー障害に対する最悪の後悔を最小限に抑える因果制御器を見つける。
我々は、最適後悔と状態空間設定に対する後悔最適制御のために明確な公式を導出する。
後悔の最適制御器は、制御系設計のための実行可能な選択肢として自身を提示する。
論文 参考訳(メタデータ) (2021-05-04T01:51:00Z) - Regret-optimal measurement-feedback control [39.76359052907755]
線形力学系における測定フィードバック制御を後悔の観点から検討する。
計測フィードバック設定では、全情報設定とは異なり、障害のたびに他のすべてのオフラインコントローラより優れる単一のオフラインコントローラは存在しない。
本稿では,従来のNehari問題に対する新たな削減によって,対応する後悔最適オンラインコントローラが発見できることを示し,その後悔に対するデータ依存的制約を提示する。
論文 参考訳(メタデータ) (2020-11-24T01:36:48Z) - Improper Learning for Non-Stochastic Control [78.65807250350755]
逆方向の摂動, 逆方向に選択された凸損失関数, 部分的に観察された状態を含む, 未知の線形力学系を制御することの問題点を考察する。
このパラメトリゼーションにオンライン降下を適用することで、大規模なクローズドループポリシーに対してサブリニア後悔を実現する新しいコントローラが得られる。
我々の境界は、線形力学コントローラの安定化と競合する非確率的制御設定における最初のものである。
論文 参考訳(メタデータ) (2020-01-25T02:12:48Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。