論文の概要: Competitive Control
- arxiv url: http://arxiv.org/abs/2107.13657v2
- Date: Fri, 30 Jul 2021 03:06:03 GMT
- ステータス: 処理完了
- システム内更新日: 2021-08-02 13:12:50.589590
- Title: Competitive Control
- Title(参考訳): 競合制御
- Authors: Gautam Goel and Babak Hassibi
- Abstract要約: 我々は,オンラインコントローラの設計に重点を置き,オフラインの最適コントローラと競合するオンラインコントローラの設計に重点を置いている。
この設定における自然なパフォーマンス指標は、オンラインコントローラが引き起こしたコストとオフラインの最適コントローラが引き起こしたコストとの比である競争比である。
- 参考スコア(独自算出の注目度): 52.28457815067461
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We consider control from the perspective of competitive analysis. Unlike much
prior work on learning-based control, which focuses on minimizing regret
against the best controller selected in hindsight from some specific class, we
focus on designing an online controller which competes against a clairvoyant
offline optimal controller. A natural performance metric in this setting is
competitive ratio, which is the ratio between the cost incurred by the online
controller and the cost incurred by the offline optimal controller. Using
operator-theoretic techniques from robust control, we derive a computationally
efficient state-space description of the the controller with optimal
competitive ratio in both finite-horizon and infinite-horizon settings. We
extend competitive control to nonlinear systems using Model Predictive Control
(MPC) and present numerical experiments which show that our competitive
controller can significantly outperform standard $H_2$ and $H_{\infty}$
controllers in the MPC setting.
- Abstract(参考訳): 我々は競争分析の観点から制御を考える。
学習に基づく制御に関するこれまでの多くの研究とは異なり、特定のクラスから選択された最高のコントローラに対する後悔を最小限に抑えることに重点を置いている。
この設定における自然なパフォーマンス指標は競合比であり、これはオンラインコントローラが負担するコストとオフラインの最適コントローラが負担するコストの比率である。
頑健な制御から演算子理論手法を用いることで、有限水平および無限水平両方の最適競合比を持つ制御器の計算効率の良い状態空間記述を導出する。
我々は,モデル予測制御(MPC)を用いて非線形システムに競争制御を拡張し,MPC設定の標準的な$H_2$と$H_{\infty}$コントローラを大幅に上回ることを示す数値実験を行った。
関連論文リスト
- Optimal Competitive-Ratio Control [40.89951305613357]
最適競合比式は, 単純な行列の最大固有値として計算可能であることを示す。
本研究では,この解析解を検証し,最適競争比制御器が複数の大規模実用システムにおいて,他の制御器よりも優れた性能を示すことを示す。
論文 参考訳(メタデータ) (2022-06-03T19:01:07Z) - Regret Analysis of Learning-Based MPC with Partially-Unknown Cost
Function [5.601217969637838]
探索/探索のトレードオフは、データ駆動および適応制御において固有の課題である。
本稿では、最適制御動作の基準として、全てのシステムパラメータの完全な知識を持つ有限水平オラクルコントローラを提案する。
我々は,このオラクル有限ホライゾンコントローラに関して,低後悔を達成できる学習ベースのポリシーを開発する。
論文 参考訳(メタデータ) (2021-08-04T22:43:51Z) - Regret-optimal Estimation and Control [52.28457815067461]
後悔最適推定器と後悔最適制御器は状態空間形式で導出可能であることを示す。
非線形力学系に対するモデル予測制御(MPC)と拡張KalmanFilter(EKF)の残差最適類似性を提案する。
論文 参考訳(メタデータ) (2021-06-22T23:14:21Z) - Regret-Optimal LQR Control [37.99652162611661]
すべてのエネルギー障害に対する最悪の後悔を最小限に抑える因果制御器を見つける。
我々は、最適後悔と状態空間設定に対する後悔最適制御のために明確な公式を導出する。
後悔の最適制御器は、制御系設計のための実行可能な選択肢として自身を提示する。
論文 参考訳(メタデータ) (2021-05-04T01:51:00Z) - Stable Online Control of Linear Time-Varying Systems [49.41696101740271]
COCO-LQは、大規模なLTVシステムの入出力安定性を保証する効率的なオンライン制御アルゴリズムである。
COCO-LQの性能を実証実験とパワーシステム周波数制御の両例で実証した。
論文 参考訳(メタデータ) (2021-04-29T06:18:49Z) - Regret-optimal measurement-feedback control [39.76359052907755]
線形力学系における測定フィードバック制御を後悔の観点から検討する。
計測フィードバック設定では、全情報設定とは異なり、障害のたびに他のすべてのオフラインコントローラより優れる単一のオフラインコントローラは存在しない。
本稿では,従来のNehari問題に対する新たな削減によって,対応する後悔最適オンラインコントローラが発見できることを示し,その後悔に対するデータ依存的制約を提示する。
論文 参考訳(メタデータ) (2020-11-24T01:36:48Z) - Regret-optimal control in dynamic environments [39.76359052907755]
我々は、後から選択した制御行動の最良の動的シーケンスに対する後悔を最小限に抑えるオンラインコントローラを設計する問題に焦点をあてる。
我々は,新たなH_infty$制御への還元により,後悔最適制御系の状態空間構造を導出する。
本稿では,H_infty$-Optimal コントローラの性能と対向環境との相補性を示す数値実験について述べる。
論文 参考訳(メタデータ) (2020-10-20T17:32:17Z) - Learning a Contact-Adaptive Controller for Robust, Efficient Legged
Locomotion [95.1825179206694]
四足歩行ロボットのためのロバストコントローラを合成するフレームワークを提案する。
高レベルコントローラは、環境の変化に応じてプリミティブのセットを選択することを学習する。
確立された制御方法を使用してプリミティブを堅牢に実行する低レベルコントローラ。
論文 参考訳(メタデータ) (2020-09-21T16:49:26Z) - Improper Learning for Non-Stochastic Control [78.65807250350755]
逆方向の摂動, 逆方向に選択された凸損失関数, 部分的に観察された状態を含む, 未知の線形力学系を制御することの問題点を考察する。
このパラメトリゼーションにオンライン降下を適用することで、大規模なクローズドループポリシーに対してサブリニア後悔を実現する新しいコントローラが得られる。
我々の境界は、線形力学コントローラの安定化と競合する非確率的制御設定における最初のものである。
論文 参考訳(メタデータ) (2020-01-25T02:12:48Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。