論文の概要: Optimal Competitive-Ratio Control
- arxiv url: http://arxiv.org/abs/2206.01782v1
- Date: Fri, 3 Jun 2022 19:01:07 GMT
- ステータス: 処理完了
- システム内更新日: 2022-06-12 17:41:01.755587
- Title: Optimal Competitive-Ratio Control
- Title(参考訳): 最適競合比制御
- Authors: Oron Sabag, Sahin Lale, Babak Hassibi
- Abstract要約: 最適競合比式は, 単純な行列の最大固有値として計算可能であることを示す。
本研究では,この解析解を検証し,最適競争比制御器が複数の大規模実用システムにおいて,他の制御器よりも優れた性能を示すことを示す。
- 参考スコア(独自算出の注目度): 40.89951305613357
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Inspired by competitive policy designs approaches in online learning, new
control paradigms such as competitive-ratio and regret-optimal control have
been recently proposed as alternatives to the classical $\mathcal{H}_2$ and
$\mathcal{H}_\infty$ approaches. These competitive metrics compare the control
cost of the designed controller against the cost of a clairvoyant controller,
which has access to past, present, and future disturbances in terms of ratio
and difference, respectively. While prior work provided the optimal solution
for the regret-optimal control problem, in competitive-ratio control, the
solution is only provided for the sub-optimal problem. In this work, we derive
the optimal solution to the competitive-ratio control problem. We show that the
optimal competitive ratio formula can be computed as the maximal eigenvalue of
a simple matrix, and provide a state-space controller that achieves the optimal
competitive ratio. We conduct an extensive numerical study to verify this
analytical solution, and demonstrate that the optimal competitive-ratio
controller outperforms other controllers on several large scale practical
systems. The key techniques that underpin our explicit solution is a reduction
of the control problem to a Nehari problem, along with a novel factorization of
the clairvoyant controller's cost. We reveal an interesting relation between
the explicit solutions that now exist for both competitive control paradigms by
formulating a regret-optimal control framework with weight functions that can
also be utilized for practical purposes.
- Abstract(参考訳): オンライン学習における競合政策設計のアプローチに触発され、古典的な$\mathcal{H}_2$や$\mathcal{H}_\infty$の代替として、競争率や後悔最適制御といった新しい制御パラダイムが提案されている。
これらの競合指標は、設計したコントローラの制御コストと、それぞれ比率と差の点で過去、現在、将来の障害にアクセス可能な透視性コントローラのコストを比較する。
先行研究は、後悔最適制御問題に対する最適解を提供する一方で、競争比制御においては、この解は準最適問題に対してのみ提供される。
本研究では,競争比制御問題に対する最適解を導出する。
最適競争比式は, 単純な行列の最大固有値として計算できることを示し, 最適競争比を達成する状態空間制御器を提供する。
本研究では,この解析解を検証し,最適競争比制御器が複数の大規模実用システムにおいて他の制御器よりも優れていることを示す。
我々の明示的な解の基盤となる重要な技術は、制御問題をネハリ問題に還元することであり、また、透視制御器のコストの新たな因子化である。
本稿では,現在競合制御パラダイムに存在している明示的な解の相互関係を,実用目的にも利用可能な重み関数付き後悔最適制御フレームワークを定式化することによって明らかにする。
関連論文リスト
- Growing Q-Networks: Solving Continuous Control Tasks with Adaptive Control Resolution [51.83951489847344]
ロボット工学の応用において、スムーズな制御信号はシステム摩耗とエネルギー効率を減らすために一般的に好まれる。
本研究では,離散的な動作空間を粗い状態から細かい制御分解能まで拡大することにより,この性能ギャップを埋めることを目的とする。
我々の研究は、値分解とアダプティブ・コントロール・リゾリューションが組み合わさることで、単純な批判のみのアルゴリズムが得られ、連続制御タスクにおいて驚くほど高い性能が得られることを示唆している。
論文 参考訳(メタデータ) (2024-04-05T17:58:37Z) - Reinforcement Learning-based Receding Horizon Control using Adaptive Control Barrier Functions for Safety-Critical Systems [14.166970599802324]
最適制御法は、安全クリティカルな問題に対する解決策を提供するが、容易に難解になる。
モデル予測制御を利用した強化学習に基づく回帰水平制御手法を提案する。
我々は、コネクテッド・アンド・オートマチック・ビークルにおける自動マージ制御問題に適用し、本手法の有効性を検証した。
論文 参考訳(メタデータ) (2024-03-26T02:49:08Z) - Follow the Clairvoyant: an Imitation Learning Approach to Optimal
Control [4.978565634673048]
競合解析のレンズによる力学系の制御について考察する。
最適コストが理想的な閉ループ動作に関する粗い情報のみを提供するという観測により、トラッキングエラーを最小化することを提案する。
論文 参考訳(メタデータ) (2022-11-14T14:15:12Z) - Competitive Control [52.28457815067461]
我々は,オンラインコントローラの設計に重点を置き,オフラインの最適コントローラと競合するオンラインコントローラの設計に重点を置いている。
この設定における自然なパフォーマンス指標は、オンラインコントローラが引き起こしたコストとオフラインの最適コントローラが引き起こしたコストとの比である競争比である。
論文 参考訳(メタデータ) (2021-07-28T22:26:27Z) - Regret-optimal Estimation and Control [52.28457815067461]
後悔最適推定器と後悔最適制御器は状態空間形式で導出可能であることを示す。
非線形力学系に対するモデル予測制御(MPC)と拡張KalmanFilter(EKF)の残差最適類似性を提案する。
論文 参考訳(メタデータ) (2021-06-22T23:14:21Z) - Stable Online Control of Linear Time-Varying Systems [49.41696101740271]
COCO-LQは、大規模なLTVシステムの入出力安定性を保証する効率的なオンライン制御アルゴリズムである。
COCO-LQの性能を実証実験とパワーシステム周波数制御の両例で実証した。
論文 参考訳(メタデータ) (2021-04-29T06:18:49Z) - Non-stationary Online Learning with Memory and Non-stochastic Control [71.14503310914799]
我々は,過去の決定に依拠する損失関数を許容するメモリを用いたオンライン凸最適化(OCO)の問題について検討する。
本稿では,非定常環境に対してロバストなアルゴリズムを設計するための性能指標として,動的ポリシーの後悔を紹介する。
我々は,時間的地平線,非定常度,メモリ長といった面で,最適な動的ポリシーの後悔を確実に享受するメモリ付きOCOの新しいアルゴリズムを提案する。
論文 参考訳(メタデータ) (2021-02-07T09:45:15Z) - Regret-optimal measurement-feedback control [39.76359052907755]
線形力学系における測定フィードバック制御を後悔の観点から検討する。
計測フィードバック設定では、全情報設定とは異なり、障害のたびに他のすべてのオフラインコントローラより優れる単一のオフラインコントローラは存在しない。
本稿では,従来のNehari問題に対する新たな削減によって,対応する後悔最適オンラインコントローラが発見できることを示し,その後悔に対するデータ依存的制約を提示する。
論文 参考訳(メタデータ) (2020-11-24T01:36:48Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。