論文の概要: Regret-optimal measurement-feedback control
- arxiv url: http://arxiv.org/abs/2011.12785v2
- Date: Tue, 22 Jun 2021 23:14:47 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-21 14:29:35.003622
- Title: Regret-optimal measurement-feedback control
- Title(参考訳): 回帰最適測定フィードバック制御
- Authors: Gautam Goel, Babak Hassibi
- Abstract要約: 線形力学系における測定フィードバック制御を後悔の観点から検討する。
計測フィードバック設定では、全情報設定とは異なり、障害のたびに他のすべてのオフラインコントローラより優れる単一のオフラインコントローラは存在しない。
本稿では,従来のNehari問題に対する新たな削減によって,対応する後悔最適オンラインコントローラが発見できることを示し,その後悔に対するデータ依存的制約を提示する。
- 参考スコア(独自算出の注目度): 39.76359052907755
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We consider measurement-feedback control in linear dynamical systems from the
perspective of regret minimization. Unlike most prior work in this area, we
focus on the problem of designing an online controller which competes with the
optimal dynamic sequence of control actions selected in hindsight, instead of
the best controller in some specific class of controllers. This formulation of
regret is attractive when the environment changes over time and no single
controller achieves good performance over the entire time horizon. We show that
in the measurement-feedback setting, unlike in the full-information setting,
there is no single offline controller which outperforms every other offline
controller on every disturbance, and propose a new $H_2$-optimal offline
controller as a benchmark for the online controller to compete against. We show
that the corresponding regret-optimal online controller can be found via a
novel reduction to the classical Nehari problem from robust control and present
a tight data-dependent bound on its regret.
- Abstract(参考訳): 線形力学系における計測フィードバック制御は、後悔の最小化の観点から考える。
この領域における多くの先行研究とは違って、特定の種類のコントローラにおいて最高のコントローラではなく、後から選択した制御動作の最適動的シーケンスと競合するオンラインコントローラを設計する問題に焦点をあてる。
この後悔の定式化は、環境が時間とともに変化し、1つのコントローラが時間全体にわたって優れたパフォーマンスを達成できない場合に魅力的です。
測定・フィードバック設定では、全情報設定とは異なり、全ての障害に対して他のオフラインコントローラを上回る単一のオフラインコントローラが存在しないことを示し、オンラインコントローラと競合するベンチマークとして新たな$h_2$-optimalオフラインコントローラを提案する。
本研究は,従来のネハリ問題に対して,頑健な制御から新たな削減を行うことにより,対応する後悔最適オンラインコントローラを見いだせることを示す。
関連論文リスト
- Optimal Competitive-Ratio Control [40.89951305613357]
最適競合比式は, 単純な行列の最大固有値として計算可能であることを示す。
本研究では,この解析解を検証し,最適競争比制御器が複数の大規模実用システムにおいて,他の制御器よりも優れた性能を示すことを示す。
論文 参考訳(メタデータ) (2022-06-03T19:01:07Z) - Competitive Control [52.28457815067461]
我々は,オンラインコントローラの設計に重点を置き,オフラインの最適コントローラと競合するオンラインコントローラの設計に重点を置いている。
この設定における自然なパフォーマンス指標は、オンラインコントローラが引き起こしたコストとオフラインの最適コントローラが引き起こしたコストとの比である競争比である。
論文 参考訳(メタデータ) (2021-07-28T22:26:27Z) - Regret-optimal Estimation and Control [52.28457815067461]
後悔最適推定器と後悔最適制御器は状態空間形式で導出可能であることを示す。
非線形力学系に対するモデル予測制御(MPC)と拡張KalmanFilter(EKF)の残差最適類似性を提案する。
論文 参考訳(メタデータ) (2021-06-22T23:14:21Z) - Regret-Optimal LQR Control [37.99652162611661]
すべてのエネルギー障害に対する最悪の後悔を最小限に抑える因果制御器を見つける。
我々は、最適後悔と状態空間設定に対する後悔最適制御のために明確な公式を導出する。
後悔の最適制御器は、制御系設計のための実行可能な選択肢として自身を提示する。
論文 参考訳(メタデータ) (2021-05-04T01:51:00Z) - Meta-Learning Guarantees for Online Receding Horizon Learning Control [0.0]
本稿では,オンラインメタ学習遅延水平方向制御アルゴリズムを反復制御設定で証明可能な後悔の保証を提供する。
イテレーション内で学ぶことの最悪の後悔は、より多くのイテレーションの経験によって改善されることを示します。
論文 参考訳(メタデータ) (2020-10-21T21:57:04Z) - Regret-optimal control in dynamic environments [39.76359052907755]
我々は、後から選択した制御行動の最良の動的シーケンスに対する後悔を最小限に抑えるオンラインコントローラを設計する問題に焦点をあてる。
我々は,新たなH_infty$制御への還元により,後悔最適制御系の状態空間構造を導出する。
本稿では,H_infty$-Optimal コントローラの性能と対向環境との相補性を示す数値実験について述べる。
論文 参考訳(メタデータ) (2020-10-20T17:32:17Z) - Learning a Contact-Adaptive Controller for Robust, Efficient Legged
Locomotion [95.1825179206694]
四足歩行ロボットのためのロバストコントローラを合成するフレームワークを提案する。
高レベルコントローラは、環境の変化に応じてプリミティブのセットを選択することを学習する。
確立された制御方法を使用してプリミティブを堅牢に実行する低レベルコントローラ。
論文 参考訳(メタデータ) (2020-09-21T16:49:26Z) - Improper Learning for Non-Stochastic Control [78.65807250350755]
逆方向の摂動, 逆方向に選択された凸損失関数, 部分的に観察された状態を含む, 未知の線形力学系を制御することの問題点を考察する。
このパラメトリゼーションにオンライン降下を適用することで、大規模なクローズドループポリシーに対してサブリニア後悔を実現する新しいコントローラが得られる。
我々の境界は、線形力学コントローラの安定化と競合する非確率的制御設定における最初のものである。
論文 参考訳(メタデータ) (2020-01-25T02:12:48Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。