論文の概要: On the Stability of Nonlinear Receding Horizon Control: A Geometric
Perspective
- arxiv url: http://arxiv.org/abs/2103.15010v1
- Date: Sat, 27 Mar 2021 22:59:37 GMT
- ステータス: 処理完了
- システム内更新日: 2021-03-30 14:33:30.468054
- Title: On the Stability of Nonlinear Receding Horizon Control: A Geometric
Perspective
- Title(参考訳): 非線形回帰水平制御の安定性について:幾何学的視点
- Authors: Tyler Westenbroek, Max Simchowitz, Michael I. Jordan, S. Shankar
Sastry
- Abstract要約: 本稿では,1次定常点に対して内部計画問題を解く場合,非線形rhcに対する第1段階の安定性保証を行う。
重要なのは、計画問題に適用される状態コストが、ある意味でグローバルジオメトリと適合していることである。
- 参考スコア(独自算出の注目度): 97.7562283850024
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The widespread adoption of nonlinear Receding Horizon Control (RHC)
strategies by industry has led to more than 30 years of intense research
efforts to provide stability guarantees for these methods. However, current
theoretical guarantees require that each (generally nonconvex) planning problem
can be solved to (approximate) global optimality, which is an unrealistic
requirement for the derivative-based local optimization methods generally used
in practical implementations of RHC. This paper takes the first step towards
understanding stability guarantees for nonlinear RHC when the inner planning
problem is solved to first-order stationary points, but not necessarily global
optima. Special attention is given to feedback linearizable systems, and a
mixture of positive and negative results are provided. We establish that, under
certain strong conditions, first-order solutions to RHC exponentially stabilize
linearizable systems. Crucially, this guarantee requires that state costs
applied to the planning problems are in a certain sense `compatible' with the
global geometry of the system, and a simple counter-example demonstrates the
necessity of this condition. These results highlight the need to rethink the
role of global geometry in the context of optimization-based control.
- Abstract(参考訳): 産業における非線形回帰水平制御(RHC)戦略の普及により、これらの手法の安定性を保証するための30年以上の研究が続けられている。
しかし、現在の理論的な保証では、各(一般的には非凸な)計画問題を(概ね)大域的最適性に解くことが必要であり、これはrhcの実用的実装で一般的に用いられる微分型局所最適化法に対する非現実的な要件である。
本稿では,一階定常点に対して内部計画問題を解く際に,非線形rhcの安定性保証を理解するための第一歩を踏み出す。
フィードバック線形化システムには特に注意が払われ、正と負の混合結果が提供される。
強条件下では、rhc に対する一階解が指数関数的に安定化する。
重要なのは、この保証は、計画問題に適用される状態コストが、ある意味ではシステムの大域的形状と「相容れない」ことを必要としており、単純な反例が、この条件の必要性を示している。
これらの結果は、最適化に基づく制御の文脈におけるグローバルジオメトリの役割を再考する必要性を浮き彫りにする。
関連論文リスト
- Policy Gradient Converges to the Globally Optimal Policy for Nearly Linear-Quadratic Regulators [11.400431211239958]
準線形2次制御系における最適速度について検討する。
本稿では、勾配アルゴリズムを用いて、グローバルな最適レートで保証されるポリシーを提案する。
論文 参考訳(メタデータ) (2023-03-15T08:08:02Z) - Offline Minimax Soft-Q-learning Under Realizability and Partial Coverage [100.8180383245813]
オフライン強化学習(RL)のための値ベースアルゴリズムを提案する。
ソフトマージン条件下でのバニラQ関数の類似した結果を示す。
我々のアルゴリズムの損失関数は、推定問題を非線形凸最適化問題とラグランジフィケーションとしてキャストすることによって生じる。
論文 参考訳(メタデータ) (2023-02-05T14:22:41Z) - Fully Stochastic Trust-Region Sequential Quadratic Programming for
Equality-Constrained Optimization Problems [62.83783246648714]
目的と決定論的等式制約による非線形最適化問題を解くために,逐次2次プログラミングアルゴリズム(TR-StoSQP)を提案する。
アルゴリズムは信頼領域半径を適応的に選択し、既存の直線探索StoSQP方式と比較して不確定なヘッセン行列を利用することができる。
論文 参考訳(メタデータ) (2022-11-29T05:52:17Z) - Dynamic selection of p-norm in linear adaptive filtering via online
kernel-based reinforcement learning [8.319127681936815]
本研究は, 線形適応フィルタリングにおいて, 最適p-ノルムが外れ値と競合する問題に対して, 動的に選択する問題に対処する。
オンラインおよびデータ駆動型フレームワークはカーネルベース強化学習(KBRL)によって設計される
論文 参考訳(メタデータ) (2022-10-20T14:49:39Z) - The Probabilistic Normal Epipolar Constraint for Frame-To-Frame Rotation
Optimization under Uncertain Feature Positions [53.478856119297284]
特徴位置における異方性および不均一性を考慮した確率論的正規極性制約(PNEC)を導入する。
合成データの実験において、新しいPNECは元のNECよりも正確な回転推定値が得られることを示した。
我々は,提案手法を最先端のモノクロ回転専用オドメトリーシステムに統合し,実世界のKITTIデータセットに対して一貫した改良を行った。
論文 参考訳(メタデータ) (2022-04-05T14:47:11Z) - Neural System Level Synthesis: Learning over All Stabilizing Policies
for Nonlinear Systems [0.0]
本稿では,パラメータ最適化における閉ループ安定性を保証するニューラルSLS(Neur-SLS)手法を提案する。
本稿では,Recurrent Equilibrium Networks (RENs) に基づく最近のDeep Neural Network (DNN) モデルを用いて,非線形安定演算子の豊富なクラスについて学習する。
論文 参考訳(メタデータ) (2022-03-22T15:22:31Z) - Youla-REN: Learning Nonlinear Feedback Policies with Robust Stability
Guarantees [5.71097144710995]
本稿では,最近開発されたニューラルネットワークアーキテクチャ上に構築された不確実性システムに対する非線形制御器のパラメータ化について述べる。
提案したフレームワークは、安定性の保証、すなわち、検索空間におけるすべてのポリシーが、契約(グローバルに指数関数的に安定した)クローズドループシステムをもたらすことを保証する。
論文 参考訳(メタデータ) (2021-12-02T13:52:37Z) - Pointwise Feasibility of Gaussian Process-based Safety-Critical Control
under Model Uncertainty [77.18483084440182]
制御バリア関数(CBF)と制御リアプノフ関数(CLF)は、制御システムの安全性と安定性をそれぞれ強化するための一般的なツールである。
本稿では, CBF と CLF を用いた安全クリティカルコントローラにおいて, モデル不確実性に対処するためのガウスプロセス(GP)に基づくアプローチを提案する。
論文 参考訳(メタデータ) (2021-06-13T23:08:49Z) - Policy Mirror Descent for Regularized Reinforcement Learning: A
Generalized Framework with Linear Convergence [60.20076757208645]
本稿では,正規化RLを解くためのGPMDアルゴリズムを提案する。
我々は,このアルゴリズムが次元自由な方法で,全範囲の学習率に線形に収束することを実証した。
論文 参考訳(メタデータ) (2021-05-24T02:21:34Z) - Derivative-Free Policy Optimization for Risk-Sensitive and Robust
Control Design: Implicit Regularization and Sample Complexity [15.940861063732608]
直接政策検索は、現代の強化学習(RL)の作業馬の1つとして役立ちます。
線形リスク感知型ロバストコントローラにおける政策ロバスト性(PG)手法の収束理論について検討する。
私たちのアルゴリズムの特徴の1つは、学習フェーズ中に特定のレベルの複雑さ/リスク感受性コントローラが保持されるということです。
論文 参考訳(メタデータ) (2021-01-04T16:00:46Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。