論文の概要: On the Effectiveness of Iterative Learning Control
- arxiv url: http://arxiv.org/abs/2111.09434v1
- Date: Wed, 17 Nov 2021 22:35:39 GMT
- ステータス: 処理完了
- システム内更新日: 2021-11-19 15:12:35.529317
- Title: On the Effectiveness of Iterative Learning Control
- Title(参考訳): 反復学習制御の有効性について
- Authors: Anirudh Vemula, Wen Sun, Maxim Likhachev, J. Andrew Bagnell
- Abstract要約: 反復学習制御 (ILC) は, モデル誤差の存在下で, 高い性能追跡を行うための強力な手法である。
大規模なモデリングエラーがあっても、ICCの有効性を説明する理論的な研究はほとんどない。
ILC の最適 LQR コントローラに対して測定された準最適差は,高次項による MM よりも小さいことを示す。
- 参考スコア(独自算出の注目度): 28.76900887141432
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Iterative learning control (ILC) is a powerful technique for high performance
tracking in the presence of modeling errors for optimal control applications.
There is extensive prior work showing its empirical effectiveness in
applications such as chemical reactors, industrial robots and quadcopters.
However, there is little prior theoretical work that explains the effectiveness
of ILC even in the presence of large modeling errors, where optimal control
methods using the misspecified model (MM) often perform poorly. Our work
presents such a theoretical study of the performance of both ILC and MM on
Linear Quadratic Regulator (LQR) problems with unknown transition dynamics. We
show that the suboptimality gap, as measured with respect to the optimal LQR
controller, for ILC is lower than that for MM by higher order terms that become
significant in the regime of high modeling errors. A key part of our analysis
is the perturbation bounds for the discrete Ricatti equation in the finite
horizon setting, where the solution is not a fixed point and requires tracking
the error using recursive bounds. We back our theoretical findings with
empirical experiments on a toy linear dynamical system with an approximate
model, a nonlinear inverted pendulum system with misspecified mass, and a
nonlinear planar quadrotor system in the presence of wind. Experiments show
that ILC outperforms MM significantly, in terms of the cost of computed
trajectories, when modeling errors are high.
- Abstract(参考訳): 反復学習制御(ilc)は、最適制御アプリケーションのためのモデリングエラーの存在下での高性能追跡のための強力な技術である。
化学反応器、産業用ロボット、クワッドコプターなどの応用における実証的な効果を示す広範な先行研究がある。
しかし,誤特定モデル (mm) を用いた最適制御手法の性能が低くなるような大規模モデリング誤差が存在する場合でも,ircの有効性を説明する先行的な理論的な研究は少ない。
本研究は、線形二次レギュレータ(LQR)問題におけるICCとMMの両方の性能に関する理論的研究である。
ILC の最適 LQR コントローラに対して測定された準最適差は,高モデリング誤差の状況において重要となる高次項による MM よりも小さいことを示す。
解析の重要な部分は、有限地平線設定における離散リカティ方程式の摂動境界であり、解は不動点ではなく、再帰的境界を用いて誤差を追跡する必要がある。
我々は,近似モデルを用いた玩具線形力学系,不特定質量の非線形反転振子系,風の存在下での非線形平面四重項系に関する実験的な実験を行った。
実験の結果, モデル誤差が高い場合, ILC は計算トラジェクトリのコストにおいてMM を著しく上回ることがわかった。
関連論文リスト
- Koopman-Based Surrogate Modelling of Turbulent Rayleigh-Bénard Convection [4.248022697109535]
我々は,LRAN(Linear Recurrent Autoencoder Network)と呼ばれるクープマンにインスパイアされたアーキテクチャを用いて,対流中の低次ダイナミクスを学習する。
従来の流体力学法であるKernel Dynamic Mode Decomposition (KDMD)を用いてLRANを比較する。
我々は,最も乱流条件下では,KDMDよりもLRANの方が正確な予測値を得た。
論文 参考訳(メタデータ) (2024-05-10T12:15:02Z) - Data-driven Nonlinear Model Reduction using Koopman Theory: Integrated
Control Form and NMPC Case Study [56.283944756315066]
そこで本研究では,遅延座標符号化と全状態復号化を組み合わせた汎用モデル構造を提案し,Koopmanモデリングと状態推定を統合した。
ケーススタディでは,本手法が正確な制御モデルを提供し,高純度極低温蒸留塔のリアルタイム非線形予測制御を可能にすることを実証している。
論文 参考訳(メタデータ) (2024-01-09T11:54:54Z) - Model-Based Reparameterization Policy Gradient Methods: Theory and
Practical Algorithms [88.74308282658133]
Reization (RP) Policy Gradient Methods (PGM) は、ロボット工学やコンピュータグラフィックスにおける連続的な制御タスクに広く採用されている。
近年の研究では、長期強化学習問題に適用した場合、モデルベースRP PGMはカオス的かつ非滑らかな最適化環境を経験する可能性があることが示されている。
本稿では,長期モデルアンロールによる爆発的分散問題を緩和するスペクトル正規化法を提案する。
論文 参考訳(メタデータ) (2023-10-30T18:43:21Z) - Learning Nonlinear Projections for Reduced-Order Modeling of Dynamical
Systems using Constrained Autoencoders [0.0]
制約付き自己エンコーダニューラルネットワークによって記述された非線形射影のクラスを導入し,データから多様体と射影繊維の両方を学習する。
我々のアーキテクチャでは、エンコーダがデコーダの左逆であることを保証するために、可逆的アクティベーション関数と生物直交重み行列を用いる。
また,高速なダイナミックスと非正規性を考慮した斜め射影ファイバの学習を促進するために,新しいダイナミックス対応コスト関数を導入する。
論文 参考訳(メタデータ) (2023-07-28T04:01:48Z) - Multirotor Ensemble Model Predictive Control I: Simulation Experiments [0.0]
アンサンブル表現されたガウス過程は、初期時間の最適利得を決定するために後方計算を行う。
端末制御と制御問題のためのEMPCを構築し、シミュレーション・同一双対研究の制御に適用する。
論文 参考訳(メタデータ) (2023-05-22T01:32:17Z) - Two-step reinforcement learning for model-free redesign of nonlinear
optimal regulator [1.5624421399300306]
強化学習(Reinforcement Learning, RL)は、非線形力学系のための最適制御系をモデル無しで再設計できる、有望なアプローチの1つである。
未知の非線形システムに対する最適レギュレーション再設計問題において,RLの過渡学習性能を向上させるモデルフリー2段階設計手法を提案する。
論文 参考訳(メタデータ) (2021-03-05T17:12:33Z) - Gaussian Process-based Min-norm Stabilizing Controller for
Control-Affine Systems with Uncertain Input Effects and Dynamics [90.81186513537777]
本稿では,この問題の制御・アフィン特性を捉えた新しい化合物カーネルを提案する。
この結果の最適化問題は凸であることを示し、ガウス過程に基づく制御リャプノフ関数第二次コーンプログラム(GP-CLF-SOCP)と呼ぶ。
論文 参考訳(メタデータ) (2020-11-14T01:27:32Z) - Derivative-Based Koopman Operators for Real-Time Control of Robotic
Systems [14.211417879279075]
本稿では, モデル誤差を拘束する非線形力学をデータ駆動で同定するための一般化可能な手法を提案する。
クープマン演算子に基づく線形表現を構築し,テイラー級数精度解析を用いて誤差境界を導出する。
制御と組み合わせると、非線形系のクープマン表現は競合する非線形モデリング法よりも極端に優れた性能を持つ。
論文 参考訳(メタデータ) (2020-10-12T15:15:13Z) - Adaptive Control and Regret Minimization in Linear Quadratic Gaussian
(LQG) Setting [91.43582419264763]
我々は不確実性に直面した楽観主義の原理に基づく新しい強化学習アルゴリズムLqgOptを提案する。
LqgOptはシステムのダイナミクスを効率的に探索し、モデルのパラメータを信頼区間まで推定し、最も楽観的なモデルのコントローラをデプロイする。
論文 参考訳(メタデータ) (2020-03-12T19:56:38Z) - Information Theoretic Model Predictive Q-Learning [64.74041985237105]
本稿では,情報理論的MPCとエントロピー正規化RLとの新たな理論的関連性を示す。
バイアスモデルを利用したQ-ラーニングアルゴリズムを開発した。
論文 参考訳(メタデータ) (2019-12-31T00:29:22Z) - Localized Debiased Machine Learning: Efficient Inference on Quantile
Treatment Effects and Beyond [69.83813153444115]
因果推論における(局所)量子化処理効果((L)QTE)の効率的な推定式を検討する。
Debiased Machine Learning (DML)は、高次元のニュアンスを推定するデータ分割手法である。
本稿では、この負担のかかるステップを避けるために、局所的脱バイアス機械学習(LDML)を提案する。
論文 参考訳(メタデータ) (2019-12-30T14:42:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。