論文の概要: Extending iLQR method with control delay
- arxiv url: http://arxiv.org/abs/2002.07630v1
- Date: Sun, 16 Feb 2020 04:35:10 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-31 18:24:06.971634
- Title: Extending iLQR method with control delay
- Title(参考訳): 制御遅延によるiLQR法の拡張
- Authors: Cheng Ju, Yan Qin and Chunjiang Fu
- Abstract要約: 反復線形四進法レギュレータ(iLQR)は非線形最適制御問題に対処するためのベンチマーク手法となっている。
本稿では、iLQR理論を拡張し、入力信号が一定遅延の場合に新しい定理を証明する。
- 参考スコア(独自算出の注目度): 2.384873896423002
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Iterative linear quadradic regulator(iLQR) has become a benchmark method to
deal with nonlinear stochastic optimal control problem. However, it does not
apply to delay system. In this paper, we extend the iLQR theory and prove new
theorem in case of input signal with fixed delay. Which could be beneficial for
machine learning or optimal control application to real time robot or human
assistive device.
- Abstract(参考訳): 反復線形二次レギュレータ(ilqr)は非線形確率的最適制御問題に対処するベンチマーク手法となっている。
しかし、遅延システムには適用されない。
本稿では、iLQR理論を拡張し、入力信号が一定遅延の場合に新しい定理を証明する。
機械学習や、リアルタイムロボットや人間の補助装置への最適な制御アプリケーションに有用かもしれない。
関連論文リスト
- Boosting Reinforcement Learning with Strongly Delayed Feedback Through Auxiliary Short Delays [41.52768902667611]
強化学習(Reinforcement Learning, RL)は、事象と知覚知覚の間の遅延の一般的な場合において困難である。
本稿では、短時間の遅延を含む補助的なタスクを活用して、長時間の遅延でRLを高速化する、Auxiliary-Delayed Reinforcement Learning (AD-RL) 法を提案する。
具体的には、AD-RLは短い遅延に対する値関数を学習し、ブートストラップとポリシー改善技術を用いて長い遅延に調整する。
論文 参考訳(メタデータ) (2024-02-05T16:11:03Z) - Regret Analysis of Online LQR Control via Trajectory Prediction and
Tracking: Extended Version [1.6344851071810074]
本稿では,オンライン線形二次規制(LQR)制御の新しい手法の提案と解析を行う。
提案手法では,最適軌道の予測に利用可能なコスト行列と,その方向を追従するトラッキングコントローラを用いる。
提案手法は,従来のオンラインLQR法と比較して性能が向上することを示す。
論文 参考訳(メタデータ) (2023-02-21T02:48:57Z) - Training Efficient Controllers via Analytic Policy Gradient [44.0762454494769]
ロボットシステムの制御設計は複雑であり、しばしば軌道を正確に追従するために最適化を解く必要がある。
Model Predictive Control (MPC)のようなオンライン最適化手法は、優れたトラッキング性能を実現するために示されているが、高い計算能力を必要とする。
本稿では,この問題に対処するための分析政策グラディエント(APG)手法を提案する。
論文 参考訳(メタデータ) (2022-09-26T22:04:35Z) - Improving the Performance of Robust Control through Event-Triggered
Learning [74.57758188038375]
LQR問題における不確実性に直面していつ学習するかを決定するイベントトリガー学習アルゴリズムを提案する。
本研究では,ロバストな制御器ベースライン上での性能向上を数値例で示す。
論文 参考訳(メタデータ) (2022-07-28T17:36:37Z) - Thompson Sampling Achieves $\tilde O(\sqrt{T})$ Regret in Linear
Quadratic Control [85.22735611954694]
我々はトンプソンサンプリング(TS)を用いた安定化可能な線形四元系レギュレータ(LQR)の適応制御問題について検討する。
我々は,LQRの適応制御のための効率的なTSアルゴリズムTSACを提案し,多次元システムであっても,$tilde O(sqrtT)$ regretを実現する。
論文 参考訳(メタデータ) (2022-06-17T02:47:53Z) - Nonlinear Control Allocation: A Learning Based Approach [0.0]
現代の航空機は、耐故障性と操縦性要件を満たすために冗長な制御エフェクターで設計されている。
これにより航空機は過度に作動し、制御エフェクタ間で制御コマンドを分配するために制御割り当てスキームが必要となる。
伝統的に最適化に基づく制御割当スキームが用いられるが、非線型割当問題では、これらの手法は大きな計算資源を必要とする。
本研究では,ニューラルネットワーク(ANN)に基づく非線形制御割り当て方式を提案する。
論文 参考訳(メタデータ) (2022-01-17T02:30:25Z) - Finite-time System Identification and Adaptive Control in Autoregressive
Exogenous Systems [79.67879934935661]
未知のARXシステムのシステム識別と適応制御の問題について検討する。
我々は,オープンループとクローズループの両方のデータ収集の下で,ARXシステムに対する有限時間学習保証を提供する。
論文 参考訳(メタデータ) (2021-08-26T18:00:00Z) - Two-step reinforcement learning for model-free redesign of nonlinear
optimal regulator [1.5624421399300306]
強化学習(Reinforcement Learning, RL)は、非線形力学系のための最適制御系をモデル無しで再設計できる、有望なアプローチの1つである。
未知の非線形システムに対する最適レギュレーション再設計問題において,RLの過渡学習性能を向上させるモデルフリー2段階設計手法を提案する。
論文 参考訳(メタデータ) (2021-03-05T17:12:33Z) - Adaptive Control and Regret Minimization in Linear Quadratic Gaussian
(LQG) Setting [91.43582419264763]
我々は不確実性に直面した楽観主義の原理に基づく新しい強化学習アルゴリズムLqgOptを提案する。
LqgOptはシステムのダイナミクスを効率的に探索し、モデルのパラメータを信頼区間まで推定し、最も楽観的なモデルのコントローラをデプロイする。
論文 参考訳(メタデータ) (2020-03-12T19:56:38Z) - Logarithmic Regret for Adversarial Online Control [56.12283443161479]
対数的後悔を伴う最初のアルゴリズムを任意対数外乱列に対して与える。
我々のアルゴリズムと分析はオフライン制御法の特徴を利用してオンライン制御問題を(遅延)オンライン学習に還元する。
論文 参考訳(メタデータ) (2020-02-29T06:29:19Z) - Certified Reinforcement Learning with Logic Guidance [78.2286146954051]
線形時間論理(LTL)を用いて未知の連続状態/動作マルコフ決定過程(MDP)のゴールを定式化できるモデルフリーなRLアルゴリズムを提案する。
このアルゴリズムは、トレースが仕様を最大確率で満たす制御ポリシーを合成することが保証される。
論文 参考訳(メタデータ) (2019-02-02T20:09:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。