論文の概要: Adaptive Optimal Trajectory Tracking Control Applied to a Large-Scale
Ball-on-Plate System
- arxiv url: http://arxiv.org/abs/2010.13486v2
- Date: Mon, 25 Jan 2021 09:39:34 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-02 20:25:48.652033
- Title: Adaptive Optimal Trajectory Tracking Control Applied to a Large-Scale
Ball-on-Plate System
- Title(参考訳): 大規模ボールオンプレートシステムに適用した適応最適軌道追従制御
- Authors: Florian K\"opf, Sean Kille, Jairo Inga, S\"oren Hohmann
- Abstract要約: ADPを用いた大規模ボール・オン・プレートシステムのための最適軌道追従制御器を提案する。
提案手法では,セットポイントトラッキングの代わりに参照軌道を近似し,一定のオフセット項を自動的に補償することができる。
実験の結果, このトラッキング機構は, セットポイントコントローラに比べて制御コストを大幅に削減することがわかった。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: While many theoretical works concerning Adaptive Dynamic Programming (ADP)
have been proposed, application results are scarce. Therefore, we design an
ADP-based optimal trajectory tracking controller and apply it to a large-scale
ball-on-plate system. Our proposed method incorporates an approximated
reference trajectory instead of using setpoint tracking and allows to
automatically compensate for constant offset terms. Due to the off-policy
characteristics of the algorithm, the method requires only a small amount of
measured data to train the controller. Our experimental results show that this
tracking mechanism significantly reduces the control cost compared to setpoint
controllers. Furthermore, a comparison with a model-based optimal controller
highlights the benefits of our model-free data-based ADP tracking controller,
where no system model and manual tuning are required but the controller is
tuned automatically using measured data.
- Abstract(参考訳): 適応動的プログラミング(ADP)に関する多くの理論的研究が提案されているが、アプリケーションの結果は乏しい。
そこで本研究では,adpに基づく最適軌道追従制御系を設計,大規模ボールオンプレートシステムに適用する。
提案手法は, セットポイント追跡に代えて近似参照軌跡を取り入れ, 一定のオフセット項を自動的に補償する。
アルゴリズムのオフポリシー特性のため、この方法はコントローラを訓練するために少量の計測データしか必要としない。
実験の結果, このトラッキング機構は, セットポイントコントローラに比べて制御コストを大幅に削減することがわかった。
さらに、モデルベース最適制御器との比較では、システムモデルや手動チューニングが不要なモデルフリーデータベースのADPトラッキング制御器の利点が強調されるが、制御器は測定データを用いて自動的に調整される。
関連論文リスト
- Adaptive Gain Scheduling using Reinforcement Learning for Quadcopter
Control [0.0]
本稿では, クアッドコプター制御器の制御利得を適応させるために, 強化学習を用いた手法を提案する。
このコントローラの第一の目的は、特定の軌跡を辿りながらトラッキングエラーを最小限にすることである。
その結果,適応利得方式は静的利得制御器と比較して40$%以上の追従誤差を減少させることがわかった。
論文 参考訳(メタデータ) (2024-03-12T00:08:54Z) - Tuning Legged Locomotion Controllers via Safe Bayesian Optimization [47.87675010450171]
本稿では,ロボットハードウェアプラットフォームにおけるモデルベースコントローラの展開を効率化するための,データ駆動型戦略を提案する。
モデルフリーな安全な学習アルゴリズムを用いて制御ゲインのチューニングを自動化し、制御定式化で使用される単純化されたモデルと実システムとのミスマッチに対処する。
論文 参考訳(メタデータ) (2023-06-12T13:10:14Z) - Training Efficient Controllers via Analytic Policy Gradient [44.0762454494769]
ロボットシステムの制御設計は複雑であり、しばしば軌道を正確に追従するために最適化を解く必要がある。
Model Predictive Control (MPC)のようなオンライン最適化手法は、優れたトラッキング性能を実現するために示されているが、高い計算能力を必要とする。
本稿では,この問題に対処するための分析政策グラディエント(APG)手法を提案する。
論文 参考訳(メタデータ) (2022-09-26T22:04:35Z) - Performance-Driven Controller Tuning via Derivative-Free Reinforcement
Learning [6.5158195776494]
我々は,新しい微分自由強化学習フレームワークを用いて,制御器のチューニング問題に取り組む。
我々は,PIDコントローラを用いた適応走行制御とMPCコントローラを用いた軌道追跡という,自律走行による2つの具体例に関する数値実験を行った。
実験の結果,提案手法は一般的なベースラインよりも優れており,コントローラチューニングの強い可能性を強調している。
論文 参考訳(メタデータ) (2022-09-11T13:01:14Z) - Policy Search for Model Predictive Control with Application to Agile
Drone Flight [56.24908013905407]
MPCのためのポリシ・フォー・モデル・予測制御フレームワークを提案する。
具体的には、パラメータ化コントローラとしてMPCを定式化し、パラメータ化の難しい決定変数を高レベルポリシーとして表現する。
シミュレーションと実環境の両方において,我々の制御器が堅牢かつリアルタイムに制御性能を発揮することを示す実験を行った。
論文 参考訳(メタデータ) (2021-12-07T17:39:24Z) - Automated Controller Calibration by Kalman Filtering [2.2237337682863125]
提案手法は広範囲のコントローラに適用可能である。
この方法は、オンラインで堅牢にパラメータをチューニングし、計算効率が高く、データストレージの要件が低く、実装が容易である。
高忠実度車両シミュレータCarSimによるシミュレーション研究により、複雑な力学系のコントローラをオンラインで校正できることが示されている。
論文 参考訳(メタデータ) (2021-11-21T14:57:11Z) - Finite-time System Identification and Adaptive Control in Autoregressive
Exogenous Systems [79.67879934935661]
未知のARXシステムのシステム識別と適応制御の問題について検討する。
我々は,オープンループとクローズループの両方のデータ収集の下で,ARXシステムに対する有限時間学習保証を提供する。
論文 参考訳(メタデータ) (2021-08-26T18:00:00Z) - Regret-optimal Estimation and Control [52.28457815067461]
後悔最適推定器と後悔最適制御器は状態空間形式で導出可能であることを示す。
非線形力学系に対するモデル予測制御(MPC)と拡張KalmanFilter(EKF)の残差最適類似性を提案する。
論文 参考訳(メタデータ) (2021-06-22T23:14:21Z) - Safe and Efficient Model-free Adaptive Control via Bayesian Optimization [39.962395119933596]
適応制御のための純粋データ駆動型モデルフリーアプローチを提案する。
システムデータのみに基づく低レベルコントローラのチューニングは、アルゴリズムの安全性と計算性能に懸念を生じさせる。
我々は,提案手法がサンプル効率であり,安全性の観点から制約ベイズ最適化よりも優れており,グリッド評価によって計算された性能オプティマを達成することを数値的に示す。
論文 参考訳(メタデータ) (2021-01-19T19:15:00Z) - Gaussian Process-based Min-norm Stabilizing Controller for
Control-Affine Systems with Uncertain Input Effects and Dynamics [90.81186513537777]
本稿では,この問題の制御・アフィン特性を捉えた新しい化合物カーネルを提案する。
この結果の最適化問題は凸であることを示し、ガウス過程に基づく制御リャプノフ関数第二次コーンプログラム(GP-CLF-SOCP)と呼ぶ。
論文 参考訳(メタデータ) (2020-11-14T01:27:32Z) - Adaptive Control and Regret Minimization in Linear Quadratic Gaussian
(LQG) Setting [91.43582419264763]
我々は不確実性に直面した楽観主義の原理に基づく新しい強化学習アルゴリズムLqgOptを提案する。
LqgOptはシステムのダイナミクスを効率的に探索し、モデルのパラメータを信頼区間まで推定し、最も楽観的なモデルのコントローラをデプロイする。
論文 参考訳(メタデータ) (2020-03-12T19:56:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。