論文の概要: Self-Tuning PID Control via a Hybrid Actor-Critic-Based Neural Structure
for Quadcopter Control
- arxiv url: http://arxiv.org/abs/2307.01312v1
- Date: Mon, 3 Jul 2023 19:35:52 GMT
- ステータス: 処理完了
- システム内更新日: 2023-07-06 19:16:58.972800
- Title: Self-Tuning PID Control via a Hybrid Actor-Critic-Based Neural Structure
for Quadcopter Control
- Title(参考訳): クアッドコプター制御のためのハイブリッドアクタクリティカルベースニューラルネットワークによる自己調整型PID制御
- Authors: Iman Sharifi, Aria Alasty
- Abstract要約: Proportional-Integrator-Derivative (PID) コントローラは、幅広い産業および実験プロセスで使用されている。
モデルパラメータの不確実性と外乱のため、Quadrotorsのような実際のシステムはより堅牢で信頼性の高いPIDコントローラを必要とする。
本研究では,Reinforcement-Learning-based Neural Networkを用いた自己調整型PIDコントローラについて検討した。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Proportional-Integrator-Derivative (PID) controller is used in a wide range
of industrial and experimental processes. There are a couple of offline methods
for tuning PID gains. However, due to the uncertainty of model parameters and
external disturbances, real systems such as Quadrotors need more robust and
reliable PID controllers. In this research, a self-tuning PID controller using
a Reinforcement-Learning-based Neural Network for attitude and altitude control
of a Quadrotor has been investigated. An Incremental PID, which contains static
and dynamic gains, has been considered and only the variable gains have been
tuned. To tune dynamic gains, a model-free actor-critic-based hybrid neural
structure was used that was able to properly tune PID gains, and also has done
the best as an identifier. In both tunning and identification tasks, a Neural
Network with two hidden layers and sigmoid activation functions has been
learned using Adaptive Momentum (ADAM) optimizer and Back-Propagation (BP)
algorithm. This method is online, able to tackle disturbance, and fast in
training. In addition to robustness to mass uncertainty and wind gust
disturbance, results showed that the proposed method had a better performance
when compared to a PID controller with constant gains.
- Abstract(参考訳): Proportional-Integrator-Derivative (PID) コントローラは、幅広い産業および実験プロセスで使用されている。
PIDゲインをチューニングするためのオフラインメソッドはいくつかあります。
しかし、モデルパラメータの不確実性と外乱のため、Quadrotorsのような実際のシステムはより堅牢で信頼性の高いPIDコントローラを必要とする。
本研究では,クアドロレータの姿勢・高度制御のための強化学習型ニューラルネットワークを用いた自己調整型PIDコントローラについて検討した。
静的および動的ゲインを含むインクリメンタルPIDが検討され、可変ゲインのみがチューニングされている。
動的ゲインをチューニングするために、PIDゲインを適切にチューニングできるモデルフリーアクターベースのハイブリッドニューラル構造を使用しており、識別子としても最善を尽くしている。
2つの隠れ層とsgmoidアクティベーション関数を持つニューラルネットワークは, 適応運動量(adam)オプティマイザとバックプロパゲーション(bp)アルゴリズムを用いて学習した。
この方法はオンラインであり、障害に対処し、訓練を素早く行うことができる。
質量不確実性や風のガスト乱に対するロバスト性に加えて, 一定ゲインを有するPIDコントローラと比較して, 提案手法は良好な性能を示した。
関連論文リスト
- Function Approximation for Reinforcement Learning Controller for Energy from Spread Waves [69.9104427437916]
マルチジェネレータ・ウェーブ・エナジー・コンバータ(WEC)は、スプレッド・ウェーブと呼ばれる異なる方向から来る複数の同時波を処理しなければならない。
これらの複雑な装置は、エネルギー捕獲効率、維持を制限する構造的ストレスの低減、高波に対する積極的な保護という複数の目的を持つコントローラを必要とする。
本稿では,システム力学のシーケンシャルな性質をモデル化する上で,ポリシーと批判ネットワークの異なる機能近似について検討する。
論文 参考訳(メタデータ) (2024-04-17T02:04:10Z) - PID Control-Based Self-Healing to Improve the Robustness of Large Language Models [23.418411870842178]
マイナーな摂動は、よく訓練された言語モデルの性能を大幅に低下させる。
我々は、望ましくないモデル行動を修正するために、計算効率の良い自己修復プロセスを構築した。
提案したPID制御による自己修復は、事前訓練された大規模言語モデルの堅牢性を改善するための低コストなフレームワークである。
論文 参考訳(メタデータ) (2024-03-31T23:46:51Z) - Beyond PID Controllers: PPO with Neuralized PID Policy for Proton Beam
Intensity Control in Mu2e [3.860979702631594]
我々は,Fermi National Accelerator Laboratory (Fermilab) におけるMuon to Electron Conversion Experiment (Mu2e) における均一な陽子ビーム強度の伝達を維持することを目的とした,新しいPPOアルゴリズムを提案する。
我々の主な目的は、一貫した強度プロファイルを確保するために、一貫した強度プロファイルを確保するために、スピル制御システム(SRS)パラメータのリアルタイムフィードバックとキャリブレーションをミリ秒のタイムスケールで実現する自動制御器を作成することにある。
論文 参考訳(メタデータ) (2023-12-28T21:35:20Z) - Sub-linear Regret in Adaptive Model Predictive Control [56.705978425244496]
本稿では,STT-MPC (Self-Tuning tube-based Model Predictive Control) について述べる。
システム力学を最初に認識したアルゴリズムと比較して,アルゴリズムの後悔を解析する。
論文 参考訳(メタデータ) (2023-10-07T15:07:10Z) - Real-Time Model-Free Deep Reinforcement Learning for Force Control of a
Series Elastic Actuator [56.11574814802912]
最先端のロボットアプリケーションは、歩行、揚力、操作などの複雑なタスクを達成するために、閉ループ力制御を備えた連続弾性アクチュエータ(SEAs)を使用する。
モデルフリーPID制御法はSEAの非線形性により不安定になりやすい。
深層強化学習は連続制御タスクに有効なモデルレス手法であることが証明されている。
論文 参考訳(メタデータ) (2023-04-11T00:51:47Z) - Performance-Driven Controller Tuning via Derivative-Free Reinforcement
Learning [6.5158195776494]
我々は,新しい微分自由強化学習フレームワークを用いて,制御器のチューニング問題に取り組む。
我々は,PIDコントローラを用いた適応走行制御とMPCコントローラを用いた軌道追跡という,自律走行による2つの具体例に関する数値実験を行った。
実験の結果,提案手法は一般的なベースラインよりも優れており,コントローラチューニングの強い可能性を強調している。
論文 参考訳(メタデータ) (2022-09-11T13:01:14Z) - On Controller Tuning with Time-Varying Bayesian Optimization [74.57758188038375]
制御対象とその変更に関する適切な事前知識を用いて、時間変化最適化(TVBO)を用いて、変更環境におけるコントローラのオンラインチューニングを行う。
本研究では,不確実性注入(UI)を用いたTVBO戦略を提案する。
我々のモデルはTVBOの最先端手法よりも優れており、後悔の軽減と不安定なパラメータ構成の低減を実現している。
論文 参考訳(メタデータ) (2022-07-22T14:54:13Z) - DiffLoop: Tuning PID controllers by differentiating through the feedback
loop [8.477619837043214]
本稿では,PIDチューニングとアンチ・ウィンドアップ対策について検討する。
特に、コスト関数を用いて、制御性能を向上させるために勾配を生成する。
論文 参考訳(メタデータ) (2021-06-19T15:26:46Z) - DAIS: Automatic Channel Pruning via Differentiable Annealing Indicator
Search [55.164053971213576]
畳み込みニューラルネットワークは,計算オーバーヘッドが大きいにもかかわらず,コンピュータビジョンタスクの実行において大きな成功を収めている。
構造的(チャネル)プルーニングは、通常、ネットワーク構造を保ちながらモデルの冗長性を低減するために適用される。
既存の構造化プルーニング法では、手作りのルールが必要であり、これは大きなプルーニング空間に繋がる可能性がある。
論文 参考訳(メタデータ) (2020-11-04T07:43:01Z) - Control Design of Autonomous Drone Using Deep Learning Based Image
Understanding Techniques [1.0953917735844645]
本稿では,室内の騒音や不確実性を考慮して,自律飛行を行うための制御器の入力として画像を使用する新しい枠組みを提案する。
ノイズの多い環境下でドローン/クワッドコプターの飛行安定性を向上させるために, 微分フィルタを用いた新しいPIDA制御を提案する。
論文 参考訳(メタデータ) (2020-04-27T15:50:04Z) - Logarithmic Regret Bound in Partially Observable Linear Dynamical
Systems [91.43582419264763]
部分的に観測可能な線形力学系におけるシステム同定と適応制御の問題について検討する。
開ループ系と閉ループ系の両方において有限時間保証付きの最初のモデル推定法を提案する。
AdaptOnは、未知の部分観測可能な線形力学系の適応制御において、$textpolylogleft(Tright)$ regretを達成する最初のアルゴリズムであることを示す。
論文 参考訳(メタデータ) (2020-03-25T06:00:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。