論文の概要: Reinforcement Learning Position Control of a Quadrotor Using Soft Actor-Critic (SAC)
- arxiv url: http://arxiv.org/abs/2512.18333v1
- Date: Sat, 20 Dec 2025 11:57:20 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-23 18:54:32.294024
- Title: Reinforcement Learning Position Control of a Quadrotor Using Soft Actor-Critic (SAC)
- Title(参考訳): SAC(Soft Actor-Critic)を用いた擬似ロボットの強化学習位置制御
- Authors: Youssef Mahran, Zeyad Gamal, Ayman El-Badawy,
- Abstract要約: 本稿では,四元数に対する新しい強化学習(RL)に基づく制御アーキテクチャを提案する。
RLエージェントは、所望のロール($)とピッチ($)の角度とともに、四重項のz軸に沿った全体の推力の比率を計算する。
PIDコントローラは、制御信号をモーターRPMにマッピングする。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This paper proposes a new Reinforcement Learning (RL) based control architecture for quadrotors. With the literature focusing on controlling the four rotors' RPMs directly, this paper aims to control the quadrotor's thrust vector. The RL agent computes the percentage of overall thrust along the quadrotor's z-axis along with the desired Roll ($φ$) and Pitch ($θ$) angles. The agent then sends the calculated control signals along with the current quadrotor's Yaw angle ($ψ$) to an attitude PID controller. The PID controller then maps the control signals to motor RPMs. The Soft Actor-Critic algorithm, a model-free off-policy stochastic RL algorithm, was used to train the RL agents. Training results show the faster training time of the proposed thrust vector controller in comparison to the conventional RPM controllers. Simulation results show smoother and more accurate path-following for the proposed thrust vector controller.
- Abstract(参考訳): 本稿では,四元数に対する新しい強化学習(RL)に基づく制御アーキテクチャを提案する。
本論文は, 4つのロータのRPMを直接制御することに焦点を当て, 四重項の推力ベクトルを制御することを目的とする。
RLエージェントは、所望のロール(φ$)とピッチ(θ$)の角度とともに、四重項のz軸に沿った全体の推力の比率を計算する。
エージェントは計算された制御信号を、現在の四角子のYaw角($)と共に姿勢PIDコントローラに送信する。
PIDコントローラは、制御信号をモーターRPMにマッピングする。
モデルのない確率的RLアルゴリズムであるSoft Actor-Criticアルゴリズムは、RLエージェントのトレーニングに使用された。
トレーニング結果は従来のRPMコントローラと比較して,提案した推力ベクトルコントローラの学習時間を短縮することを示す。
シミュレーションの結果,提案した推力ベクトル制御器の経路追従精度が向上した。
関連論文リスト
- Control of a Twin Rotor using Twin Delayed Deep Deterministic Policy Gradient (TD3) [0.0]
本稿では,Twin Rotor Aerodynamic System (TRAS) の安定化のための強化学習フレームワークを提案する。
TRASの複雑な力学と非線形特性は、従来の制御アルゴリズムによる制御を困難にしている。
実世界の応用における制御器の有効性を確認するため,実験室で実験を行った。
論文 参考訳(メタデータ) (2025-12-15T14:10:04Z) - Learning to Drift in Extreme Turning with Active Exploration and Gaussian Process Based MPC [12.133328085287497]
レースにおける極端なコーナーリングは、しばしば大きなサイドスリップ角につながり、車両制御にとって重要な課題である。
モデル予測制御(MPC)とガウス過程回帰(GPR)を統合するモデル補正ドリフトコントローラを提案する。
GPRは、ドリフト平衡解法とMPC最適化過程の両方において、車両モデルのミスマッチを補正するために使用される。
論文 参考訳(メタデータ) (2024-10-08T06:56:51Z) - Partial End-to-end Reinforcement Learning for Robustness Against Modelling Error in Autonomous Racing [0.0]
本稿では、自動運転車における強化学習(RL)ソリューションの性能向上の問題に対処する。
計画タスクと制御タスクを分離する部分的なエンドツーエンドアルゴリズムを提案する。
従来の制御器のロバスト性を活用することにより,本アルゴリズムは標準のエンドツーエンドアルゴリズムよりもモデルミスマッチに対するロバスト性を向上する。
論文 参考訳(メタデータ) (2023-12-11T14:27:10Z) - Designing a Robust Low-Level Agnostic Controller for a Quadrotor with
Actor-Critic Reinforcement Learning [0.38073142980732994]
ソフトアクター・クリティカルに基づく低レベルウェイポイント誘導制御器の訓練段階におけるドメインランダム化を提案する。
トレーニング中の四元数力学に一定の不確実性を導入することにより、より大規模な四元数パラメータを用いて提案課題を実行することができる制御器が得られることを示す。
論文 参考訳(メタデータ) (2022-10-06T14:58:19Z) - Learning a Single Near-hover Position Controller for Vastly Different
Quadcopters [56.37274861303324]
本稿では,クワッドコプターのための適応型ニアホバー位置制御器を提案する。
これは、非常に異なる質量、大きさ、運動定数を持つクワッドコプターに展開することができる。
また、実行中に未知の障害に迅速に適応する。
論文 参考訳(メタデータ) (2022-09-19T17:55:05Z) - Skip Training for Multi-Agent Reinforcement Learning Controller for
Industrial Wave Energy Converters [94.84709449845352]
近年のウェーブ・エナジー・コンバータ(WEC)は、発電を最大化するために複数の脚と発電機を備えている。
従来のコントローラは複雑な波のパターンを捕捉する制限を示しており、コントローラはエネルギー捕獲を効率的に最大化する必要がある。
本稿では,従来のスプリングダンパよりも優れたマルチエージェント強化学習コントローラ(MARL)を提案する。
論文 参考訳(メタデータ) (2022-09-13T00:20:31Z) - Policy Search for Model Predictive Control with Application to Agile
Drone Flight [56.24908013905407]
MPCのためのポリシ・フォー・モデル・予測制御フレームワークを提案する。
具体的には、パラメータ化コントローラとしてMPCを定式化し、パラメータ化の難しい決定変数を高レベルポリシーとして表現する。
シミュレーションと実環境の両方において,我々の制御器が堅牢かつリアルタイムに制御性能を発揮することを示す実験を行った。
論文 参考訳(メタデータ) (2021-12-07T17:39:24Z) - Machine Learning for Mechanical Ventilation Control [52.65490904484772]
圧制御換気における侵襲的機械式換気装置の制御の問題点を考察する。
PIDコントローラは、臨床医が指定する気道圧の軌跡に従って、鎮静患者の肺の空気を入出させる必要があります。
制御器は、PID制御器よりも目標圧力波形をかなりよく追跡できることを示す。
論文 参考訳(メタデータ) (2021-02-12T21:23:33Z) - Regularizing Action Policies for Smooth Control with Reinforcement
Learning [47.312768123967025]
Conditioning for Action Policy Smoothness(CAPS)は、アクションポリシーの効果的な直感的な正規化である。
capsは、ニューラルネットワークコントローラの学習状態-動作マッピングの滑らかさを一貫して改善する。
実システムでテストしたところ、クアドロタードローンのコントローラーの滑らかさが改善され、消費電力は80%近く削減された。
論文 参考訳(メタデータ) (2020-12-11T21:35:24Z) - Learning a Contact-Adaptive Controller for Robust, Efficient Legged
Locomotion [95.1825179206694]
四足歩行ロボットのためのロバストコントローラを合成するフレームワークを提案する。
高レベルコントローラは、環境の変化に応じてプリミティブのセットを選択することを学習する。
確立された制御方法を使用してプリミティブを堅牢に実行する低レベルコントローラ。
論文 参考訳(メタデータ) (2020-09-21T16:49:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。