論文の概要: Learning a Single Near-hover Position Controller for Vastly Different
Quadcopters
- arxiv url: http://arxiv.org/abs/2209.09232v2
- Date: Tue, 2 May 2023 21:48:51 GMT
- ステータス: 処理完了
- システム内更新日: 2023-05-04 18:40:35.305822
- Title: Learning a Single Near-hover Position Controller for Vastly Different
Quadcopters
- Title(参考訳): 極端に異なるクワッドコプターに対する近接ハバー位置制御器の学習
- Authors: Dingqi Zhang, Antonio Loquercio, Xiangyu Wu, Ashish Kumar, Jitendra
Malik, Mark W. Mueller
- Abstract要約: 本稿では,クワッドコプターのための適応型ニアホバー位置制御器を提案する。
これは、非常に異なる質量、大きさ、運動定数を持つクワッドコプターに展開することができる。
また、実行中に未知の障害に迅速に適応する。
- 参考スコア(独自算出の注目度): 56.37274861303324
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This paper proposes an adaptive near-hover position controller for
quadcopters, which can be deployed to quadcopters of very different mass, size
and motor constants, and also shows rapid adaptation to unknown disturbances
during runtime. The core algorithmic idea is to learn a single policy that can
adapt online at test time not only to the disturbances applied to the drone,
but also to the robot dynamics and hardware in the same framework. We achieve
this by training a neural network to estimate a latent representation of the
robot and environment parameters, which is used to condition the behaviour of
the controller, also represented as a neural network. We train both networks
exclusively in simulation with the goal of flying the quadcopters to goal
positions and avoiding crashes to the ground. We directly deploy the same
controller trained in the simulation without any modifications on two
quadcopters in the real world with differences in mass, size, motors, and
propellers with mass differing by 4.5 times. In addition, we show rapid
adaptation to sudden and large disturbances up to one-third of the mass of the
quadcopters. We perform an extensive evaluation in both simulation and the
physical world, where we outperform a state-of-the-art learning-based adaptive
controller and a traditional PID controller specifically tuned to each platform
individually. Video results can be found at https://youtu.be/U-c-LbTfvoA.
- Abstract(参考訳): 本稿では,クワッドコプターの適応的な位置制御器を提案する。これは,非常に異なる質量,大きさ,運動定数を持つクワッドコプターに展開可能であり,また,実行中に未知の乱れに迅速に適応できる。
アルゴリズムの中核となる考え方は、テスト時にオンラインで適応できる単一のポリシーを、ドローンに適用される障害だけでなく、同じフレームワークのロボットダイナミクスやハードウェアにも学習することだ。
本研究では,ニューラルネットワークを訓練し,ロボットの潜在表現と,ニューラルネットワークとして表現される制御器の動作条件として使用される環境パラメータを推定する。
我々は、クワッドコプターを目標に飛ばし、地上に墜落しないように、両方のネットワークをシミュレーションで訓練する。
実世界の2つのクワッドコプターに、質量、サイズ、モーター、プロペラが異なる4.5倍の質量差で修正を加えることなく、シミュレーションでトレーニングされた同じコントローラを直接デプロイする。
さらに,クワッドコプターの質量の3分の1までの突然の大きな乱れに対して,迅速な適応を示す。
我々はシミュレーションと物理界の両方で広範囲な評価を行い、各プラットフォームに個別に調整された最先端の学習ベース適応制御器と従来のPID制御器より優れています。
ビデオ結果はhttps://youtu.be/U-c-LbTfvoAで見ることができる。
関連論文リスト
- Autonomous Vehicle Controllers From End-to-End Differentiable Simulation [60.05963742334746]
そこで我々は,AVコントローラのトレーニングにAPG(analytic Policy gradients)アプローチを適用可能なシミュレータを提案し,その設計を行う。
提案するフレームワークは, エージェントがより根底的なポリシーを学ぶのを助けるために, 環境力学の勾配を役立てる, エンド・ツー・エンドの訓練ループに, 微分可能シミュレータを組み込む。
ダイナミクスにおけるパフォーマンスとノイズに対する堅牢性の大幅な改善と、全体としてより直感的なヒューマンライクな処理が見られます。
論文 参考訳(メタデータ) (2024-09-12T11:50:06Z) - BiRoDiff: Diffusion policies for bipedal robot locomotion on unseen terrains [0.9480364746270075]
未知の地形での移動は、二足歩行ロボットが新しい現実世界の課題に対処するために不可欠である。
複数の地形を移動させる単一の歩行制御系を学習する軽量なフレームワークを提案する。
論文 参考訳(メタデータ) (2024-07-07T16:03:33Z) - From Flies to Robots: Inverted Landing in Small Quadcopters with Dynamic
Perching [15.57055572401334]
逆着陸は、多くの動物のチラシの中で日常的な行動である。
我々は,任意の天井面接触条件に対する制御ポリシーを策定する。
小型クワッドコプターにおいて,強靭な逆着陸動作を達成できた。
論文 参考訳(メタデータ) (2024-02-29T21:09:08Z) - Reinforcement Learning for Versatile, Dynamic, and Robust Bipedal Locomotion Control [106.32794844077534]
本稿では,二足歩行ロボットのための動的移動制御系を構築するために,深層強化学習を用いた研究について述べる。
本研究では、周期歩行やランニングから周期ジャンプや立位に至るまで、様々な動的二足歩行技術に使用できる汎用的な制御ソリューションを開発する。
この研究は、二足歩行ロボットの俊敏性の限界を、現実世界での広範な実験を通じて押し上げる。
論文 参考訳(メタデータ) (2024-01-30T10:48:43Z) - Improving Wind Resistance Performance of Cascaded PID Controlled
Quadcopters using Residual Reinforcement Learning [0.0]
風力抵抗制御は、目標位置からの逸脱を避けるために、クワッドコプターが位置を維持するために欠かせない特徴である。
クワッドコプターの耐風性制御系を構築するための残留強化学習に基づく手法を提案する。
従来のケースドPIDコントローラで制御されたクワッドコプターと比較して,制御器の位置ずれを約50%低減する。
論文 参考訳(メタデータ) (2023-08-03T09:29:19Z) - GenLoco: Generalized Locomotion Controllers for Quadrupedal Robots [87.32145104894754]
四足歩行ロボットのための汎用ロコモーション(GenLoco)コントローラを訓練するためのフレームワークを提案する。
本フレームワークは,多種多様な四足歩行ロボットに展開可能な汎用ロコモーションコントローラを合成する。
我々のモデルは、より一般的な制御戦略を取得し、新しいシミュレーションロボットや実世界のロボットに直接移行できることを示す。
論文 参考訳(メタデータ) (2022-09-12T15:14:32Z) - Adapting Rapid Motor Adaptation for Bipedal Robots [73.5914982741483]
移動制御の急速な適応の最近の進歩を活用し、二足歩行ロボットで作業できるように拡張する。
A-RMAはモデルフリーRLを用いて微調整することで不完全外部推定器の基本方針を適応する。
シミュレーションにおいて,A-RMAはRLベースのベースラインコントローラやモデルベースコントローラよりも優れていることを示す。
論文 参考訳(メタデータ) (2022-05-30T17:59:09Z) - Learning multiple gaits of quadruped robot using hierarchical
reinforcement learning [9.60618440185329]
本研究では,速度コマンドを追従しながら複数の歩行を生成できる四足歩行ロボットの階層型制御器を提案する。
実験の結果,1) 特定の速度範囲に対する最適歩行の存在,2) 一つのポリシーからなる制御器と比較して階層的な制御器の効率性が示された。
論文 参考訳(メタデータ) (2021-12-09T07:45:25Z) - Learning a Contact-Adaptive Controller for Robust, Efficient Legged
Locomotion [95.1825179206694]
四足歩行ロボットのためのロバストコントローラを合成するフレームワークを提案する。
高レベルコントローラは、環境の変化に応じてプリミティブのセットを選択することを学習する。
確立された制御方法を使用してプリミティブを堅牢に実行する低レベルコントローラ。
論文 参考訳(メタデータ) (2020-09-21T16:49:26Z) - Developmental Reinforcement Learning of Control Policy of a Quadcopter
UAV with Thrust Vectoring Rotors [1.0057838324294686]
推力ベクター機能を有するクアッドコプターのための新規な強化学習型制御器を提案する。
このロボットの制御方針は、学習したクワッドコプターの制御装置からポリシー伝達を用いて学習される。
学習方針の性能は、ホバリングとウェイポイントナビゲーションのタスクの物理シミュレーションにより評価される。
論文 参考訳(メタデータ) (2020-07-15T16:17:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。