論文の概要: Efficient Learning of Control Policies for Robust Quadruped Bounding
using Pretrained Neural Networks
- arxiv url: http://arxiv.org/abs/2011.00446v2
- Date: Tue, 29 Jun 2021 15:01:51 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-30 23:37:18.163112
- Title: Efficient Learning of Control Policies for Robust Quadruped Bounding
using Pretrained Neural Networks
- Title(参考訳): 事前学習ニューラルネットワークを用いたロバスト四重項境界制御の効率的な学習
- Authors: Anqiao Li, Zhicheng Wang, Jun Wu, Qiuguo Zhu
- Abstract要約: 本稿では,ロボットのデータを用いて,まずディープニューラルネットワーク(DNN)を事前学習することにより,ロバストなバウンディングゲイトを学習するための効率的なアプローチを提案する。
また,歩行対称性と周期性を強制するために,接触点を考慮した報酬関数を設計した。
- 参考スコア(独自算出の注目度): 9.797443282955339
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Bounding is one of the important gaits in quadrupedal locomotion for
negotiating obstacles. However, due to a large number of robot and
environmental constraints, conventional planning and control has limited
ability to adapt bounding gaits on various terrains in real-time. We proposed
an efficient approach to learn robust bounding gaits by first pretraining the
deep neural network (DNN) using data from a robot that used conventional
model-based controllers. Next, the pretrained DNN weights are optimized further
via deep reinforcement learning (DRL). Also, we designed a reward function
considering contact points to enforce the gait symmetry and periodicity, and
used feature engineering to improve input features of the DRL model and the
bounding performance. The DNN-based feedback controller was learned in
simulation first and deployed directly on the real Jueying-Mini robot
successfully, which was computationally more efficient and performed much
better than the previous model-based control in terms of robustness and
stability in both indoor and outdoor experiments.
- Abstract(参考訳): 境界は、交渉障害に対する四足歩行における重要な歩行の1つである。
しかし、多くのロボットと環境上の制約により、従来の計画と制御は、様々な地形に境界歩行をリアルタイムで適応する能力に制限がある。
我々は,従来のモデルベースコントローラを用いたロボットのデータを用いて,まずディープニューラルネットワーク(DNN)を事前学習することで,ロバストなバウンディング歩行を学習するための効率的なアプローチを提案した。
次に、事前訓練されたDNN重量は、深部強化学習(DRL)によりさらに最適化される。
また、歩行対称性と周期性を強制するために接触点を考慮した報酬関数を設計し、特徴工学を用いてDRLモデルの入力特性とバウンディング性能を改善した。
dnnベースのフィードバックコントローラは、まずシミュレーションで学び、実際のjueying-miniロボットに直接デプロイすることに成功した。
関連論文リスト
- Offline Adaptation of Quadruped Locomotion using Diffusion Models [59.882275766745295]
本稿では,複数のスキル間の相互補間と学習の限界に同時に対処する,四足歩行への拡散に基づくアプローチを提案する。
これらの機能は、マルチスキルポリシーと互換性があり、ほとんど変更することなく、最小限の計算オーバーヘッドで適用可能であることを示す。
ANYmal四重奏プラットフォーム上でのハードウェア実験によるアプローチの有効性を検証する。
論文 参考訳(メタデータ) (2024-11-13T18:12:15Z) - Distributed Robust Learning based Formation Control of Mobile Robots based on Bioinspired Neural Dynamics [14.149584412213269]
まず,変数構造とカスケード設計手法を用いた分散推定器を導入し,実時間性能向上のための微分情報の必要性を排除した。
そして、スムーズな制御入力を提供し、スピードジャンプ問題を効果的に解決することを目的とした、バイオインスパイアされたニューラルダイナミックベースのアプローチを用いて、キネマティックトラッキング制御法を開発した。
完全に未知の力学と乱れを持つロボットの課題に対処するために,学習に基づく頑健な動的コントローラを開発した。
論文 参考訳(メタデータ) (2024-03-23T04:36:12Z) - Robot Fine-Tuning Made Easy: Pre-Training Rewards and Policies for
Autonomous Real-World Reinforcement Learning [58.3994826169858]
ロボット強化学習のためのリセット不要な微調整システムであるRoboFuMEを紹介する。
我々の洞察は、オフラインの強化学習技術を利用して、事前訓練されたポリシーの効率的なオンライン微調整を確保することである。
提案手法では,既存のロボットデータセットからのデータを組み込んで,目標タスクを3時間以内の自律現実体験で改善することができる。
論文 参考訳(メタデータ) (2023-10-23T17:50:08Z) - Value function estimation using conditional diffusion models for control [62.27184818047923]
拡散値関数(DVF)と呼ばれる単純なアルゴリズムを提案する。
拡散モデルを用いて環境-ロボット相互作用の連成多段階モデルを学ぶ。
本稿では,DVFを用いて複数のコントローラの状態を効率よく把握する方法を示す。
論文 参考訳(メタデータ) (2023-06-09T18:40:55Z) - Learning Bipedal Walking for Humanoids with Current Feedback [5.429166905724048]
アクチュエータレベルでの不正確なトルクトラッキングから生じるヒューマノイドロボットのシム2リアルギャップ問題を克服するためのアプローチを提案する。
提案手法は、実際のHRP-5Pヒューマノイドロボットに展開して二足歩行を実現するシミュレーションにおいて、一貫したエンドツーエンドのポリシーをトレーニングする。
論文 参考訳(メタデータ) (2023-03-07T08:16:46Z) - Learning to Exploit Elastic Actuators for Quadruped Locomotion [7.9585932082270014]
足の移動におけるスプリングベースのアクチュエータは、エネルギー効率と性能の向上を提供するが、コントローラ設計の難しさは増す。
実ロボットでモデルフリーのコントローラを直接学習することを提案する。
提案手法をDLR弾性四重項ベルトに適用した。
論文 参考訳(メタデータ) (2022-09-15T09:43:17Z) - Complex Locomotion Skill Learning via Differentiable Physics [30.868690308658174]
微分物理学は、ニューラルネットワーク(NN)コントローラの効率的な最適化を可能にする。
本稿では,複雑度と多様性を著しく向上したタスクが可能な統一NNコントローラを出力する実践的学習フレームワークを提案する。
論文 参考訳(メタデータ) (2022-06-06T04:01:12Z) - Gradient-Based Trajectory Optimization With Learned Dynamics [80.41791191022139]
データからシステムの微分可能なダイナミクスモデルを学習するために、機械学習技術を使用します。
ニューラルネットワークは、大規模な時間的地平線に対して、非常に非線形な振る舞いを正確にモデル化できることが示される。
ハードウェア実験において、学習したモデルがSpotとRadio- controlled (RC)の両方の複雑な力学を表現できることを実証した。
論文 参考訳(メタデータ) (2022-04-09T22:07:34Z) - Model Predictive Control for Fluid Human-to-Robot Handovers [50.72520769938633]
人間の快適さを考慮に入れた計画運動は、人間ロボットのハンドオーバプロセスの一部ではない。
本稿では,効率的なモデル予測制御フレームワークを用いてスムーズな動きを生成することを提案する。
ユーザ数名の多様なオブジェクトに対して,人間とロボットのハンドオーバ実験を行う。
論文 参考訳(メタデータ) (2022-03-31T23:08:20Z) - Reinforcement Learning with Evolutionary Trajectory Generator: A General
Approach for Quadrupedal Locomotion [29.853927354893656]
進化的足跡生成器を含む新しいRLに基づくアプローチを提案する。
ジェネレータは、与えられたタスクの出力軌跡の形状を継続的に最適化し、ポリシー学習のガイドとなる多様な動作前を提供する。
我々は,12-DoF四足歩行ロボットのシミュレーションで学習したコントローラをデプロイし,効率の良い歩行で挑戦的なシナリオを横切ることに成功した。
論文 参考訳(メタデータ) (2021-09-14T02:51:50Z) - First Steps: Latent-Space Control with Semantic Constraints for
Quadruped Locomotion [73.37945453998134]
従来の四重化制御のアプローチでは、単純化された手作りのモデルが採用されている。
これにより、有効な運動範囲が縮小されているため、ロボットの能力が大幅に低下する。
この研究において、これらの課題は、構造化潜在空間における最適化として四重化制御をフレーミングすることによって解決される。
深い生成モデルは、実現可能な関節構成の統計的表現を捉え、一方、複雑な動的および終端的制約は高レベルな意味的指標によって表現される。
実世界とシミュレーションの両方で最適化された移動軌跡の実現可能性を検証する。
論文 参考訳(メタデータ) (2020-07-03T07:04:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。