論文の概要: Efficient Learning of Control Policies for Robust Quadruped Bounding
using Pretrained Neural Networks
- arxiv url: http://arxiv.org/abs/2011.00446v3
- Date: Sun, 29 Oct 2023 14:18:20 GMT
- ステータス: 処理完了
- システム内更新日: 2023-11-02 18:53:28.292633
- Title: Efficient Learning of Control Policies for Robust Quadruped Bounding
using Pretrained Neural Networks
- Title(参考訳): 事前学習ニューラルネットワークを用いたロバスト四重項境界制御の効率的な学習
- Authors: Zhicheng Wang, Anqiao Li, Yixiao Zheng, Anhuan Xie, Zhibin Li, Jun Wu,
Qiuguo Zhu
- Abstract要約: 境界は, 交渉上の障害に対して, 四足歩行において重要な局面の1つである。
著者らはロバストなバウンディングゲイトをより効率的に学習できる効果的なアプローチを提案した。
著者らは、Jueying Miniの四足歩行ロボットが不均一な地形に接することによる、効率的な計算と良好な移動結果を示す。
- 参考スコア(独自算出の注目度): 15.09037992110481
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Bounding is one of the important gaits in quadrupedal locomotion for
negotiating obstacles. The authors proposed an effective approach that can
learn robust bounding gaits more efficiently despite its large variation in
dynamic body movements. The authors first pretrained the neural network (NN)
based on data from a robot operated by conventional model based controllers,
and then further optimised the pretrained NN via deep reinforcement learning
(DRL). In particular, the authors designed a reward function considering
contact points and phases to enforce the gait symmetry and periodicity, which
improved the bounding performance. The NN based feedback controller was learned
in the simulation and directly deployed on the real quadruped robot Jueying
Mini successfully. A variety of environments are presented both indoors and
outdoors with the authors approach. The authors approach shows efficient
computing and good locomotion results by the Jueying Mini quadrupedal robot
bounding over uneven terrain.
- Abstract(参考訳): 境界は、交渉障害に対する四足歩行における重要な歩行の1つである。
筆者らは,体の動きの変動が大きいにもかかわらず,ロバストなバウンディング歩行をより効率的に学べる効果的なアプローチを提案した。
著者らはまず、従来のモデルベースコントローラが操作するロボットのデータに基づいてニューラルネットワーク(NN)を事前訓練し、さらに深層強化学習(DRL)を介してトレーニング済みNNを最適化した。
特に,歩行対称性と周期性を実現するために,接触点と位相を考慮した報奨関数を考案し,境界性能を改善した。
NNベースのフィードバックコントローラはシミュレーションで学習され、実際の四足ロボットJueying Miniに直接デプロイされた。
様々な環境が屋内と屋外の両方で著者のアプローチで提示される。
著者らは、Jueying Miniの四足歩行ロボットが不均一な地形に面した効率的な計算と良好な移動結果を示す。
関連論文リスト
- Offline Adaptation of Quadruped Locomotion using Diffusion Models [59.882275766745295]
本稿では,複数のスキル間の相互補間と学習の限界に同時に対処する,四足歩行への拡散に基づくアプローチを提案する。
これらの機能は、マルチスキルポリシーと互換性があり、ほとんど変更することなく、最小限の計算オーバーヘッドで適用可能であることを示す。
ANYmal四重奏プラットフォーム上でのハードウェア実験によるアプローチの有効性を検証する。
論文 参考訳(メタデータ) (2024-11-13T18:12:15Z) - Distributed Robust Learning based Formation Control of Mobile Robots based on Bioinspired Neural Dynamics [14.149584412213269]
まず,変数構造とカスケード設計手法を用いた分散推定器を導入し,実時間性能向上のための微分情報の必要性を排除した。
そして、スムーズな制御入力を提供し、スピードジャンプ問題を効果的に解決することを目的とした、バイオインスパイアされたニューラルダイナミックベースのアプローチを用いて、キネマティックトラッキング制御法を開発した。
完全に未知の力学と乱れを持つロボットの課題に対処するために,学習に基づく頑健な動的コントローラを開発した。
論文 参考訳(メタデータ) (2024-03-23T04:36:12Z) - Robot Fine-Tuning Made Easy: Pre-Training Rewards and Policies for
Autonomous Real-World Reinforcement Learning [58.3994826169858]
ロボット強化学習のためのリセット不要な微調整システムであるRoboFuMEを紹介する。
我々の洞察は、オフラインの強化学習技術を利用して、事前訓練されたポリシーの効率的なオンライン微調整を確保することである。
提案手法では,既存のロボットデータセットからのデータを組み込んで,目標タスクを3時間以内の自律現実体験で改善することができる。
論文 参考訳(メタデータ) (2023-10-23T17:50:08Z) - Value function estimation using conditional diffusion models for control [62.27184818047923]
拡散値関数(DVF)と呼ばれる単純なアルゴリズムを提案する。
拡散モデルを用いて環境-ロボット相互作用の連成多段階モデルを学ぶ。
本稿では,DVFを用いて複数のコントローラの状態を効率よく把握する方法を示す。
論文 参考訳(メタデータ) (2023-06-09T18:40:55Z) - Learning Bipedal Walking for Humanoids with Current Feedback [5.429166905724048]
アクチュエータレベルでの不正確なトルクトラッキングから生じるヒューマノイドロボットのシム2リアルギャップ問題を克服するためのアプローチを提案する。
提案手法は、実際のHRP-5Pヒューマノイドロボットに展開して二足歩行を実現するシミュレーションにおいて、一貫したエンドツーエンドのポリシーをトレーニングする。
論文 参考訳(メタデータ) (2023-03-07T08:16:46Z) - Learning to Exploit Elastic Actuators for Quadruped Locomotion [7.9585932082270014]
足の移動におけるスプリングベースのアクチュエータは、エネルギー効率と性能の向上を提供するが、コントローラ設計の難しさは増す。
実ロボットでモデルフリーのコントローラを直接学習することを提案する。
提案手法をDLR弾性四重項ベルトに適用した。
論文 参考訳(メタデータ) (2022-09-15T09:43:17Z) - Complex Locomotion Skill Learning via Differentiable Physics [30.868690308658174]
微分物理学は、ニューラルネットワーク(NN)コントローラの効率的な最適化を可能にする。
本稿では,複雑度と多様性を著しく向上したタスクが可能な統一NNコントローラを出力する実践的学習フレームワークを提案する。
論文 参考訳(メタデータ) (2022-06-06T04:01:12Z) - Gradient-Based Trajectory Optimization With Learned Dynamics [80.41791191022139]
データからシステムの微分可能なダイナミクスモデルを学習するために、機械学習技術を使用します。
ニューラルネットワークは、大規模な時間的地平線に対して、非常に非線形な振る舞いを正確にモデル化できることが示される。
ハードウェア実験において、学習したモデルがSpotとRadio- controlled (RC)の両方の複雑な力学を表現できることを実証した。
論文 参考訳(メタデータ) (2022-04-09T22:07:34Z) - Model Predictive Control for Fluid Human-to-Robot Handovers [50.72520769938633]
人間の快適さを考慮に入れた計画運動は、人間ロボットのハンドオーバプロセスの一部ではない。
本稿では,効率的なモデル予測制御フレームワークを用いてスムーズな動きを生成することを提案する。
ユーザ数名の多様なオブジェクトに対して,人間とロボットのハンドオーバ実験を行う。
論文 参考訳(メタデータ) (2022-03-31T23:08:20Z) - Reinforcement Learning with Evolutionary Trajectory Generator: A General
Approach for Quadrupedal Locomotion [29.853927354893656]
進化的足跡生成器を含む新しいRLに基づくアプローチを提案する。
ジェネレータは、与えられたタスクの出力軌跡の形状を継続的に最適化し、ポリシー学習のガイドとなる多様な動作前を提供する。
我々は,12-DoF四足歩行ロボットのシミュレーションで学習したコントローラをデプロイし,効率の良い歩行で挑戦的なシナリオを横切ることに成功した。
論文 参考訳(メタデータ) (2021-09-14T02:51:50Z) - First Steps: Latent-Space Control with Semantic Constraints for
Quadruped Locomotion [73.37945453998134]
従来の四重化制御のアプローチでは、単純化された手作りのモデルが採用されている。
これにより、有効な運動範囲が縮小されているため、ロボットの能力が大幅に低下する。
この研究において、これらの課題は、構造化潜在空間における最適化として四重化制御をフレーミングすることによって解決される。
深い生成モデルは、実現可能な関節構成の統計的表現を捉え、一方、複雑な動的および終端的制約は高レベルな意味的指標によって表現される。
実世界とシミュレーションの両方で最適化された移動軌跡の実現可能性を検証する。
論文 参考訳(メタデータ) (2020-07-03T07:04:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。