論文の概要: Sim-to-Real Learning for Bipedal Locomotion Under Unsensed Dynamic Loads
- arxiv url: http://arxiv.org/abs/2204.04340v1
- Date: Sat, 9 Apr 2022 00:41:55 GMT
- ステータス: 処理完了
- システム内更新日: 2022-04-15 08:12:04.088692
- Title: Sim-to-Real Learning for Bipedal Locomotion Under Unsensed Dynamic Loads
- Title(参考訳): 運動負荷下での2足歩行の同時学習
- Authors: Jeremy Dao, Kevin Green, Helei Duan, Alan Fern, Jonathan Hurst
- Abstract要約: 多くのアプリケーションにおいて、ロボットは幅広い潜在的な動的負荷の下で堅牢な移動を維持する必要がある。
負荷のないロコモーションのためにトレーニングされた以前のRLポリシーは、ある程度の負荷で失敗することを示す。
また、各負荷に対するトレーニング専用のポリシーと、考慮されたすべての負荷に対する単一のポリシーを比較し、その結果の歩行が、異なる負荷に対応するためにどのように変化するかを分析する。
- 参考スコア(独自算出の注目度): 22.42461188358925
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Recent work on sim-to-real learning for bipedal locomotion has demonstrated
new levels of robustness and agility over a variety of terrains. However, that
work, and most prior bipedal locomotion work, have not considered locomotion
under a variety of external loads that can significantly influence the overall
system dynamics. In many applications, robots will need to maintain robust
locomotion under a wide range of potential dynamic loads, such as pulling a
cart or carrying a large container of sloshing liquid, ideally without
requiring additional load-sensing capabilities. In this work, we explore the
capabilities of reinforcement learning (RL) and sim-to-real transfer for
bipedal locomotion under dynamic loads using only proprioceptive feedback. We
show that prior RL policies trained for unloaded locomotion fail for some loads
and that simply training in the context of loads is enough to result in
successful and improved policies. We also compare training specialized policies
for each load versus a single policy for all considered loads and analyze how
the resulting gaits change to accommodate different loads. Finally, we
demonstrate sim-to-real transfer, which is successful but shows a wider
sim-to-real gap than prior unloaded work, which points to interesting future
research.
- Abstract(参考訳): 両足歩行のシミュレート・トゥ・リアル学習に関する最近の研究は、様々な地形における新しい強靭性と俊敏性を示している。
しかし、その作業と、それ以前の二足歩行作業は、システム全体のダイナミクスに大きな影響を与える様々な外部負荷の下での移動を考慮していない。
多くのアプリケーションでは、ロボットは、カートを引っ張る、液体をスローする大きな容器を運ぶなど、幅広い動的負荷の下で頑健なロコモーションを維持する必要がある。
本研究は,2足歩行動作に対する強化学習(RL)とsim-to-realトランスファーの能力について,主観的フィードバックのみを用いた動的負荷下での検討である。
負荷のないロコモーションのためにトレーニングされた以前のRLポリシーは、いくつかの負荷に対してフェールし、負荷の文脈でのトレーニングだけでは、成功し、改善されたポリシーを実現するには十分であることを示す。
また、各負荷に対するトレーニング専用のポリシーと、考慮されたすべての負荷に対する単一のポリシーを比較し、その結果の歩行が、異なる負荷に対応するためにどのように変化するかを分析する。
最後に, 従来の未負荷作業よりも広義のsim-to-realトランスファーを実証し, 今後の研究の成果を示す。
関連論文リスト
- DexDribbler: Learning Dexterous Soccer Manipulation via Dynamic Supervision [26.9579556496875]
移動物体の協調操作と,サッカーなどの足による移動は,学習コミュニティにおいて目立たない注目を集める。
出力をダイナミックな関節レベル移動監視として使用し,必要な身体レベルの動きを正確に計算するフィードバック制御ブロックを提案する。
我々は,我々の学習手法が政策ネットワークをより早く収束させるだけでなく,サッカーロボットが高度な操作を行うことを可能にすることを観察した。
論文 参考訳(メタデータ) (2024-03-21T11:16:28Z) - Reinforcement Learning for Versatile, Dynamic, and Robust Bipedal Locomotion Control [106.32794844077534]
本稿では,二足歩行ロボットのための動的移動制御系を構築するために,深層強化学習を用いた研究について述べる。
本研究では、周期歩行やランニングから周期ジャンプや立位に至るまで、様々な動的二足歩行技術に使用できる汎用的な制御ソリューションを開発する。
この研究は、二足歩行ロボットの俊敏性の限界を、現実世界での広範な実験を通じて押し上げる。
論文 参考訳(メタデータ) (2024-01-30T10:48:43Z) - Universal Humanoid Motion Representations for Physics-Based Control [71.46142106079292]
物理学に基づくヒューマノイド制御のための総合的な運動スキルを含む普遍的な運動表現を提案する。
まず、大きな非構造運動データセットから人間の動きをすべて模倣できる動き模倣機を学習する。
次に、模倣者から直接スキルを蒸留することで、動作表現を作成します。
論文 参考訳(メタデータ) (2023-10-06T20:48:43Z) - An Adaptable Approach to Learn Realistic Legged Locomotion without
Examples [38.81854337592694]
本研究は,バネ装荷逆振り子モデルを用いて学習プロセスを導くことで,移動における現実性を保証するための汎用的アプローチを提案する。
モデルのない設定であっても、2足歩行ロボットと4足歩行ロボットに対して、学習したポリシーが現実的でエネルギー効率のよい移動歩行を生成できることを示す実験結果を示す。
論文 参考訳(メタデータ) (2021-10-28T10:14:47Z) - GLiDE: Generalizable Quadrupedal Locomotion in Diverse Environments with
a Centroidal Model [18.66472547798549]
四足歩行のロバスト制御ポリシを生成するために,遠心モデルを用いてモデルフリー強化学習を効果的に利用できることを示す。
本手法は, ステップストーン移動, 2脚のインプレースバランス, バランスビーム移動, sim-to-real移動を, さらなる適応を伴わずに実現可能であることを示す。
論文 参考訳(メタデータ) (2021-04-20T05:55:13Z) - Reinforcement Learning for Robust Parameterized Locomotion Control of
Bipedal Robots [121.42930679076574]
シミュレーションにおけるロコモーションポリシをトレーニングするためのモデルフリー強化学習フレームワークを提案する。
ドメインランダム化は、システムダイナミクスのバリエーションにまたがる堅牢な振る舞いを学ぶためのポリシーを奨励するために使用されます。
本研究では、目標歩行速度、歩行高さ、旋回ヨーなどの多目的歩行行動について示す。
論文 参考訳(メタデータ) (2021-03-26T07:14:01Z) - TrafficSim: Learning to Simulate Realistic Multi-Agent Behaviors [74.67698916175614]
リアル交通シミュレーションのためのマルチエージェント行動モデルであるTrafficSimを提案する。
特に、暗黙の潜在変数モデルを利用して、共同アクターポリシーをパラメータ化する。
TrafficSimは、多様なベースラインと比較して、より現実的で多様なトラフィックシナリオを生成します。
論文 参考訳(メタデータ) (2021-01-17T00:29:30Z) - UniCon: Universal Neural Controller For Physics-based Character Motion [70.45421551688332]
大規模動作データセットから学習することで,異なるスタイルで数千の動作を習得する物理ベースのユニバーサルニューラルコントローラ(UniCon)を提案する。
UniConは、キーボード駆動制御をサポートし、ロコモーションとアクロバティックスキルの大きなプールから引き出されたモーションシーケンスを作成し、ビデオで撮影した人を物理ベースの仮想アバターにテレポートする。
論文 参考訳(メタデータ) (2020-11-30T18:51:16Z) - Learning Quadrupedal Locomotion over Challenging Terrain [68.51539602703662]
足の移動はロボティクスの操作領域を劇的に拡張することができる。
足の移動のための従来のコントローラーは、運動プリミティブと反射の実行を明示的にトリガーする精巧な状態マシンに基づいている。
ここでは、自然環境に挑戦する際の足の移動に対して、徹底的に頑健な制御器を提案する。
論文 参考訳(メタデータ) (2020-10-21T19:11:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。