論文の概要: Exciting Action: Investigating Efficient Exploration for Learning Musculoskeletal Humanoid Locomotion
- arxiv url: http://arxiv.org/abs/2407.11658v1
- Date: Tue, 16 Jul 2024 12:27:55 GMT
- ステータス: 処理完了
- システム内更新日: 2024-07-17 15:11:54.864707
- Title: Exciting Action: Investigating Efficient Exploration for Learning Musculoskeletal Humanoid Locomotion
- Title(参考訳): エキサイティングアクション:筋骨格型ヒューマノイド運動の学習における効率的な探索
- Authors: Henri-Jacques Geiß, Firas Al-Hafez, Andre Seyfarth, Jan Peters, Davide Tateo,
- Abstract要約: 敵の模倣学習が鍵となる問題を分析し、解決策を提供することでこの問題に対処できることを実証する。
16自由度と92自由度を持つ擬似ヒューマノイドモデルを用いて歩行歩行と歩行歩行を学習し,その方法論を検証した。
- 参考スコア(独自算出の注目度): 16.63152794060493
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Learning a locomotion controller for a musculoskeletal system is challenging due to over-actuation and high-dimensional action space. While many reinforcement learning methods attempt to address this issue, they often struggle to learn human-like gaits because of the complexity involved in engineering an effective reward function. In this paper, we demonstrate that adversarial imitation learning can address this issue by analyzing key problems and providing solutions using both current literature and novel techniques. We validate our methodology by learning walking and running gaits on a simulated humanoid model with 16 degrees of freedom and 92 Muscle-Tendon Units, achieving natural-looking gaits with only a few demonstrations.
- Abstract(参考訳): 筋骨格系における運動制御器の学習は,過度な運動量と高次元動作空間のために困難である。
多くの強化学習手法がこの問題に対処しようとするが、効果的な報酬関数のエンジニアリングにまつわる複雑さのため、人間のような歩行を学ぶのに苦労することが多い。
本稿では,本研究の課題を解析し,現状の文献と新技術の両方を用いて解を提供することにより,逆模倣学習がこの問題に対処できることを実証する。
16度の自由度と92の筋腱ユニットを持つ擬似ヒューマノイドモデルを用いて歩行歩行と走歩行を学習し,数回のデモンストレーションで自然的な歩行を達成し,その方法論を検証した。
関連論文リスト
- Self-Explainable Affordance Learning with Embodied Caption [63.88435741872204]
具体的キャプションを具現化したSelf-Explainable Affordance Learning (SEA)を紹介する。
SEAは、ロボットが意図を明確に表現し、説明可能な視覚言語キャプションと視覚能力学習のギャップを埋めることを可能にする。
本稿では, 簡便かつ効率的な方法で, 空き地と自己説明を効果的に組み合わせた新しいモデルを提案する。
論文 参考訳(メタデータ) (2024-04-08T15:22:38Z) - Infer and Adapt: Bipedal Locomotion Reward Learning from Demonstrations
via Inverse Reinforcement Learning [5.246548532908499]
本稿では、複雑な地形上の二足歩行問題を解決するために、最先端の逆強化学習(IRL)技術を導入する。
専門家の報酬関数を学習するためのアルゴリズムを提案し、その後、学習関数を解析する。
両足歩行ポリシーを推定報酬関数で訓練することで、視認できない地形での歩行性能が向上することが実証的に実証された。
論文 参考訳(メタデータ) (2023-09-28T00:11:06Z) - Leveraging Sequentiality in Reinforcement Learning from a Single
Demonstration [68.94506047556412]
本稿では,複雑なロボットタスクの制御ポリシーを1つの実演で学習するために,シーケンシャルなバイアスを活用することを提案する。
本研究は, ヒューマノイド移動やスタンドアップなど, 模擬課題のいくつかを, 前例のないサンプル効率で解くことができることを示す。
論文 参考訳(メタデータ) (2022-11-09T10:28:40Z) - Learning Agile Skills via Adversarial Imitation of Rough Partial
Demonstrations [19.257876507104868]
アジャイルスキルの習得は,ロボティクスにおける大きな課題のひとつだ。
本稿では,部分的かつ物理的に互換性のない実演から報酬関数を推定するための生成的逆数法を提案する。
我々は、Wasserstein GANの定式化と、粗い情報と部分的な情報を入力とするデモからの遷移によって、堅牢で実証行動の模倣が可能なポリシーを抽出できることを示した。
論文 参考訳(メタデータ) (2022-06-23T13:34:11Z) - DEP-RL: Embodied Exploration for Reinforcement Learning in Overactuated
and Musculoskeletal Systems [14.295720603503806]
大規模な筋骨格モデルの強化学習は、同様の性能を示すことができない。
我々は、大きな過度な作用空間における非効率な探索が重要な問題であると予想する。
筋骨格系において,DEPをRLに統合することにより,手を伸ばしたり移動したりする学習を高速に行うことができる。
論文 参考訳(メタデータ) (2022-05-30T15:52:54Z) - Bottom-Up Skill Discovery from Unsegmented Demonstrations for
Long-Horizon Robot Manipulation [55.31301153979621]
我々は,実世界の長距離ロボット操作作業に,スキル発見による取り組みを行う。
未解決のデモンストレーションから再利用可能なスキルのライブラリを学ぶためのボトムアップアプローチを提案する。
提案手法は,多段階操作タスクにおける最先端の模倣学習手法よりも優れた性能を示した。
論文 参考訳(メタデータ) (2021-09-28T16:18:54Z) - ALLSTEPS: Curriculum-driven Learning of Stepping Stone Skills [8.406171678292964]
ステップストーンのロコモーションに対する良い解決策を見つけることは、アニメーションとロボティクスにとって長年、そして基本的な課題である。
我々は、強化学習を用いたこの難しい問題に対する完全な学習ソリューションを提案する。
シミュレーションされた人間キャラクタ, 現実的な二足歩行ロボットシミュレーション, モンスターキャラクタに対して, それぞれのケースにおいて, 頑健で可塑性な動きが生じる。
論文 参考訳(メタデータ) (2020-05-09T00:16:38Z) - The Ingredients of Real-World Robotic Reinforcement Learning [71.92831985295163]
実世界で収集されたデータによって継続的に自律的に改善できるロボット学習システムに必要な要素について論じる。
本稿では,このようなシステムの特異なインスタンス化を事例として,デクスタラスな操作を事例として提案する。
我々は人間の介入なしに学習できることを実証し、現実世界の3本指の手で様々な視覚ベースのスキルを習得する。
論文 参考訳(メタデータ) (2020-04-27T03:36:10Z) - State-Only Imitation Learning for Dexterous Manipulation [63.03621861920732]
本稿では,国家のみの模倣学習について考察する。
我々は、逆ダイナミクスモデルをトレーニングし、状態のみのデモンストレーションのアクションを予測するためにそれを使用します。
我々の手法は状態-作用アプローチと同等に動作し、RL単独よりもかなり優れています。
論文 参考訳(メタデータ) (2020-04-07T17:57:20Z) - Learning Agile Robotic Locomotion Skills by Imitating Animals [72.36395376558984]
動物の多様でアジャイルな運動スキルを再現することは、ロボット工学における長年の課題である。
そこで本研究では,現実世界の動物を模倣することで,足のロボットがアジャイルな運動能力を学ぶことができる模倣学習システムを提案する。
論文 参考訳(メタデータ) (2020-04-02T02:56:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。