論文の概要: Learning Bipedal Robot Locomotion from Human Movement
- arxiv url: http://arxiv.org/abs/2105.12277v1
- Date: Wed, 26 May 2021 00:49:37 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-27 13:37:39.153654
- Title: Learning Bipedal Robot Locomotion from Human Movement
- Title(参考訳): 人間の動きから二足歩行を学習する
- Authors: Michael Taylor, Sergey Bashkirov, Javier Fernandez Rico, Ike Toriyama,
Naoyuki Miyada, Hideki Yanagisawa, Kensaku Ishizuka
- Abstract要約: 本研究では、実世界の二足歩行ロボットに、モーションキャプチャーデータから直接の動きを教えるための強化学習に基づく手法を提案する。
本手法は,シミュレーション環境下でのトレーニングから,物理ロボット上での実行へシームレスに移行する。
本研究では,ダイナミックウォークサイクルから複雑なバランスや手振りに至るまでの動作を内製したヒューマノイドロボットについて実演する。
- 参考スコア(独自算出の注目度): 0.791553652441325
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Teaching an anthropomorphic robot from human example offers the opportunity
to impart humanlike qualities on its movement. In this work we present a
reinforcement learning based method for teaching a real world bipedal robot to
perform movements directly from human motion capture data. Our method
seamlessly transitions from training in a simulation environment to executing
on a physical robot without requiring any real world training iterations or
offline steps. To overcome the disparity in joint configurations between the
robot and the motion capture actor, our method incorporates motion re-targeting
into the training process. Domain randomization techniques are used to
compensate for the differences between the simulated and physical systems. We
demonstrate our method on an internally developed humanoid robot with movements
ranging from a dynamic walk cycle to complex balancing and waving. Our
controller preserves the style imparted by the motion capture data and exhibits
graceful failure modes resulting in safe operation for the robot. This work was
performed for research purposes only.
- Abstract(参考訳): 人間的な例から人型ロボットを教えることは、その運動に人間のような性質を与える機会を与える。
本研究では,実世界2足歩行ロボットに人間のモーションキャプチャデータから直接動作を指示する強化学習に基づく手法を提案する。
シミュレーション環境でのトレーニングから,実世界のトレーニングイテレーションやオフラインステップを必要とせずに,物理的ロボット上での実行へとシームレスに移行する。
ロボットとモーションキャプチャーアクタのジョイント構成の相違を克服するため,本手法では運動再ターゲティングを訓練プロセスに組み込む。
ドメインランダム化技術は、シミュレーションシステムと物理システムの違いを補うために用いられる。
本研究では, 動的歩行サイクルから複雑なバランスや振れまで, 内部で開発したヒューマノイドロボットの動作を実演する。
コントローラは、モーションキャプチャーデータによって付与されたスタイルを保存し、ロボットに安全な操作をもたらす優れた障害モードを示す。
この研究は研究目的のみに行われた。
関連論文リスト
- Learning Human-to-Humanoid Real-Time Whole-Body Teleoperation [34.65637397405485]
本稿では,Human to Humanoid(H2O)について紹介する。H2Oは,RGBカメラのみを搭載したヒューマノイドロボットのリアルタイム遠隔操作を実現するフレームワークである。
我々は、これらの洗練された動きを用いてシミュレーションで頑健なリアルタイムヒューマノイド運動模倣機を訓練し、実ヒューマノイドロボットにゼロショットで転送する。
私たちの知る限りでは、学習に基づくリアルタイムな人型ロボット遠隔操作を実現する最初のデモとなる。
論文 参考訳(メタデータ) (2024-03-07T12:10:41Z) - Expressive Whole-Body Control for Humanoid Robots [20.132927075816742]
我々は、人間の動きをできるだけリアルに模倣するために、人間サイズのロボットで全身制御ポリシーを学習する。
シミュレーションとSim2Real転送のトレーニングにより、私たちのポリシーはヒューマノイドロボットを制御して、さまざまなスタイルで歩いたり、人と握手したり、現実世界で人間と踊ったりできる。
論文 参考訳(メタデータ) (2024-02-26T18:09:24Z) - Naturalistic Robot Arm Trajectory Generation via Representation Learning [4.7682079066346565]
家庭環境におけるマニピュレータロボットの統合は、より予測可能な人間のようなロボットの動きの必要性を示唆している。
自然主義的な運動軌跡を生成する方法の1つは、人間のデモ隊の模倣によるものである。
本稿では,自己回帰型ニューラルネットワークを用いた自己指導型模倣学習法について検討する。
論文 参考訳(メタデータ) (2023-09-14T09:26:03Z) - ImitationNet: Unsupervised Human-to-Robot Motion Retargeting via Shared Latent Space [9.806227900768926]
本稿では,ロボットの動きに対する新しいディープラーニング手法を提案する。
本手法では,新しいロボットへの翻訳を容易にする,人間とロボットのペアデータを必要としない。
我々のモデルは、効率と精度の観点から、人間とロボットの類似性に関する既存の研究よりも優れています。
論文 参考訳(メタデータ) (2023-09-11T08:55:04Z) - Learning Video-Conditioned Policies for Unseen Manipulation Tasks [83.2240629060453]
ビデオ条件付きポリシー学習は、以前は目に見えないタスクの人間のデモをロボット操作スキルにマッピングする。
我々は,現在のシーン観察と対象課題のビデオから適切なアクションを生成するためのポリシーを学習する。
われわれは,多タスクロボット操作環境の課題と,技術面における性能の面から,そのアプローチを検証した。
論文 参考訳(メタデータ) (2023-05-10T16:25:42Z) - Learning Human-to-Robot Handovers from Point Clouds [63.18127198174958]
視覚に基づく人間ロボットハンドオーバの制御ポリシーを学習する最初のフレームワークを提案する。
シミュレーションベンチマーク,sim-to-sim転送,sim-to-real転送において,ベースラインよりも大きな性能向上を示した。
論文 参考訳(メタデータ) (2023-03-30T17:58:36Z) - Zero-Shot Robot Manipulation from Passive Human Videos [59.193076151832145]
我々は,人間の映像からエージェント非依存の行動表現を抽出するフレームワークを開発した。
我々の枠組みは、人間の手の動きを予測することに基づいている。
トレーニングされたモデルゼロショットを物理ロボット操作タスクにデプロイする。
論文 参考訳(メタデータ) (2023-02-03T21:39:52Z) - HERD: Continuous Human-to-Robot Evolution for Learning from Human
Demonstration [57.045140028275036]
本研究では,マイクロ進化的強化学習を用いて,操作スキルを人間からロボットに伝達可能であることを示す。
本稿では,ロボットの進化経路とポリシーを協調的に最適化する多次元進化経路探索アルゴリズムを提案する。
論文 参考訳(メタデータ) (2022-12-08T15:56:13Z) - Synthesis and Execution of Communicative Robotic Movements with
Generative Adversarial Networks [59.098560311521034]
我々は、繊細な物体を操作する際に人間が採用するのと同じキネマティクス変調を2つの異なるロボットプラットフォームに転送する方法に焦点を当てる。
我々は、ロボットのエンドエフェクターが採用する速度プロファイルを、異なる特徴を持つ物体を輸送する際に人間が何をするかに触発されて調整する。
我々は、人体キネマティクスの例を用いて訓練され、それらを一般化し、新しい有意義な速度プロファイルを生成する、新しいジェネレーティブ・アドバイサル・ネットワークアーキテクチャを利用する。
論文 参考訳(メタデータ) (2022-03-29T15:03:05Z) - REvolveR: Continuous Evolutionary Models for Robot-to-robot Policy
Transfer [57.045140028275036]
本研究では,運動学や形態学など,異なるパラメータを持つ2つの異なるロボット間でポリシーを伝達する問題を考察する。
模倣学習手法を含む動作や状態遷移の分布を一致させることで、新しいポリシーを訓練する既存のアプローチは、最適な動作や/または状態分布が異なるロボットでミスマッチしているために失敗する。
本稿では,物理シミュレータに実装されたロボット政策伝達に連続的進化モデルを用いることで,$RevolveR$という新しい手法を提案する。
論文 参考訳(メタデータ) (2022-02-10T18:50:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。