論文の概要: Learning Getting-Up Policies for Real-World Humanoid Robots
- arxiv url: http://arxiv.org/abs/2502.12152v2
- Date: Sun, 27 Apr 2025 07:17:14 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-04-29 18:43:11.170056
- Title: Learning Getting-Up Policies for Real-World Humanoid Robots
- Title(参考訳): 実世界のヒューマノイドロボットのための先行政策の学習
- Authors: Xialin He, Runpei Dong, Zixuan Chen, Saurabh Gupta,
- Abstract要約: 本稿では,人型ロボットが様々な地形の様々な構成から立ち上がれるようにするための学習フレームワークを開発する。
これは、人間のサイズのヒューマノイドロボットが現実世界で学習したポリシーを実証する最初の成功例の1つだ。
- 参考スコア(独自算出の注目度): 16.654440490255
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Automatic fall recovery is a crucial prerequisite before humanoid robots can be reliably deployed. Hand-designing controllers for getting up is difficult because of the varied configurations a humanoid can end up in after a fall and the challenging terrains humanoid robots are expected to operate on. This paper develops a learning framework to produce controllers that enable humanoid robots to get up from varying configurations on varying terrains. Unlike previous successful applications of learning to humanoid locomotion, the getting-up task involves complex contact patterns (which necessitates accurately modeling of the collision geometry) and sparser rewards. We address these challenges through a two-phase approach that induces a curriculum. The first stage focuses on discovering a good getting-up trajectory under minimal constraints on smoothness or speed / torque limits. The second stage then refines the discovered motions into deployable (i.e. smooth and slow) motions that are robust to variations in initial configuration and terrains. We find these innovations enable a real-world G1 humanoid robot to get up from two main situations that we considered: a) lying face up and b) lying face down, both tested on flat, deformable, slippery surfaces and slopes (e.g., sloppy grass and snowfield). This is one of the first successful demonstrations of learned getting-up policies for human-sized humanoid robots in the real world.
- Abstract(参考訳): 自動転倒回復は、ヒューマノイドロボットを確実に展開する上で重要な前提条件である。
人型ロボットが転倒した後は、さまざまな構成の人型ロボットが立ち上がることが予想されるため、立ち上がるための手作りのコントローラーは難しい。
本稿では,人型ロボットが様々な地形の様々な構成から立ち上がれるようにするための学習フレームワークを開発する。
従来のヒューマノイド運動への学習の応用とは違って、上昇作業には複雑な接触パターン(衝突幾何学の正確なモデリングを必要とする)とスペーサー報酬が含まれる。
カリキュラムを誘導する2段階のアプローチにより、これらの課題に対処する。
第1段階は、スムーズさや速度、トルク制限の最小限の制約の下で、良好な上昇軌道を発見することに焦点を当てている。
次に第2段階は、発見された動きを、初期構成や地形の変動に対して堅牢な展開可能な(スムーズで遅い)運動に洗練する。
これらのイノベーションにより、現実のG1ヒューマノイドロボットは、私たちが考慮した2つの主要な状況から立ち上がることができる。
faceup (countable かつ uncountable, 複数形 faceups)
b) 水平で変形可能な、滑りやすい表面と斜面(例えば、傾斜した草地及び雪原)に面して横たわる。
これは、人間のサイズのヒューマノイドロボットが現実世界で学習したポリシーを実証する最初の成功例の1つだ。
関連論文リスト
- Learning Humanoid Locomotion with World Model Reconstruction [8.27902320260747]
視覚障害者のためのエンド・ツー・エンドの学習手法であるワールド・モデル・コンストラクション(WMR)を導入する。
我々は、世界国家を明示的に再構築し、それを利用して移動政策を強化するよう、推定器を訓練する。
ロボットは人間の助けなしに3.2kmのハイキングを成功させた。
論文 参考訳(メタデータ) (2025-02-22T13:57:56Z) - Generalizable Humanoid Manipulation with 3D Diffusion Policies [41.23383596258797]
我々は、ヒューマノイドロボットによる自律的な操作の問題を解決するために、現実世界のロボットシステムを構築している。
本システムは主に,人型ロボットデータを取得するための全身ロボット遠隔操作システムと,高さ調整可能なカートと3D LiDARセンサを備えた25-DoFヒューマノイドロボットプラットフォームの統合である。
1つのシーンで収集されたデータのみを使用し、オンボードコンピューティングのみで、フルサイズのヒューマノイドロボットが様々な現実世界のシナリオで自律的にスキルを発揮できることが示される。
論文 参考訳(メタデータ) (2024-10-14T17:59:00Z) - Learning Humanoid Locomotion over Challenging Terrain [84.35038297708485]
本研究では,自然と人為的な地形を横断する視覚障害者の移動に対する学習に基づくアプローチを提案する。
本モデルではまず, 時系列モデルを用いた平地軌道のデータセット上で事前学習を行い, 補強学習を用いて不均一な地形を微調整する。
本研究では, 荒面, 変形面, 傾斜面など, 様々な地形にまたがる実際のヒューマノイドロボットを用いて, モデルを評価する。
論文 参考訳(メタデータ) (2024-10-04T17:57:09Z) - HumanoidBench: Simulated Humanoid Benchmark for Whole-Body Locomotion and Manipulation [50.616995671367704]
そこで本研究では,人型ロボットが器用な手を備えた,高次元シミュレーション型ロボット学習ベンチマークHumanoidBenchを提案する。
その結果,現在最先端の強化学習アルゴリズムがほとんどのタスクに支障をきたすのに対して,階層的学習アプローチはロバストな低レベルポリシーに支えられた場合,優れた性能を達成できることがわかった。
論文 参考訳(メタデータ) (2024-03-15T17:45:44Z) - Expressive Whole-Body Control for Humanoid Robots [20.132927075816742]
我々は、人間の動きをできるだけリアルに模倣するために、人間サイズのロボットで全身制御ポリシーを学習する。
シミュレーションとSim2Real転送のトレーニングにより、私たちのポリシーはヒューマノイドロボットを制御して、さまざまなスタイルで歩いたり、人と握手したり、現実世界で人間と踊ったりできる。
論文 参考訳(メタデータ) (2024-02-26T18:09:24Z) - Learning Human-to-Robot Handovers from Point Clouds [63.18127198174958]
視覚に基づく人間ロボットハンドオーバの制御ポリシーを学習する最初のフレームワークを提案する。
シミュレーションベンチマーク,sim-to-sim転送,sim-to-real転送において,ベースラインよりも大きな性能向上を示した。
論文 参考訳(メタデータ) (2023-03-30T17:58:36Z) - Learning Bipedal Walking for Humanoids with Current Feedback [5.429166905724048]
アクチュエータレベルでの不正確なトルクトラッキングから生じるヒューマノイドロボットのシム2リアルギャップ問題を克服するためのアプローチを提案する。
提案手法は、実際のHRP-5Pヒューマノイドロボットに展開して二足歩行を実現するシミュレーションにおいて、一貫したエンドツーエンドのポリシーをトレーニングする。
論文 参考訳(メタデータ) (2023-03-07T08:16:46Z) - Real-World Humanoid Locomotion with Reinforcement Learning [92.85934954371099]
実世界におけるヒューマノイド移動に対する完全学習型アプローチを提案する。
コントローラーは様々な屋外の地形の上を歩けるし、外乱に対して頑丈で、状況に応じて適応できる。
論文 参考訳(メタデータ) (2023-03-06T18:59:09Z) - HERD: Continuous Human-to-Robot Evolution for Learning from Human
Demonstration [57.045140028275036]
本研究では,マイクロ進化的強化学習を用いて,操作スキルを人間からロボットに伝達可能であることを示す。
本稿では,ロボットの進化経路とポリシーを協調的に最適化する多次元進化経路探索アルゴリズムを提案する。
論文 参考訳(メタデータ) (2022-12-08T15:56:13Z) - Legged Locomotion in Challenging Terrains using Egocentric Vision [70.37554680771322]
本稿では,階段,縁石,石段,隙間を横断できる最初のエンドツーエンド移動システムを提案する。
この結果を,1台の前面深度カメラを用いた中型四足歩行ロボットに示す。
論文 参考訳(メタデータ) (2022-11-14T18:59:58Z) - Learning Bipedal Robot Locomotion from Human Movement [0.791553652441325]
本研究では、実世界の二足歩行ロボットに、モーションキャプチャーデータから直接の動きを教えるための強化学習に基づく手法を提案する。
本手法は,シミュレーション環境下でのトレーニングから,物理ロボット上での実行へシームレスに移行する。
本研究では,ダイナミックウォークサイクルから複雑なバランスや手振りに至るまでの動作を内製したヒューマノイドロボットについて実演する。
論文 参考訳(メタデータ) (2021-05-26T00:49:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。