論文の概要: HuB: Learning Extreme Humanoid Balance
- arxiv url: http://arxiv.org/abs/2505.07294v1
- Date: Mon, 12 May 2025 07:31:42 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-13 20:21:49.290306
- Title: HuB: Learning Extreme Humanoid Balance
- Title(参考訳): HuB:極度のヒューマノイドバランスを学ぶ
- Authors: Tong Zhang, Boyuan Zheng, Ruiqian Nai, Yingdong Hu, Yen-Jen Wang, Geng Chen, Fanqi Lin, Jiongye Li, Chuye Hong, Koushil Sreenath, Yang Gao,
- Abstract要約: Humanoid Balance(ヒューマノイドバランス)は,参照運動の洗練,バランス対応政策学習,シミュレート・トゥ・リアルトレーニングを統合した統合フレームワークである。
準静的バランスタスクにおけるUnitree G1ヒューマノイドロボットのアプローチを検証する。
- 参考スコア(独自算出の注目度): 21.986188490182993
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The human body demonstrates exceptional motor capabilities-such as standing steadily on one foot or performing a high kick with the leg raised over 1.5 meters-both requiring precise balance control. While recent research on humanoid control has leveraged reinforcement learning to track human motions for skill acquisition, applying this paradigm to balance-intensive tasks remains challenging. In this work, we identify three key obstacles: instability from reference motion errors, learning difficulties due to morphological mismatch, and the sim-to-real gap caused by sensor noise and unmodeled dynamics. To address these challenges, we propose HuB (Humanoid Balance), a unified framework that integrates reference motion refinement, balance-aware policy learning, and sim-to-real robustness training, with each component targeting a specific challenge. We validate our approach on the Unitree G1 humanoid robot across challenging quasi-static balance tasks, including extreme single-legged poses such as Swallow Balance and Bruce Lee's Kick. Our policy remains stable even under strong physical disturbances-such as a forceful soccer strike-while baseline methods consistently fail to complete these tasks. Project website: https://hub-robot.github.io
- Abstract(参考訳): 人体は、片足で着実に立ち、脚を1.5メートル以上上げ、正確なバランス制御を必要とするハイキックを行うなど、例外的な運動能力を示す。
近年のヒューマノイド制御の研究は、強化学習を利用してスキル獲得のための人間の動きを追跡するが、このパラダイムをバランス集約タスクに適用することは依然として困難である。
本研究では, 参照動作誤差からの不安定性, 形態的ミスマッチによる学習困難, センサノイズと非モデル化力学によるシム・トゥ・リアルギャップの3つの主要な障害を同定する。
これらの課題に対処するため,Humanoid Balance(Humanoid Balance)を提案する。Humanoid Balance(Humanoid Balance)は,参照運動の洗練,バランス対応ポリシ学習,およびsim-to-realのロバストネストレーニングを統合した統合フレームワークで,各コンポーネントが特定の課題をターゲットにしている。
我々は,Unitree G1のヒューマノイドロボットに対するアプローチを,Swallow BalanceやBruce Lee's Kickのような極端な単一脚のポーズを含む準静的バランスタスクで検証した。
我々の政策は、強烈なサッカーストライキのような強い身体的混乱の下でも安定しているが、ベースラインの手法は一貫してこれらのタスクを完了させていない。
プロジェクトサイト:https://hub-robot.github.io
関連論文リスト
- Humanoid Whole-Body Locomotion on Narrow Terrain via Dynamic Balance and Reinforcement Learning [54.26816599309778]
動的バランスと強化学習(RL)に基づく新しい全身移動アルゴリズムを提案する。
具体的には,ZMP(Zero-Moment Point)駆動の報酬とタスク駆動の報酬を,全身のアクター批判的枠組みで拡張した尺度を活用することで,動的バランス機構を導入する。
フルサイズのUnitree H1-2ロボットによる実験により、非常に狭い地形でのバランスを維持するための手法の有効性が検証された。
論文 参考訳(メタデータ) (2025-02-24T14:53:45Z) - HOMIE: Humanoid Loco-Manipulation with Isomorphic Exoskeleton Cockpit [52.12750762494588]
本稿では,半自律遠隔操作システムHOMIEを紹介する。
ペダルにマッピングされた身体制御のための強化学習ポリシー、腕制御のための異形外骨格アーム、手操作のためのモーションセンシンググローブを組み合わせている。
このシステムは完全なオープンソースであり、デモとコードはhttps://homietele.org/.com/で見ることができる。
論文 参考訳(メタデータ) (2025-02-18T16:33:38Z) - Agile and versatile bipedal robot tracking control through reinforcement learning [12.831810518025309]
本稿では,二足歩行ロボットのための多目的コントローラを提案する。
足首と身体の軌跡を、単一の小さなニューラルネットワークを用いて広範囲の歩行で追跡する。
最小限の制御ユニットと高レベルなポリシーを組み合わせることで、高いフレキシブルな歩行制御を実現することができる。
論文 参考訳(メタデータ) (2024-04-12T05:25:03Z) - Reinforcement Learning for Versatile, Dynamic, and Robust Bipedal Locomotion Control [106.32794844077534]
本稿では,二足歩行ロボットのための動的移動制御系を構築するために,深層強化学習を用いた研究について述べる。
本研究では、周期歩行やランニングから周期ジャンプや立位に至るまで、様々な動的二足歩行技術に使用できる汎用的な制御ソリューションを開発する。
この研究は、二足歩行ロボットの俊敏性の限界を、現実世界での広範な実験を通じて押し上げる。
論文 参考訳(メタデータ) (2024-01-30T10:48:43Z) - Natural and Robust Walking using Reinforcement Learning without
Demonstrations in High-Dimensional Musculoskeletal Models [29.592874007260342]
人間は複雑な自然環境の中を歩く頑丈な二足歩行で運動します。
神経系が筋骨格の冗長性をどのように解決し、多目的制御問題を解決するかは、まだ完全には分かっていない。
論文 参考訳(メタデータ) (2023-09-06T13:20:31Z) - Learning Vision-based Pursuit-Evasion Robot Policies [54.52536214251999]
我々は、部分的に観察可能なロボットの監督を生成する完全観測可能なロボットポリシーを開発する。
我々は、RGB-Dカメラを搭載した4足歩行ロボットに、野生での追従回避のインタラクションにポリシーを展開させる。
論文 参考訳(メタデータ) (2023-08-30T17:59:05Z) - Residual Force Control for Agile Human Behavior Imitation and Extended
Motion Synthesis [32.22704734791378]
強化学習は、モーションキャプチャーデータからヒューマノイド制御ポリシーを学習することで、現実的な人間の行動に大きな可能性を示してきた。
バレエダンスのような洗練された人間のスキルを再現することや、複雑な移行を伴う長期的な人間の振る舞いを安定して模倣することは、依然として非常に困難である。
動作空間に外部残留力を加えることでヒューマノイド制御ポリシーを強化する新しいアプローチである残留力制御(RFC)を提案する。
論文 参考訳(メタデータ) (2020-06-12T17:56:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。