論文の概要: HumanoidArena: Benchmarking Egocentric Hierarchical Whole-body Learning
- arxiv url: http://arxiv.org/abs/2606.17833v1
- Date: Tue, 16 Jun 2026 12:01:31 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-17 17:15:32.416975
- Title: HumanoidArena: Benchmarking Egocentric Hierarchical Whole-body Learning
- Title(参考訳): HumanoidArena:Egocentric Hierarchical Whole-body Learningのベンチマーク
- Authors: Taowen Wang, Zikang Xie, Bin Yang, Yunheng Wang, Zizhao Yuan, Yuetong Fang, Yixiao Feng, Yichi Wang, Xingyu Chen, Haodong Chen, Qiwei Wu, Weisheng Xu, Lihan Chen, Lusong Li, Zecui Zeng, Renjing Xu,
- Abstract要約: 我々は,自己中心型階層型全身学習のためのシミュレーションファーストベンチマークであるHumanoidArenaを紹介する。
高レベルのポリシーは、エゴセントリックなビジョン、プロプレセプション、命令をコンパクトな全身アクションに変換し、その後低レベルのGMTによって実行される。
実験により、階層制御により、学習したポリシーが多様な脚クリティカルな相互作用を解決できることが示されているが、性能はトラッカー条件が強く、GMT間移動は脆弱である。
- 参考スコア(独自算出の注目度): 38.43380992093738
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Humanoid robots promise whole-body interaction in human-centered environments, but scalable policy learning remains difficult because task-level decision-making and whole-body dynamic execution are tightly coupled. A practical solution is hierarchical control, where a high-level policy predicts intermediate whole-body actions and low-level general motion trackers (GMTs) execute them as stable humanoid motion. However, existing benchmarks rarely evaluate the policy-tracker interface itself, leaving open whether intermediate whole-body actions are executable, robust under task distribution shifts, and transferable across different GMT backends. We introduce HumanoidArena, a simulation-first benchmark for egocentric hierarchical whole-body learning. The benchmark formulates policy learning as a hierarchical decision making problem: a high-level policy converts egocentric vision, proprioception, and instructions into a compact whole-body action, which is subsequently executed by a low-level GMT. Instead of treating the legs as planar transport tools, HumanoidArena emphasizes interactions where lower-body coordination is structurally necessary in task completion. We therefore design 7 leg-critical HOI/HSI tasks in which success requires foot placement, balance maintenance, posture adjustment, and whole-body reorientation. To further diagnose the hierarchical system, we evaluate policies from two complementary perspectives: perturbation-conditioned generalization and GMT-conditioned transfer. Experiments show that hierarchical control enables learned policies to solve diverse leg-critical interactions, but performance is strongly tracker-conditioned and cross-GMT transfer remains fragile. These results position HumanoidArena as a benchmark for studying transferable intermediate action representations and scalable egocentric whole-body policy learning.
- Abstract(参考訳): ヒューマノイドロボットは、人間中心環境における全身の相互作用を約束するが、タスクレベルの意思決定と全身の動的実行が密結合しているため、スケーラブルなポリシー学習は依然として困難である。
現実的な解決策は階層的制御であり、高レベルポリシーは中間的な全身動作を予測し、低レベル一般モーショントラッカー(GMT)は安定なヒューマノイド運動としてそれらを実行する。
しかし、既存のベンチマークではポリシートラッカーインターフェース自体を評価することは滅多になく、中間のボディアクションが実行可能か、タスクの分散シフト下で堅牢か、異なるGMTバックエンド間で転送可能であるかは未定である。
我々は,自己中心型階層型全身学習のためのシミュレーションファーストベンチマークであるHumanoidArenaを紹介する。
このベンチマークは、ポリシー学習を階層的な意思決定問題として定式化し、高レベルのポリシーは、エゴセントリックなビジョン、プロプレセプション、命令をコンパクトな全身アクションに変換し、その後低レベルのGMTによって実行される。
脚を平面輸送ツールとして扱う代わりに、HumanoidArenaは、作業完了時に下半身調整が構造的に必要となる相互作用を強調している。
そこで我々は,足の配置,バランス維持,姿勢調整,体全体の順応を必要とする7つの脚クリティカルなHOI/HSIタスクを設計する。
階層的なシステムをさらに診断するために、摂動条件の一般化とGMT条件の移行という2つの相補的な観点からポリシーを評価する。
実験により,階層的制御により多様な脚クリティカルな相互作用を解決することができるが,性能はトラッカー条件が強く,GMT間移動は脆弱であることがわかった。
これらの結果から,HumanoidArenaは移動可能な中間動作表現とスケーラブルなエゴセントリックな全身政策学習のベンチマークとして位置づけられた。
関連論文リスト
- GHOST: Hierarchical Sub-Goal Policies for Generalizing Robot Manipulation [54.305781492241785]
本稿では,トレーニング分布を超えて一般化したビジュモータ操作ポリシーを学習するための枠組みを提案する。
GHOSTは、(i)多視点RGB-D観測から、3Dエンドエフェクタ上の分布として次のサブゴールを予測する高レベルポリシーに制御を分解する。
一連のタスクの中で、この階層的な分解は、フラットな拡散ポリシーと比較して、パフォーマンスと堅牢性を一貫して改善します。
論文 参考訳(メタデータ) (2026-06-08T18:08:01Z) - Cognition to Control - Multi-Agent Learning for Human-Humanoid Collaborative Transport [36.304887250687536]
本稿では,3層階層構造である認知制御(C2C)について述べる。
協調操作タスクの実験は、単一エージェントとエンドツーエンドのベースラインよりも成功と堅牢性を示す。
論文 参考訳(メタデータ) (2026-03-04T06:24:55Z) - ULTRA: Unified Multimodal Control for Autonomous Humanoid Whole-Body Loco-Manipulation [55.467742403416175]
本稿では,大規模モーションキャプチャをヒューマノイドに変換する物理駆動型ニューラルネットワークを提案する。
我々は高密度参照とスパースタスク仕様の両方をサポートする統合マルチモーダルコントローラを学習する。
その結果,ULTRAは自我中心の知覚から,自律的,目標条件付き全体ロコ操作に一般化することが示された。
論文 参考訳(メタデータ) (2026-03-03T18:59:29Z) - Generalizable Geometric Prior and Recurrent Spiking Feature Learning for Humanoid Robot Manipulation [90.90219129619344]
本稿では,スパイキング機能を備えたR-prior-S, Recurrent Geometric-priormodal Policyを提案する。
物理的現実の高レベル推論を基礎として、軽量な2次元幾何学的帰納バイアスを利用する。
ロボット行動生成におけるデータ効率問題に対して,再帰的適応スパイクネットワークを導入する。
論文 参考訳(メタデータ) (2026-01-13T23:36:30Z) - Coordinated Humanoid Manipulation with Choice Policies [43.635012621027904]
本稿では,モジュール型遠隔操作インタフェースとスケーラブルな学習フレームワークを組み合わせたシステムを提案する。
Choice Policy(選択ポリシー)は、複数の候補アクションを生成し、それらを評価することを学ぶ模倣学習アプローチである。
我々は,食器洗い機をロードする2つの現実的タスクと,ホワイトボードワイピングのための全身ロコ操作に関するアプローチを検証した。
論文 参考訳(メタデータ) (2025-12-31T18:59:53Z) - One-shot Humanoid Whole-body Motion Learning [18.375746497945023]
通常、動作カテゴリごとに複数のトレーニングサンプルを必要とする。
本研究では,1つの非歩行目標運動サンプルのみを用いて,効果的なヒューマノイド運動ポリシーを訓練する新しいアプローチを提案する。
論文 参考訳(メタデータ) (2025-10-29T07:48:10Z) - COMBO-Grasp: Learning Constraint-Based Manipulation for Bimanual Occluded Grasping [56.907940167333656]
集積ロボットグルーピングは、表面衝突などの環境制約により、所望のグルーピングポーズが運動的に不可能な場所である。
従来のロボット操作アプローチは、人間が一般的に使用する非包括的または双対的戦略の複雑さに苦しむ。
本稿では,2つの協調ポリシーを活用する学習ベースアプローチであるCOMBO-Grasp(Constraint-based Manipulation for Bimanual Occluded Grasping)を紹介する。
論文 参考訳(メタデータ) (2025-02-12T01:31:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。