論文の概要: Embodiment-Aware Generalist Specialist Distillation for Unified Humanoid Whole-Body Control
- arxiv url: http://arxiv.org/abs/2602.02960v1
- Date: Tue, 03 Feb 2026 00:58:29 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-04 18:37:15.16279
- Title: Embodiment-Aware Generalist Specialist Distillation for Unified Humanoid Whole-Body Control
- Title(参考訳): 統一ヒューマノイド全体制御のための体操式ジェネリストスペシャリスト蒸留法
- Authors: Quanquan Peng, Yunfeng Lin, Yufei Xue, Jiangmiao Pang, Weinan Zhang,
- Abstract要約: 我々は,複数のヒューマノイドを制御する単一統一政策を創出する,反復的な一般-専門的蒸留フレームワークを導入する。
シミュレーションでは5つのロボット,実環境では4つのロボットについて実験を行った。
- 参考スコア(独自算出の注目度): 34.056581843277904
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Humanoid Whole-Body Controllers trained with reinforcement learning (RL) have recently achieved remarkable performance, yet many target a single robot embodiment. Variations in dynamics, degrees of freedom (DoFs), and kinematic topology still hinder a single policy from commanding diverse humanoids. Moreover, obtaining a generalist policy that not only transfers across embodiments but also supports richer behaviors-beyond simple walking to squatting, leaning-remains especially challenging. In this work, we tackle these obstacles by introducing EAGLE, an iterative generalist-specialist distillation framework that produces a single unified policy that controls multiple heterogeneous humanoids without per-robot reward tuning. During each cycle, embodiment-specific specialists are forked from the current generalist, refined on their respective robots, and new skills are distilled back into the generalist by training on the pooled embodiment set. Repeating this loop until performance convergence produces a robust Whole-Body Controller validated on robots such as Unitree H1, G1, and Fourier N1. We conducted experiments on five different robots in simulation and four in real-world settings. Through quantitative evaluations, EAGLE achieves high tracking accuracy and robustness compared to other methods, marking a step toward scalable, fleet-level humanoid control. See more details at https://eagle-wbc.github.io/
- Abstract(参考訳): 強化学習(RL)で訓練されたヒューマノイド全体制御器は近年、優れた性能を達成している。
力学、自由度(DoF)、運動トポロジーの変動は、多様なヒューマノイドを指揮する単一方針を妨げている。
さらに、実施形態をまたいで移動するだけでなく、単純な歩行からしゃがみ、傾いたままの生き残りまで、よりリッチな行動を支援する一般政策を得る。
本研究では,ロボットごとの報酬調整を行なわずに複数の異種ヒューマノイドを制御する単一統一政策を創出する,反復的な一般-専門的蒸留フレームワークであるEAGLEを導入することで,これらの障害に対処する。
各サイクルにおいて、エンボディメント固有の専門家は、現在のジェネラリストからフォークされ、それぞれのロボットで洗練され、プール化されたエンボディメントセットでトレーニングすることで、新たなスキルをジェネラリストに吹き返される。
このループを性能収束まで繰り返すと、Unitree H1、G1、Fourier N1などのロボットで検証された堅牢なWhole-Body Controllerが生成される。
シミュレーションでは5つのロボット,実環境では4つのロボットについて実験を行った。
定量的評価により、ERGLEは他の手法と比較して高いトラッキング精度と堅牢性を達成し、スケーラブルでフリートレベルのヒューマノイド制御への一歩を踏み出した。
詳細はhttps://eagle-wbc.github.io/を参照のこと。
関連論文リスト
- FRoM-W1: Towards General Humanoid Whole-Body Control with Language Instructions [147.04372611893032]
FRoM-W1は、自然言語を用いた一般的なヒューマノイド全体の動作制御を実現するために設計されたオープンソースのフレームワークである。
我々はUnitree H1とG1ロボット上でFRoM-W1を広範囲に評価した。
その結果,HumanML3D-Xベンチマークにおいて,人体全体の動作生成に優れた性能を示した。
論文 参考訳(メタデータ) (2026-01-19T07:59:32Z) - From Experts to a Generalist: Toward General Whole-Body Control for Humanoid Robots [35.26305396688982]
BumbleBeeは、モーションクラスタリングとsim-to-real適応を組み合わせた、専門家と一般の学習フレームワークである。
2つのシミュレーションと本物のヒューマノイドロボットの実験は、BBが最先端の全身制御を実現することを実証している。
論文 参考訳(メタデータ) (2025-06-15T09:09:34Z) - GRoQ-LoCO: Generalist and Robot-agnostic Quadruped Locomotion Control using Offline Datasets [0.8678250057211367]
GRoQ-LoCOはスケーラブルで注目度の高いフレームワークで、複数の四足歩行ロボットと地形をまたいだ1つの汎用的なロコモーションポリシーを学習する。
我々のフレームワークは、ロボット固有のエンコーディングを組み込まずに、すべてのロボットからの保護的データのみを運用する。
その結果、オフラインでデータ駆動学習により、様々な4つの形態や行動にまたがる移動を一般化する可能性が示された。
論文 参考訳(メタデータ) (2025-05-16T08:17:01Z) - The One RING: a Robotic Indoor Navigation Generalist [58.30694487843546]
RING (Robotic Indoor Navigation Generalist) は、あらゆる移動ロボットを効果的な屋内セマンティックナビゲータに変えるための具体的方針である。
完全にシミュレーションで訓練されたRingは、ロボットによる大規模なランダム化を利用して、多くの現実世界のプラットフォームに堅牢な一般化を可能にする。
論文 参考訳(メタデータ) (2024-12-18T23:15:41Z) - Steering Your Generalists: Improving Robotic Foundation Models via Value Guidance [66.51390591688802]
バリューガイド型ポリシーステアリング(V-GPS)は、ポリシーの重みを微調整したり、アクセスしたりすることなく、幅広い種類のジェネラリストポリシーと互換性がある。
同じ値関数は、異なるアーキテクチャで5つの最先端ポリシーの性能を向上させることができることを示す。
論文 参考訳(メタデータ) (2024-10-17T17:46:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。