論文の概要: Embodiment-Aware Generalist Specialist Distillation for Unified Humanoid Whole-Body Control
- arxiv url: http://arxiv.org/abs/2602.02960v1
- Date: Tue, 03 Feb 2026 00:58:29 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-04 18:37:15.16279
- Title: Embodiment-Aware Generalist Specialist Distillation for Unified Humanoid Whole-Body Control
- Title(参考訳): 統一ヒューマノイド全体制御のための体操式ジェネリストスペシャリスト蒸留法
- Authors: Quanquan Peng, Yunfeng Lin, Yufei Xue, Jiangmiao Pang, Weinan Zhang,
- Abstract要約: 我々は,複数のヒューマノイドを制御する単一統一政策を創出する,反復的な一般-専門的蒸留フレームワークを導入する。
シミュレーションでは5つのロボット,実環境では4つのロボットについて実験を行った。
- 参考スコア(独自算出の注目度): 34.056581843277904
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Humanoid Whole-Body Controllers trained with reinforcement learning (RL) have recently achieved remarkable performance, yet many target a single robot embodiment. Variations in dynamics, degrees of freedom (DoFs), and kinematic topology still hinder a single policy from commanding diverse humanoids. Moreover, obtaining a generalist policy that not only transfers across embodiments but also supports richer behaviors-beyond simple walking to squatting, leaning-remains especially challenging. In this work, we tackle these obstacles by introducing EAGLE, an iterative generalist-specialist distillation framework that produces a single unified policy that controls multiple heterogeneous humanoids without per-robot reward tuning. During each cycle, embodiment-specific specialists are forked from the current generalist, refined on their respective robots, and new skills are distilled back into the generalist by training on the pooled embodiment set. Repeating this loop until performance convergence produces a robust Whole-Body Controller validated on robots such as Unitree H1, G1, and Fourier N1. We conducted experiments on five different robots in simulation and four in real-world settings. Through quantitative evaluations, EAGLE achieves high tracking accuracy and robustness compared to other methods, marking a step toward scalable, fleet-level humanoid control. See more details at https://eagle-wbc.github.io/
- Abstract(参考訳): 強化学習(RL)で訓練されたヒューマノイド全体制御器は近年、優れた性能を達成している。
力学、自由度(DoF)、運動トポロジーの変動は、多様なヒューマノイドを指揮する単一方針を妨げている。
さらに、実施形態をまたいで移動するだけでなく、単純な歩行からしゃがみ、傾いたままの生き残りまで、よりリッチな行動を支援する一般政策を得る。
本研究では,ロボットごとの報酬調整を行なわずに複数の異種ヒューマノイドを制御する単一統一政策を創出する,反復的な一般-専門的蒸留フレームワークであるEAGLEを導入することで,これらの障害に対処する。
各サイクルにおいて、エンボディメント固有の専門家は、現在のジェネラリストからフォークされ、それぞれのロボットで洗練され、プール化されたエンボディメントセットでトレーニングすることで、新たなスキルをジェネラリストに吹き返される。
このループを性能収束まで繰り返すと、Unitree H1、G1、Fourier N1などのロボットで検証された堅牢なWhole-Body Controllerが生成される。
シミュレーションでは5つのロボット,実環境では4つのロボットについて実験を行った。
定量的評価により、ERGLEは他の手法と比較して高いトラッキング精度と堅牢性を達成し、スケーラブルでフリートレベルのヒューマノイド制御への一歩を踏み出した。
詳細はhttps://eagle-wbc.github.io/を参照のこと。
関連論文リスト
- ULTRA: Unified Multimodal Control for Autonomous Humanoid Whole-Body Loco-Manipulation [55.467742403416175]
本稿では,大規模モーションキャプチャをヒューマノイドに変換する物理駆動型ニューラルネットワークを提案する。
我々は高密度参照とスパースタスク仕様の両方をサポートする統合マルチモーダルコントローラを学習する。
その結果,ULTRAは自我中心の知覚から,自律的,目標条件付き全体ロコ操作に一般化することが示された。
論文 参考訳(メタデータ) (2026-03-03T18:59:29Z) - FRoM-W1: Towards General Humanoid Whole-Body Control with Language Instructions [147.04372611893032]
FRoM-W1は、自然言語を用いた一般的なヒューマノイド全体の動作制御を実現するために設計されたオープンソースのフレームワークである。
我々はUnitree H1とG1ロボット上でFRoM-W1を広範囲に評価した。
その結果,HumanML3D-Xベンチマークにおいて,人体全体の動作生成に優れた性能を示した。
論文 参考訳(メタデータ) (2026-01-19T07:59:32Z) - CHIP: Adaptive Compliance for Humanoid Control through Hindsight Perturbation [70.5382178207975]
hIsight Perturbation (CHIP)は、制御可能なエンドエフェクタ剛性を実現するプラグイン・アンド・プレイモジュールである。
CHIPの実装は簡単で、データ拡張も追加の報酬チューニングも必要ありません。
そこで本研究では,CHIPでトレーニングした汎用モーショントラッキングコントローラが,多種多様な操作タスクを実行できることを示す。
論文 参考訳(メタデータ) (2025-12-16T18:56:04Z) - GBC: Generalized Behavior-Cloning Framework for Whole-Body Humanoid Imitation [5.426712963311386]
Generalized Behavior Cloning (GBC)は、このエンドツーエンドの課題を解決するために設計された、包括的で統一されたソリューションである。
まず、適応データパイプラインは、識別可能なIKネットワークを利用して、人間のMoCapデータを任意のヒューマノイドに自動的に再ターゲットする。
第二に、MMTransformerアーキテクチャを用いた新しいDAgger-MMPPOアルゴリズムは、堅牢で高忠実な模倣ポリシーを学習する。
論文 参考訳(メタデータ) (2025-08-13T17:28:39Z) - From Experts to a Generalist: Toward General Whole-Body Control for Humanoid Robots [35.26305396688982]
BumbleBeeは、モーションクラスタリングとsim-to-real適応を組み合わせた、専門家と一般の学習フレームワークである。
2つのシミュレーションと本物のヒューマノイドロボットの実験は、BBが最先端の全身制御を実現することを実証している。
論文 参考訳(メタデータ) (2025-06-15T09:09:34Z) - GRoQ-LoCO: Generalist and Robot-agnostic Quadruped Locomotion Control using Offline Datasets [0.8678250057211367]
GRoQ-LoCOはスケーラブルで注目度の高いフレームワークで、複数の四足歩行ロボットと地形をまたいだ1つの汎用的なロコモーションポリシーを学習する。
我々のフレームワークは、ロボット固有のエンコーディングを組み込まずに、すべてのロボットからの保護的データのみを運用する。
その結果、オフラインでデータ駆動学習により、様々な4つの形態や行動にまたがる移動を一般化する可能性が示された。
論文 参考訳(メタデータ) (2025-05-16T08:17:01Z) - The One RING: a Robotic Indoor Navigation Generalist [58.30694487843546]
RING (Robotic Indoor Navigation Generalist) は、あらゆる移動ロボットを効果的な屋内セマンティックナビゲータに変えるための具体的方針である。
完全にシミュレーションで訓練されたRingは、ロボットによる大規模なランダム化を利用して、多くの現実世界のプラットフォームに堅牢な一般化を可能にする。
論文 参考訳(メタデータ) (2024-12-18T23:15:41Z) - Steering Your Generalists: Improving Robotic Foundation Models via Value Guidance [66.51390591688802]
バリューガイド型ポリシーステアリング(V-GPS)は、ポリシーの重みを微調整したり、アクセスしたりすることなく、幅広い種類のジェネラリストポリシーと互換性がある。
同じ値関数は、異なるアーキテクチャで5つの最先端ポリシーの性能を向上させることができることを示す。
論文 参考訳(メタデータ) (2024-10-17T17:46:26Z) - Low-Rank Modular Reinforcement Learning via Muscle Synergy [25.120547719120765]
モジュール強化学習(RL)は、アクチュエータごとに学習ポリシーを学習することで、多関節ロボットの制御を分散化する。
ロボット制御におけるDoFの冗長性を利用したSOLAR(Synergy-Oriented LeARning)フレームワークを提案する。
論文 参考訳(メタデータ) (2022-10-26T16:01:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。