論文の概要: HANDOFF: Humanoid Agentic Task-Space Whole-Body Control via Distilled Complementary Teachers
- arxiv url: http://arxiv.org/abs/2606.06493v3
- Date: Tue, 09 Jun 2026 07:34:32 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-10 13:21:50.615811
- Title: HANDOFF: Humanoid Agentic Task-Space Whole-Body Control via Distilled Complementary Teachers
- Title(参考訳): HANDOFF: 補足教師によるヒューマノイドエージェント・タスク空間全体制御
- Authors: Lizhi Yang, Junheng Li, Nehar Poddar, Yiling Hou, Gio Huh, Robert Griffin, Georgia Gkioxari, Aaron Ames,
- Abstract要約: HANDOFFは、直感的で、汎用的で、モジュラーで、多様なロコ操作スキルを表現できる、ヒューマノイド全体のコントローラである。
Unitree G1では、HANDOFFは最先端のベロシティ追跡と一致し、最大のロバストなワークスペース操作を提供する。
- 参考スコア(独自算出の注目度): 6.1409946459609275
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: For a humanoid robot to be deployed in the real world, the choice of command space (i.e., the interface between task planning and whole-body control) is crucial. Existing whole-body controllers typically demand dense kinematic or spatial references that planners struggle to synthesize from task semantics. We instead propose a compact, explicit interface that is intuitive, general, modular, and expressive enough for diverse loco-manipulation skills. To this end, we introduce HANDOFF, a single humanoid whole-body controller that follows this interface and is distilled via multi-teacher KL distillation under a context-conditioned gating scheme into a mixture-of-experts student from three complementary specialists: whole-body motion tracking with safety-filtered data, locomotion, and fall-recovery. On the Unitree G1, HANDOFF matches state-of-the-art velocity tracking and offers one of the largest robust manipulation workspaces. We further demonstrate hardware feasibility through multiple natural-language-driven task roll-outs, powered by a VLM-driven agentic planner with no task-specific data or controller fine-tuning.
- Abstract(参考訳): ヒューマノイドロボットが現実世界に配備されるためには、コマンドスペース(タスク計画と全身制御のインターフェース)の選択が不可欠である。
既存のボディコントローラは、通常、プランナーがタスクセマンティクスから合成するのに苦労する密集したキネマティックまたは空間的な参照を要求する。
代わりに、直感的で、汎用的で、モジュール的で、多様なロコ操作スキルに十分な、コンパクトで明示的なインターフェースを提案する。
そこで,本稿では,HANDOFFについて述べる。HANDOFFは,このインタフェースに従い,コンテキスト条件付きゲーティングスキームの下でマルチティーチングKL蒸留により,安全フィルタデータ付き全身運動追跡,移動,転倒回復という,3つの相補的専門家の混合専門家の学生に蒸留される,単一のヒューマノイド全体制御器である。
ユニツリーG1では、HANDOFFは最先端の速度追跡と一致し、最大のロバストな操作ワークスペースの1つである。
さらに、VLM駆動のエージェントプランナによる複数の自然言語駆動タスクロールアウトにより、タスク固有のデータやコントローラの微調整が不要なハードウェアの実現可能性を示す。
関連論文リスト
- CEER: Compliant End-Effector and Root Control as a Unified Interface for Hierarchical Humanoid Loco-Manipulation [11.545606851036787]
本稿では,モジュール型ヒューマノイドのロコ操作に適合するエンドエフェクタ・ルート(EE-root)制御抽象化を提案する。
EE-rootはヒューマノイドのロコ操作の実用的な抽象化を提供し、多様なスキルのモジュール化とスケーラブルな統合を可能にします。
論文 参考訳(メタデータ) (2026-05-19T15:23:40Z) - CLAW: Composable Language-Annotated Whole-body Motion Generation [55.99805728566105]
CLAWは,言語を付加した全身運動データをスケーラブルに生成するためのパイプラインである。
CLAWは運動プランナーから運動プリミティブを構成し、動き、方向、速度、骨盤の高さ、持続時間によってパラメータ化される。
低レベルコントローラは、これらの参照を MuJoCo シミュレーションで追跡し、物理的に接地された軌道を生成する。
論文 参考訳(メタデータ) (2026-04-13T10:02:04Z) - ULTRA: Unified Multimodal Control for Autonomous Humanoid Whole-Body Loco-Manipulation [55.467742403416175]
本稿では,大規模モーションキャプチャをヒューマノイドに変換する物理駆動型ニューラルネットワークを提案する。
我々は高密度参照とスパースタスク仕様の両方をサポートする統合マルチモーダルコントローラを学習する。
その結果,ULTRAは自我中心の知覚から,自律的,目標条件付き全体ロコ操作に一般化することが示された。
論文 参考訳(メタデータ) (2026-03-03T18:59:29Z) - PILOT: A Perceptive Integrated Low-level Controller for Loco-manipulation over Unstructured Scenes [18.916978556216097]
PILOTは知覚的ロコ操作に適した単段階強化学習フレームワークである。
知覚的な移動と1つのポリシー内での全身制御をシナジー化する。
PILOTは、既存のベースラインと比較して、安定性、コマンド追跡精度、地形トラバーサビリティが優れている。
論文 参考訳(メタデータ) (2026-01-24T12:25:20Z) - CHIP: Adaptive Compliance for Humanoid Control through Hindsight Perturbation [70.5382178207975]
hIsight Perturbation (CHIP)は、制御可能なエンドエフェクタ剛性を実現するプラグイン・アンド・プレイモジュールである。
CHIPの実装は簡単で、データ拡張も追加の報酬チューニングも必要ありません。
そこで本研究では,CHIPでトレーニングした汎用モーショントラッキングコントローラが,多種多様な操作タスクを実行できることを示す。
論文 参考訳(メタデータ) (2025-12-16T18:56:04Z) - HumanoidVerse: A Versatile Humanoid for Vision-Language Guided Multi-Object Rearrangement [51.16740261131198]
視覚言語誘導型ヒューマノイド制御のための新しいフレームワークであるHumanoidVerseを紹介する。
HumanoidVerseは、自然言語命令と自我中心のカメラRGB観測のみでガイドされる複数のオブジェクトの連続的な操作をサポートする。
我々の研究は、現実の知覚的制約の下で複雑なシーケンシャルなタスクを実行できる、堅牢で汎用的なヒューマノイドエージェントに向けた重要なステップである。
論文 参考訳(メタデータ) (2025-08-23T08:23:14Z) - HOSIG: Full-Body Human-Object-Scene Interaction Generation with Hierarchical Scene Perception [57.37135310143126]
HO SIGは階層的なシーン認識を通じて全体インタラクションを合成するための新しいフレームワークである。
我々のフレームワークは、自己回帰生成による運動長の無制限化をサポートし、手動による介入を最小限に抑える。
この研究は、シーン認識ナビゲーションとデクスタラスオブジェクト操作の間に重要なギャップを埋める。
論文 参考訳(メタデータ) (2025-06-02T12:08:08Z) - Whole-Body Teleoperation for Mobile Manipulation at Zero Added Cost [8.71539730969424]
MoMa-Teleopは、既存のインターフェースからエンドエフェクタ動作を推測する新しい遠隔操作手法である。
提案手法は,様々なロボットやタスクに対して,タスク完了時間が大幅に短縮されることを実証する。
論文 参考訳(メタデータ) (2024-09-23T15:09:45Z) - DISCO: Embodied Navigation and Interaction via Differentiable Scene Semantics and Dual-level Control [53.80518003412016]
人間の命令によって多様なタスクに熟練した汎用的なインテリジェントホームアシストエージェントを構築することは、AI研究の長期的青写真である。
本研究では,具体的エージェントに対する原始的移動操作,すなわち指示された動詞と名詞のペアに基づいて,ナビゲートと対話の仕方について検討する。
本研究では、文脈化されたシーンモデリングと効率的な制御における非自明な進歩を特徴とするdisCOを提案する。
論文 参考訳(メタデータ) (2024-07-20T05:39:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。