論文の概要: X-Loco: Towards Generalist Humanoid Locomotion Control via Synergetic Policy Distillation
- arxiv url: http://arxiv.org/abs/2603.03733v1
- Date: Wed, 04 Mar 2026 05:07:05 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-23 08:17:41.879842
- Title: X-Loco: Towards Generalist Humanoid Locomotion Control via Synergetic Policy Distillation
- Title(参考訳): X-Loco: 総合的ヒューマノイドロコモーション制御を目指して : 相乗的政策蒸留
- Authors: Dewei Wang, Xinmiao Wang, Chenyun Zhang, Jiyuan Shi, Yingnan Zhao, Chenjia Bai, Xuelong Li,
- Abstract要約: X-Locoは、視覚に基づく一般人型ロコモーションポリシーを訓練するためのフレームワークである。
X-ロコは複数のオラクル・スペシャリスト・ポリシーを訓練し、ケース・アダプティブ・スペシャリストの選択機構を備えたシナジー・ポリシー・蒸留を採用する。
この設計により、学生は広い範囲の運動能力を得ることができる。
- 参考スコア(独自算出の注目度): 50.0220259870317
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: While recent advances have demonstrated strong performance in individual humanoid skills such as upright locomotion, fall recovery and whole-body coordination, learning a single policy that masters all these skills remains challenging due to the diverse dynamics and conflicting control objectives involved. To address this, we introduce X-Loco, a framework for training a vision-based generalist humanoid locomotion policy. X-Loco trains multiple oracle specialist policies and adopts a synergetic policy distillation with a case-adaptive specialist selection mechanism, which dynamically leverages multiple specialist policies to guide a vision-based student policy. This design enables the student to acquire a broad spectrum of locomotion skills, ranging from fall recovery to terrain traversal and whole-body coordination skills. To the best of our knowledge, X-Loco is the first framework to demonstrate vision-based humanoid locomotion that jointly integrates upright locomotion, whole-body coordination and fall recovery, while operating solely under velocity commands without relying on reference motions. Experimental results show that X-Loco achieves superior performance, demonstrated by tasks such as fall recovery and terrain traversal. Ablation studies further highlight that our framework effectively leverages specialist expertise and enhances learning efficiency.
- Abstract(参考訳): 近年の進歩は、直立ロコモーション、転倒回復、体全体の調整など、個人のヒューマノイドスキルに強いパフォーマンスを示してきたが、これらのスキルをマスターする単一のポリシーを学ぶことは、様々なダイナミクスと矛盾するコントロールの目的のために、依然として困難なままである。
そこで本研究では,視覚に基づく一般人型ロコモーションポリシーをトレーニングするフレームワークであるX-Locoを紹介する。
X-ロコは複数のオラクルの専門家ポリシーを訓練し、ケース適応型スペシャリスト選択機構を備えたシナジー的ポリシー蒸留を採用し、複数の専門ポリシーを動的に活用してビジョンベースの学生ポリシーを導出する。
この設計により、学生は転倒回復から地形トラバーサル、全身調整スキルまで幅広い移動スキルを習得できる。
我々の知る限りでは、X-Locoは視覚に基づくヒューマノイド運動を初めて実証するフレームワークであり、参照動作に頼ることなく、速度コマンドのみで動作しながら、直立運動、全身調整、転倒回復を共同で統合する。
実験結果から,X-Locoは転倒回復や地形トラバースといったタスクによって,優れた性能を発揮することが示された。
アブレーション研究は、我々のフレームワークが専門知識を効果的に活用し、学習効率を高めることを強調している。
関連論文リスト
- TeamHOI: Learning a Unified Policy for Cooperative Human-Object Interactions with Any Team Size [54.0714652192002]
物理に基づくヒューマノイド制御は、現実的でハイパフォーマンスな単一エージェントの動作を可能にするために顕著な進歩を遂げた。
我々は,複数の協力エージェント間で協調的なHOIを処理するための,単一の分散政策を実現するためのフレームワークであるTeamHOIを提案する。
論文 参考訳(メタデータ) (2026-03-09T05:52:13Z) - Perceptive Humanoid Parkour: Chaining Dynamic Human Skills via Motion Matching [77.28042137892943]
本稿では,人間型ロボットの長期的視覚的パーキングを自律的に行うためのモジュール型フレームワークであるPerceptive Humanoid Parkour(PHP)を提案する。
本研究は、これらの合成動作に対する運動追跡強化学習専門家の政策を訓練し、それらを深度に基づく多スキル学生政策に抽出する。
我々は,Unitree G1ヒューマノイドロボットを用いた実世界実験により,我々のフレームワークを検証した。
論文 参考訳(メタデータ) (2026-02-17T18:59:11Z) - Learning coordinated badminton skills for legged manipulators [12.514822343998908]
我々は,手足の移動マニピュレータがバドミントンを奏でるようにするためのアプローチを提案する。
本研究は,全身運動能力のための強化学習に基づく統一的制御政策を提案する。
本手法は,シャトルコック予測モデル,ロバスト動作制御のための制約付き強化学習,システム同定技術を含む。
論文 参考訳(メタデータ) (2025-05-29T01:26:30Z) - Teacher Motion Priors: Enhancing Robot Locomotion over Challenging Terrain [6.7297018009524]
本稿では,教師の学生パラダイムに基づく教師事前の枠組みを紹介する。
模倣と補助的なタスク学習を統合し、学習効率と一般化を改善する。
このフレームワークはヒューマノイドロボット上で検証され、動的地形における移動安定性を大幅に向上させる。
論文 参考訳(メタデータ) (2025-04-14T16:36:56Z) - StyleLoco: Generative Adversarial Distillation for Natural Humanoid Robot Locomotion [31.30409161905949]
StyleLocoは、ヒューマノイドの移動を学ぶための新しいフレームワークである。
強化学習の機敏さと人間のような運動の自然な流動性を組み合わせる。
StyleLocoは、ヒューマノイドロボットが多様な移動作業を行うことを可能にすることを実証する。
論文 参考訳(メタデータ) (2025-03-19T10:27:44Z) - Reinforcement Learning for Versatile, Dynamic, and Robust Bipedal Locomotion Control [106.32794844077534]
本稿では,二足歩行ロボットのための動的移動制御系を構築するために,深層強化学習を用いた研究について述べる。
本研究では、周期歩行やランニングから周期ジャンプや立位に至るまで、様々な動的二足歩行技術に使用できる汎用的な制御ソリューションを開発する。
この研究は、二足歩行ロボットの俊敏性の限界を、現実世界での広範な実験を通じて押し上げる。
論文 参考訳(メタデータ) (2024-01-30T10:48:43Z) - An Adaptable Approach to Learn Realistic Legged Locomotion without
Examples [38.81854337592694]
本研究は,バネ装荷逆振り子モデルを用いて学習プロセスを導くことで,移動における現実性を保証するための汎用的アプローチを提案する。
モデルのない設定であっても、2足歩行ロボットと4足歩行ロボットに対して、学習したポリシーが現実的でエネルギー効率のよい移動歩行を生成できることを示す実験結果を示す。
論文 参考訳(メタデータ) (2021-10-28T10:14:47Z) - UniCon: Universal Neural Controller For Physics-based Character Motion [70.45421551688332]
大規模動作データセットから学習することで,異なるスタイルで数千の動作を習得する物理ベースのユニバーサルニューラルコントローラ(UniCon)を提案する。
UniConは、キーボード駆動制御をサポートし、ロコモーションとアクロバティックスキルの大きなプールから引き出されたモーションシーケンスを作成し、ビデオで撮影した人を物理ベースの仮想アバターにテレポートする。
論文 参考訳(メタデータ) (2020-11-30T18:51:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。