論文の概要: CMoE: Contrastive Mixture of Experts for Motion Control and Terrain Adaptation of Humanoid Robots
- arxiv url: http://arxiv.org/abs/2603.03067v1
- Date: Tue, 03 Mar 2026 15:06:30 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-23 08:17:41.862671
- Title: CMoE: Contrastive Mixture of Experts for Motion Control and Terrain Adaptation of Humanoid Robots
- Title(参考訳): CMoE:ヒューマノイドロボットの運動制御と地形適応の専門家の対比
- Authors: Shihao Ma, Hongjin Chen, Zijun Xu, Yi Zhao, Ke Wu, Ruichen Yang, Leyao Zou, Zhongxue Gan, Wenchao Ding,
- Abstract要約: バニラ混合の専門家(MoE)フレームワークは、理論上多様な地形の特徴をモデル化することができる。
我々は,一段強化学習フレームワークであるCMoEを紹介した。
その結果、CMoEは高さ20cm、幅80cmの連続的な歩幅を横切ることができることがわかった。
- 参考スコア(独自算出の注目度): 15.062634107888982
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: For effective deployment in real-world environments, humanoid robots must autonomously navigate a diverse range of complex terrains with abrupt transitions. While the Vanilla mixture of experts (MoE) framework is theoretically capable of modeling diverse terrain features, in practice, the gating network exhibits nearly uniform expert activations across different terrains, weakening the expert specialization and limiting the model's expressive power. To address this limitation, we introduce CMoE, a novel single-stage reinforcement learning framework that integrates contrastive learning to refine expert activation distributions. By imposing contrastive constraints, CMoE maximizes the consistency of expert activations within the same terrain while minimizing their similarity across different terrains, thereby encouraging experts to specialize in distinct terrain types. We validated our approach on the Unitree G1 humanoid robot through a series of challenging experiments. Results demonstrate that CMoE enables the robot to traverse continuous steps up to 20 cm high and gaps up to 80 cm wide, while achieving robust and natural gait across diverse mixed terrains, surpassing the limits of existing methods. To support further research and foster community development, we release our code publicly.
- Abstract(参考訳): 現実の環境で効果的に展開するには、ヒューマノイドロボットは急激な遷移を伴う多様な複雑な地形を自律的に移動する必要がある。
バニラの混合した専門家(MoE)フレームワークは理論上多様な地形の特徴をモデル化できるが、実際には、ゲーティングネットワークは様々な地形にわたってほぼ均一な専門家の活性化を示し、専門家の専門化を弱め、モデルの表現力を制限する。
この制限に対処するため,一段強化学習フレームワークであるCMoEを導入する。
対照的な制約を課すことで、CMoEは同じ地形内で専門家のアクティベーションの一貫性を最大化し、異なる地形をまたいだ類似性を最小化し、専門家に異なる地形のタイプを専門化するよう促す。
我々は,Unitree G1ヒューマノイドロボットに対するアプローチを,一連の挑戦的な実験を通じて検証した。
以上の結果から,CMoEは高さ20cmまでの連続的な歩幅と幅80cmまでの隙間をロボットが移動し,多様な混合地形にまたがる頑健で自然な歩留まりを達成し,既存の手法の限界を超えることが示唆された。
さらなる研究とコミュニティ開発を支援するため、コードを公開しています。
関連論文リスト
- Perceptive Humanoid Parkour: Chaining Dynamic Human Skills via Motion Matching [77.28042137892943]
本稿では,人間型ロボットの長期的視覚的パーキングを自律的に行うためのモジュール型フレームワークであるPerceptive Humanoid Parkour(PHP)を提案する。
本研究は、これらの合成動作に対する運動追跡強化学習専門家の政策を訓練し、それらを深度に基づく多スキル学生政策に抽出する。
我々は,Unitree G1ヒューマノイドロボットを用いた実世界実験により,我々のフレームワークを検証した。
論文 参考訳(メタデータ) (2026-02-17T18:59:11Z) - Heterogeneous Robot Collaboration in Unstructured Environments with Grounded Generative Intelligence [54.91177026001217]
大規模言語モデル(LLM)対応のチーム化手法は、よく構造化された既知の環境を前提とするのが一般的である。
異種ロボットチームにおけるLCMの推論能力を基盤として,これらの制約に対処するフレームワークであるSPINE-HTを提案する。
我々のフレームワークは、従来のLLM対応の不均一なチームリング手法と比較して、ほぼ2倍の成功率を達成する。
論文 参考訳(メタデータ) (2025-10-30T18:24:38Z) - MoE-Loco: Mixture of Experts for Multitask Locomotion [52.04025933292957]
脚付きロボットのマルチタスク移動のためのフレームワークであるMoE-Locoを提案する。
本手法は,四足歩行と二足歩行をサポートしながら,多様な地形を扱える1つの政策を実現する。
論文 参考訳(メタデータ) (2025-03-11T15:53:54Z) - Leveraging Hyperbolic Embeddings for Coarse-to-Fine Robot Design [40.01142267374432]
マルチセルロボットの設計は、多様なタスクを実行するために効率的に制御できる多数のセルからなるロボットを作ることを目的としている。
これまでの研究では、さまざまなタスクのためのロボットを生成する能力が実証されてきたが、これらのアプローチは、広大なデザイン空間でロボットを直接最適化することが多い。
本稿では,多細胞ロボットを設計するための新しい粗粒化手法を提案する。
論文 参考訳(メタデータ) (2023-11-01T11:56:32Z) - Transferring Foundation Models for Generalizable Robotic Manipulation [82.12754319808197]
インターネット規模の基盤モデルによって生成された言語推論セグメンテーションマスクを効果的に活用する新しいパラダイムを提案する。
提案手法は,オブジェクトのポーズを効果的かつ堅牢に知覚し,サンプル効率のよい一般化学習を可能にする。
デモは提出されたビデオで見ることができ、より包括的なデモはlink1またはlink2で見ることができます。
論文 参考訳(メタデータ) (2023-06-09T07:22:12Z) - Deep Multi-Agent Reinforcement Learning with Hybrid Action Spaces based
on Maximum Entropy [0.0]
本稿では,ハイブリッドアクション空間におけるマルチエージェント問題に対処するために,深層マルチエージェントハイブリッド・アクター・クリティカル(MAHSAC)を提案する。
このアルゴリズムは、中央集権的なトレーニングであるが、分散実行(CTDE)パラダイムに従い、ハイブリッドアクション空間問題を扱うためにソフトアクター・クリティカルアルゴリズム(SAC)を拡張している。
私たちの経験は、連続的な観察と離散的なアクション空間を持つ、簡単なマルチエージェント粒子の世界と、いくつかの基本的なシミュレートされた物理学で動いています。
論文 参考訳(メタデータ) (2022-06-10T13:52:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。