論文の概要: CoRe-MoE: Contrastive Reweighted Mixture of Experts for Multi-Terrain Humanoid Locomotion with Gait Adaptation
- arxiv url: http://arxiv.org/abs/2606.04718v1
- Date: Wed, 03 Jun 2026 10:51:46 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-04 20:44:18.693432
- Title: CoRe-MoE: Contrastive Reweighted Mixture of Experts for Multi-Terrain Humanoid Locomotion with Gait Adaptation
- Title(参考訳): CoRe-MoE:歩行適応型マルチテアリンヒューマノイドロコモーションの専門家の対照的な再加重混合
- Authors: Kailun Huang, Zikang Xie, Yanzhe Xie, Panpan Liao, Fanghai Zhang, Yanheng Mai, Wenhao Xu, Yunheng Wang, Renjing Xu, Haohui Huang,
- Abstract要約: 地形適応から歩行生成を分離する2段階強化学習フレームワークであるCoRe-MoEを提案する。
最初の段階では、安定な移動ポリシーが学習され、スムーズな遷移を伴う自然な歩行行動と走行行動が生み出される。
第2段階では、地形を意識したMoE分岐を導入し、ゲーティングネットワークを形成するための対照的な目的で訓練する。
- 参考スコア(独自算出の注目度): 18.803751724563448
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Humans primarily rely on walking and running to traverse complex terrains, without resorting to unnecessarily complex motion patterns. Similarly, humanoid robots should achieve smooth transitions between walking and running while maintaining natural and stable locomotion. However, unifying gait transition and multi-terrain adaptation within a single policy remains challenging due to gradient interference and the distribution shift induced by terrain-dependent visual and dynamic variations. Although Mixture-of-Experts (MoE) architectures can alleviate multi-skill interference, naive joint training often fails to yield clear expert specialization, limiting their effectiveness. To address these challenges, we propose CoRe-MoE, a two-stage reinforcement learning framework that decouples gait generation from terrain adaptation. In the first stage, a stable locomotion policy is learned to produce natural walking and running behaviors with smooth transitions. In the second stage, a terrain-aware MoE branch is introduced and trained with a contrastive objective to shape the gating network, enabling it to capture structured terrain representations and promote expert specialization. The final action is obtained via weighted fusion of the base gait policy and the terrain-aware branch, allowing the policy to preserve stable locomotion patterns while adapting to complex terrains. Extensive simulation results demonstrate that the proposed method outperforms baseline approaches in terms of success rate, locomotion stability, and multi-terrain adaptability. Furthermore, zero-shot deployment on a Unitree G1 humanoid robot validates the effectiveness of our framework, achieving robust walking and running across stairs, slopes, steps, obstacles, and unstructured outdoor terrains, while maintaining accurate foothold placement and dynamic stability under external disturbances.
- Abstract(参考訳): 人間は主に複雑な地形を歩いたり走ったりすることに頼っており、複雑な動きのパターンは必要としない。
同様に、ヒューマノイドロボットは、自然と安定した移動を維持しながら、歩行と走行の間のスムーズな遷移を達成すべきである。
しかし、勾配干渉や地形に依存した視覚的・動的変動による分布変化により、単一方針における歩行遷移と多面的適応は依然として困難である。
Mixture-of-Experts (MoE) アーキテクチャは、マルチスキルの干渉を軽減することができるが、素直なジョイントトレーニングでは、専門家の専門化が明確で、その効果が制限されることがしばしばある。
これらの課題に対処するため,地形適応から歩行生成を分離する2段階強化学習フレームワークであるCoRe-MoEを提案する。
最初の段階では、安定な移動ポリシーが学習され、スムーズな遷移を伴う自然な歩行行動と走行行動が生み出される。
第2段階では、地形を意識したMoEブランチを導入し、Gatingネットワークを形成するための対照的な目標で訓練し、構造化された地形表現をキャプチャし、専門家の専門化を促進する。
最終動作は、基本歩行ポリシーと地形対応ブランチの重み付けによる融合によって得られ、複雑な地形に適応しながら安定した移動パターンを維持できる。
その結果,提案手法は, 成功率, 移動安定性, マルチテランの適応性の観点から, ベースラインアプローチよりも優れていた。
さらに、Unitree G1ヒューマノイドロボットへのゼロショット展開は、我々のフレームワークの有効性を検証し、階段、斜面、階段、障害物、非構造屋外地形を横断し、かつ、正確な足場配置と外乱下での動的安定性を維持しながら、堅牢な歩行と走行を実現する。
関連論文リスト
- RPG: Robust Policy Gating for Smooth Multi-Skill Transitions in Humanoid Fighting [52.18271301977709]
我々は,スムーズで安定したヒューマノイド多スキル移行のためのハイブリッド・エキスパート・ポリシー・フレームワークであるRPGを提案する。
本手法では,動き遷移のランダム化と時間的ランダム化を取り入れて,アジャイルな戦闘行動を生成する統一的な政策を訓練する。
我々は、歩行/走る移動と戦闘スキルを統合する制御パイプラインを設計し、人間のような長時間の戦闘を任意の期間で行えるようにした。
論文 参考訳(メタデータ) (2026-04-23T07:14:35Z) - LatentMimic: Terrain-Adaptive Locomotion via Latent Space Imitation [22.247608050046125]
幾何学的制約からスタイリスティックな忠実さを分離する新しい移動学習フレームワークであるLatntMimicを紹介する。
政策の状態-行動分布と学習モキャップとの差を最小化することにより、厳密なポーズ追跡目的の条件付き緩和を提供する。
提案手法を4つの移動スタイルと4つの地形にまたがって検証し,LatentMimicが効果的な地形適応型移動を可能にすることを示す。
論文 参考訳(メタデータ) (2026-04-07T03:49:15Z) - START: Traversing Sparse Footholds with Terrain Reconstruction [11.632418196552324]
我々は,高度にスパースな足場でアジャイルで安定した移動を可能にする,単段階学習フレームワークSTARTを提案する。
STARTは、ローコストのオンボードビジョンとプロプレセプションのみを活用して、局所的な地形の高度マップを正確に再構築する。
実験結果から,STARTは実世界の様々なシナリオにまたがるゼロショット転送を実現することが示された。
論文 参考訳(メタデータ) (2025-12-15T10:02:41Z) - Gait-Adaptive Perceptive Humanoid Locomotion with Real-Time Under-Base Terrain Reconstruction [86.53248703859718]
本研究では,地形認識,歩行制御,全身制御を一つの強化学習ポリシーにマージする知覚的移動フレームワークを提案する。
31-DoF、1.65mのヒューマノイドロボットによる実験は、シミュレーションと実世界の両方で堅牢な移動を実証している。
論文 参考訳(メタデータ) (2025-12-08T11:42:41Z) - Surrogate compliance modeling enables reinforcement learned locomotion gaits for soft robots [5.193389420813379]
適応型形態形成ロボットは、変化するタスクや環境条件を満たすために形態と制御ポリシーに適応する。
このようなシステムの多くは、形状変形を可能にするソフトコンポーネントを利用するが、シミュレーションや制御の課題も導入している。
本稿では,ソフトボディ物理を明示的にモデル化する代わりに,剛体シミュレータ内でのソフトマテリアル変形を表す間接変数を導入する。
論文 参考訳(メタデータ) (2025-12-08T02:52:42Z) - Coordinating Spinal and Limb Dynamics for Enhanced Sprawling Robot Mobility [0.047116288835793156]
柔軟性のある脊椎は、脊椎に沿って波状の動きを通して身体を揺らぎ、不均一な地形や障害物を航行するのを助ける。
表面の不規則や摩擦の変動といった環境の不確実性は、体-肢の協調を著しく阻害する。
深い強化学習は、非決定論的環境を扱うための有望なフレームワークを提供する。
本研究では,サンショウウオのようなロボットを用いた学習型制御戦略と生物学的にインスパイアされた歩行設計手法について比較検討した。
論文 参考訳(メタデータ) (2025-04-18T23:08:48Z) - Humanoid Whole-Body Locomotion on Narrow Terrain via Dynamic Balance and Reinforcement Learning [54.26816599309778]
動的バランスと強化学習(RL)に基づく新しい全身移動アルゴリズムを提案する。
具体的には,ZMP(Zero-Moment Point)駆動の報酬とタスク駆動の報酬を,全身のアクター批判的枠組みで拡張した尺度を活用することで,動的バランス機構を導入する。
フルサイズのUnitree H1-2ロボットによる実験により、非常に狭い地形でのバランスを維持するための手法の有効性が検証された。
論文 参考訳(メタデータ) (2025-02-24T14:53:45Z) - VAE-Loco: Versatile Quadruped Locomotion by Learning a Disentangled Gait
Representation [78.92147339883137]
本研究では,特定の歩行を構成する主要姿勢位相を捕捉する潜在空間を学習することにより,制御器のロバスト性を高めることが重要であることを示す。
本研究では,ドライブ信号マップの特定の特性が,歩幅,歩幅,立位などの歩行パラメータに直接関係していることを示す。
生成モデルを使用することで、障害の検出と緩和が容易になり、汎用的で堅牢な計画フレームワークを提供する。
論文 参考訳(メタデータ) (2022-05-02T19:49:53Z) - Next Steps: Learning a Disentangled Gait Representation for Versatile
Quadruped Locomotion [69.87112582900363]
現在のプランナーは、ロボットが動いている間、キー歩行パラメータを連続的に変更することはできない。
本研究では、特定の歩行を構成する重要な姿勢位相を捉える潜在空間を学習することにより、この制限に対処する。
本研究では, 歩幅, 歩幅, 立位など, 歩行パラメータに直接対応した駆動信号マップの具体的特性を示す。
論文 参考訳(メタデータ) (2021-12-09T10:02:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。