論文の概要: Toward Reliable Sim-to-Real Predictability for MoE-based Robust Quadrupedal Locomotion
- arxiv url: http://arxiv.org/abs/2602.00678v2
- Date: Tue, 10 Feb 2026 13:18:08 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-23 08:17:41.044297
- Title: Toward Reliable Sim-to-Real Predictability for MoE-based Robust Quadrupedal Locomotion
- Title(参考訳): MoEを用いたロバスト四足歩行の信頼性の同時予測に向けて
- Authors: Tianyang Wu, Hanwei Guo, Yuhang Wang, Junshu Yang, Xinyang Sui, Jiayi Xie, Xingyu Chen, Zeyang Liu, Xuguang Lan,
- Abstract要約: 我々は,Mixture-of-Experts(MoE)ロコモーションポリシーを含む統一的なフレームワークを導入する。
RoboGaugeは、sim-to-realトランスファービリティを定量化する予測アセスメントスイートである。
Unitree Go2の実験は、目に見えない困難な地形で堅牢な移動を示しています。
- 参考スコア(独自算出の注目度): 43.57040722971835
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Reinforcement learning has shown strong promise for quadrupedal agile locomotion, even with proprioception-only sensing. In practice, however, sim-to-real gap and reward overfitting in complex terrains can produce policies that fail to transfer, while physical validation remains risky and inefficient. To address these challenges, we introduce a unified framework encompassing a Mixture-of-Experts (MoE) locomotion policy for robust multi-terrain representation with RoboGauge, a predictive assessment suite that quantifies sim-to-real transferability. The MoE policy employs a gated set of specialist experts to decompose latent terrain and command modeling, achieving superior deployment robustness and generalization via proprioception alone. RoboGauge further provides multi-dimensional proprioception-based metrics via sim-to-sim tests over terrains, difficulty levels, and domain randomizations, enabling reliable MoE policy selection without extensive physical trials. Experiments on a Unitree Go2 demonstrate robust locomotion on unseen challenging terrains, including snow, sand, stairs, slopes, and 30 cm obstacles. In dedicated high-speed tests, the robot reaches 4 m/s and exhibits an emergent narrow-width gait associated with improved stability at high velocity.
- Abstract(参考訳): 強化学習は、プロプレセプションのみのセンシングでさえ、四足歩行のアジャイルロコモーションに強く期待されている。
しかし、実際には、複雑な地形におけるシム・トゥ・リアルのギャップと報酬の過剰適合は、物理的な検証が危険で非効率であるのに対して、転送に失敗するポリシーを生み出す可能性がある。
これらの課題に対処するため,我々は,Mixture-of-Experts(MoE)ロコモーションポリシーを包含する統合フレームワークをRoboGaugeで導入した。
MoEポリシーは、潜伏した地形とコマンド・モデリングを分解し、プロプリセプションのみで優れた配置の堅牢性と一般化を達成するために、専門家の密集したセットを採用している。
RoboGaugeはさらに、地形、難易度、ドメインランダム化に関するsim-to-simテストを通じて、多次元プロプリセプションベースのメトリクスを提供する。
ユニツリーのGo2の実験では、雪、砂、階段、斜面、30cmの障害物など、目に見えない困難な地形で頑丈な移動が実証されている。
専用高速試験では、ロボットは4m/sに達し、高速での安定性の向上に伴う急激な狭幅歩行を示す。
関連論文リスト
- SteadyTray: Learning Object Balancing Tasks in Humanoid Tray Transport via Residual Reinforcement Learning [4.827821660801356]
本稿では、ペイロード安定化から移動を明示的に分離する階層型強化学習アーキテクチャであるReST-RLを紹介する。
シミュレーションでは、残差設計は歩行の滑らかさと方向精度において、エンドツーエンドのベースラインを著しく上回る。
このモジュラーアプローチは、様々な物体をまたいだ高信頼性ゼロショット sim-to-real 一般化と外部力の乱れを示す。
論文 参考訳(メタデータ) (2026-03-11T01:05:46Z) - Learning Agile and Robust Omnidirectional Aerial Motion on Overactuated Tiltable-Quadrotors [15.511018281264674]
本研究は, 過動型傾斜四角形における全方向空中運動制御のための強化学習について検討する。
本稿では,目標ポーズに到達するための協調ロータ接合動作の効率的な獲得を可能にする学習ベース制御フレームワークを提案する。
論文 参考訳(メタデータ) (2026-02-25T05:13:25Z) - SENSE-STEP: Learning Sim-to-Real Locomotion for a Sensory-Enabled Soft Quadruped Robot [6.072947394612051]
触覚吸引カップ足を備えた空気圧作動式ソフト四足歩行のための学習ベース制御フレームワークを提案する。
実際のロボットに配備すると、クローズドループポリシーはオープンループベースラインよりも優れ、平坦な表面では前方速度が41%増加し、5度の傾斜では91%向上する。
論文 参考訳(メタデータ) (2026-02-13T16:37:29Z) - MetAdv: A Unified and Interactive Adversarial Testing Platform for Autonomous Driving [85.04826012938642]
MetAdvは、現実的でダイナミックでインタラクティブな評価を可能にする、新しい対向テストプラットフォームである。
フレキシブルな3D車両モデリングと、シミュレートされた環境と物理的環境のシームレスな遷移をサポートする。
生理的信号のリアルタイムキャプチャとドライバからの行動フィードバックを可能にする。
論文 参考訳(メタデータ) (2025-08-04T03:07:54Z) - MULE: Multi-terrain and Unknown Load Adaptation for Effective Quadrupedal Locomotion [1.479858319622657]
四足歩行ロボットは、様々な地形にまたがる荷積み作業にますます利用されている。
本研究では,四足歩行ロボットが様々なペイロードと多様な地形に適応できる適応強化学習フレームワークを提案する。
提案手法はIsaac Gymの大規模シミュレーション実験と,Unitree Go1の4倍体上での実際のハードウェア展開により検証する。
論文 参考訳(メタデータ) (2025-05-01T12:41:35Z) - PALo: Learning Posture-Aware Locomotion for Quadruped Robots [29.582249837902427]
本稿では,姿勢認識型移動ロボットPALoのエンド・ツー・エンド深部強化学習フレームワークを提案する。
PALoは、直線速度と角速度の同時追跡と、体高、ピッチ、ロール角度のリアルタイム調整を行う。
PALoは、シミュレートされた環境でアジャイルな姿勢認識ロコモーションコントロールを実現し、微調整なしで実世界の設定に転送することに成功した。
論文 参考訳(メタデータ) (2025-03-06T14:13:59Z) - Mixture of insighTful Experts (MoTE): The Synergy of Thought Chains and Expert Mixtures in Self-Alignment [103.05005690990271]
MoTE(Mixture of insightful Experts)は、推論チェーンとエキスパートミックスを組み合わせて自己調整を改善する新しいフレームワークである。
MoTEはモデルの安全性、脱獄耐性、過剰な拒否機能を大幅に改善し、OpenAIの最先端のo1モデルに匹敵するパフォーマンスを実現している。
論文 参考訳(メタデータ) (2024-05-01T15:06:05Z) - Nonprehensile Riemannian Motion Predictive Control [57.295751294224765]
本稿では,リアル・ツー・シムの報酬分析手法を導入し,リアルなロボット・プラットフォームに対する行動の可能性を確実に予測する。
連続的なアクション空間でオブジェクトを反応的にプッシュするクローズドループコントローラを作成します。
我々は,RMPCが乱雑な環境だけでなく,乱雑な環境においても頑健であり,ベースラインよりも優れていることを観察した。
論文 参考訳(メタデータ) (2021-11-15T18:50:04Z) - First Steps: Latent-Space Control with Semantic Constraints for
Quadruped Locomotion [73.37945453998134]
従来の四重化制御のアプローチでは、単純化された手作りのモデルが採用されている。
これにより、有効な運動範囲が縮小されているため、ロボットの能力が大幅に低下する。
この研究において、これらの課題は、構造化潜在空間における最適化として四重化制御をフレーミングすることによって解決される。
深い生成モデルは、実現可能な関節構成の統計的表現を捉え、一方、複雑な動的および終端的制約は高レベルな意味的指標によって表現される。
実世界とシミュレーションの両方で最適化された移動軌跡の実現可能性を検証する。
論文 参考訳(メタデータ) (2020-07-03T07:04:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。