論文の概要: Quadruped Parkour Learning: Sparsely Gated Mixture of Experts with Visual Input
- arxiv url: http://arxiv.org/abs/2604.19344v1
- Date: Tue, 21 Apr 2026 11:27:13 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-22 22:41:49.739218
- Title: Quadruped Parkour Learning: Sparsely Gated Mixture of Experts with Visual Input
- Title(参考訳): 四足歩行学習 : 視覚入力による知識の相違
- Authors: Michael Ziegltrum, Jianhao Jiao, Tianhu Peng, Chengxu Zhou, Dimitrios Kanoulas,
- Abstract要約: ロボットパークは、高度に挑戦する地形を越えるための魅力的なベンチマークを提供する。
最近のアプローチは、ダイナミッククライミングやジャンプを含む印象的な機能を示しているが、典型的にはシーケンシャルな多層パーセプトロン(MLP)に依存している。
MoEアーキテクチャは、スケーラビリティとパフォーマンスを改善するための効果的なパラダイムとして、わずかにゲートされたミックス・オブ・エキスパート(MoE)アーキテクチャが登場しました。
- 参考スコア(独自算出の注目度): 6.484718006587698
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Robotic parkour provides a compelling benchmark for advancing locomotion over highly challenging terrain, including large discontinuities such as elevated steps. Recent approaches have demonstrated impressive capabilities, including dynamic climbing and jumping, but typically rely on sequential multilayer perceptron (MLP) architectures with densely activated layers. In contrast, sparsely gated mixture-of-experts (MoE) architectures have emerged in the large language model domain as an effective paradigm for improving scalability and performance by activating only a subset of parameters at inference time. In this work, we investigate the application of sparsely gated MoE architectures to vision-based robotic parkour. We compare control policies based on standard MLPs and MoE architectures under a controlled setting where the number of active parameters at inference time is matched. Experimental results on a real Unitree Go2 quadruped robot demonstrate clear performance gains, with the MoE policy achieving double the number of successful trials in traversing large obstacles compared to a standard MLP baseline. We further show that achieving comparable performance with a standard MLP requires scaling its parameter count to match that of the total MoE model, resulting in a 14.3\% increase in computation time. These results highlight that sparsely gated MoE architectures provide a favorable trade-off between performance and computational efficiency, enabling improved scaling of control policies for vision-based robotic parkour. An anonymized link to the codebase is https://osf.io/v2kqj/files/github?view_only=7977dee10c0a44769184498eaba72e44.
- Abstract(参考訳): ロボットパルクールは、高度の階段のような大きな不連続を含む、非常に困難な地形上での移動を促進するための魅力的なベンチマークを提供する。
最近のアプローチでは、ダイナミッククライミングやジャンプなど、印象的な機能を示しているが、一般的には、高密度に活性化された層を持つシーケンシャルな多層パーセプトロン(MLP)アーキテクチャに依存している。
これとは対照的に,大規模な言語モデルドメインでは,パラメータのサブセットのみを推論時に活性化することにより,スケーラビリティとパフォーマンスを向上させるための効果的なパラダイムとして,疎結合のミックス・オブ・エキスパート(MoE)アーキテクチャが出現している。
本研究では,視覚に基づくロボットパールへの疎密なMoEアーキテクチャの適用について検討する。
我々は,標準MPPとMoEアーキテクチャに基づく制御ポリシーを,推定時のアクティブパラメータ数が一致した制御条件下で比較する。
実のUnitree Go2四足歩行ロボットの実験結果から、MoEポリシーは標準のMLPベースラインと比較して大きな障害物をトラバースする試験の回数を2倍にするという明確な性能向上を示した。
さらに、標準MPPと同等の性能を達成するには、MoEモデルに匹敵するパラメータ数をスケールする必要があることを示し、計算時間を14.3倍に増やす結果となった。
これらの結果から,疎ゲート型のMoEアーキテクチャは,性能と計算効率のトレードオフを良好に実現し,視覚に基づくロボットパーキングの制御ポリシのスケールアップを向上できることがわかった。
コードベースへの匿名リンクはhttps://osf.io/v2kqj/files/github?
view_only=7977dee10c0a44769184498eaba72e44。
関連論文リスト
- Collaborative Multi-Mode Pruning for Vision-Language Models [31.988586741092927]
VLM(Vision-Language Models)は、統合トランスフォーマーアーキテクチャの中で急速に進歩しているが、リソース制約のあるデバイスへの展開は依然として困難である。
共同パラメータとトークンプルーニングによってVLMに適した新しいフレームワークであるCollaborative Multi-Mode Pruning (CoMP)を提案する。
提案手法は,最先端手法との比較により,高いプルーニング率下での性能を効果的に向上させる。
論文 参考訳(メタデータ) (2026-04-03T10:44:23Z) - Robometer: Scaling General-Purpose Robotic Reward Models via Trajectory Comparisons [69.87766750714945]
汎用ロボット報酬モデルは通常、専門家によるデモンストレーションから絶対的なタスク進捗を予測するために訓練される。
本稿では、軌道内進行監視と軌道間優先監視を組み合わせたスケーラブルな報酬モデリングフレームワークRobometerを紹介する。
ロビオメーターは、専門家データに報酬等級を固定するフレームレベルのプログレス・ロスと、グローバルな順序制約を課す軌跡比較優先損失という2つの目的で訓練されている。
論文 参考訳(メタデータ) (2026-03-02T17:38:58Z) - UltraCUA: A Foundation Model for Computer Use Agents with Hybrid Action [77.63125913907771]
本稿では,GUIプリミティブと高レベルのプログラムツールコールのギャップを埋める基盤モデルであるUltraCUAを提案する。
7Bおよび32Bモデルによる実験は、最先端のエージェントよりも大幅に改善されている。
論文 参考訳(メタデータ) (2025-10-20T17:48:26Z) - (GG) MoE vs. MLP on Tabular Data [0.0]
GG MoE は,Gumbel-Softmax ゲーティング関数を組み込んだ実験用混合モデルである。
MoEとGG MoEはいずれも,ニューラルネットワークよりもはるかに少ないパラメータを生かしている。
論文 参考訳(メタデータ) (2025-02-05T20:53:16Z) - Can Custom Models Learn In-Context? An Exploration of Hybrid Architecture Performance on In-Context Learning Tasks [2.2665690736508894]
In-Context Learning (ICL) は、パラメータ更新を必要とせずに、プロンプトシーケンスを通じてタスク学習が行われる現象である。
GPT-2 と LLaMa と LlaMa と Mamba のアーキテクチャ的差異の影響について検討した。
そこで本研究では,特定のタスクにおけるモデル全体の性能を示すスカラーメトリックである「ICL回帰スコア」を提案する。
論文 参考訳(メタデータ) (2024-11-06T14:25:05Z) - EPS-MoE: Expert Pipeline Scheduler for Cost-Efficient MoE Inference [49.94169109038806]
本稿では,既存の並列処理方式を超越したMoE用パイプラインスケジューラであるEPS-MoEを紹介する。
その結果,既存の並列推論手法と比較して,プリフィルスループットは52.4%向上した。
論文 参考訳(メタデータ) (2024-10-16T05:17:49Z) - Contextualizing MLP-Mixers Spatiotemporally for Urban Data Forecast at Scale [54.15522908057831]
本稿では,STTD予測を大規模に行うためのコンピュータ・ミクサーの適応版を提案する。
我々の結果は、この単純な効率の良いソリューションが、いくつかのトラフィックベンチマークでテストした場合、SOTAベースラインに匹敵する可能性があることを驚くほど示している。
本研究は, 実世界のSTTD予測において, 簡便な有効モデルの探索に寄与する。
論文 参考訳(メタデータ) (2023-07-04T05:19:19Z) - Parameter-efficient Tuning of Large-scale Multimodal Foundation Model [68.24510810095802]
我々はこれらの課題を克服するために、クロスモーダル転送(Aurora)のための優雅なプロンプトフレームワークを提案する。
既存のアーキテクチャの冗長性を考慮すると、まずモード近似を用いて0.1Mのトレーニング可能なパラメータを生成し、マルチモーダルプロンプトチューニングを実装する。
6つのクロスモーダルベンチマークの徹底的な評価は、最先端のベンチマークを上回るだけでなく、完全な微調整アプローチよりも優れていることを示している。
論文 参考訳(メタデータ) (2023-05-15T06:40:56Z) - Parameterization of Cross-Token Relations with Relative Positional
Encoding for Vision MLP [52.25478388220691]
視覚多層パーセプトロン(MLP)はコンピュータビジョンタスクにおいて有望な性能を示す。
トークンミキシングレイヤを使用して、トランスフォーマーが使用するマルチヘッド自己保持機構とは対照的に、クロストークンインタラクションをキャプチャする。
トークン混合のためのクロストークン関係を効率的に符号化する新しい位置空間ゲーティングユニット(PoSGU)を提案する。
論文 参考訳(メタデータ) (2022-07-15T04:18:06Z) - LiteTransformerSearch: Training-free On-device Search for Efficient
Autoregressive Language Models [34.673688610935876]
モデルトレーニングを必要とせずに、レイテンシとパープレクシリティが最前線に現れることを示す。
我々は,多種多様なデバイス上での軽量トランスフォーマーサーチ (LTS) の評価を行った。
最大2倍のレイテンシでTransformer-XLのパープレキシティを実現することができることを示す。
論文 参考訳(メタデータ) (2022-03-04T02:10:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。