Fugu-MT 論文翻訳(概要): Robust and Efficient MuJoCo-based Model Predictive Control via Web of Affine Spaces Derivatives

論文の概要: Robust and Efficient MuJoCo-based Model Predictive Control via Web of Affine Spaces Derivatives

arxiv url: http://arxiv.org/abs/2512.21109v1
Date: Wed, 24 Dec 2025 11:13:41 GMT
ステータス: 翻訳完了
システム内更新日: 2026-03-23 08:17:40.50366
Title: Robust and Efficient MuJoCo-based Model Predictive Control via Web of Affine Spaces Derivatives
Title（参考訳）: アフィン空間のWebによるロバストかつ効率的なMuJoCoモデル予測制御
Authors: Chen Liang, Daniel Rakita,
Abstract要約: 有限差分法(FD)のドロップイン置換として,MuJoCo MPC内のアフィン空間(WASP)誘導体を導入する。 WASPは、精度の高い微分近似のシーケンスを効率的に計算するための、最近開発されたアプローチである。我々は,複数のロボットを対象とする多種多様なMJPCタスクを対象としたWASPの評価を行った。
参考スコア（独自算出の注目度）: 10.608505074454289
License: http://creativecommons.org/licenses/by/4.0/
Abstract: MuJoCo is a powerful and efficient physics simulator widely used in robotics. One common way it is applied in practice is through Model Predictive Control (MPC), which uses repeated rollouts of the simulator to optimize future actions and generate responsive control policies in real time. To make this process more accessible, the open source library MuJoCo MPC (MJPC) provides ready-to-use MPC algorithms and implementations built directly on top of the MuJoCo simulator. However, MJPC relies on finite differencing (FD) to compute derivatives through the underlying MuJoCo simulator, which is often a key bottleneck that can make it prohibitively costly for time-sensitive tasks, especially in high-DOF systems or complex scenes. In this paper, we introduce the use of Web of Affine Spaces (WASP) derivatives within MJPC as a drop-in replacement for FD. WASP is a recently developed approach for efficiently computing sequences of accurate derivative approximations. By reusing information from prior, related derivative calculations, WASP accelerates and stabilizes the computation of new derivatives, making it especially well suited for MPC's iterative, fine-grained updates over time. We evaluate WASP across a diverse suite of MJPC tasks spanning multiple robot embodiments. Our results suggest that WASP derivatives are particularly effective in MJPC: it integrates seamlessly across tasks, delivers consistently robust performance, and achieves up to a 2$\mathsf{x}$ speedup compared to an FD backend when used with derivative-based planners, such as iLQG. In addition, WASP-based MPC outperforms MJPC's stochastic sampling-based planners on our evaluation tasks, offering both greater efficiency and reliability. To support adoption and future research, we release an open-source implementation of MJPC with WASP derivatives fully integrated.
Abstract（参考訳）: MuJoCoは、ロボット工学で広く使われている強力で効率的な物理シミュレータである。モデル予測制御(MPC)は、シミュレータの繰り返しロールアウトを使用して将来の動作を最適化し、応答性のある制御ポリシーをリアルタイムで生成する。このプロセスをよりアクセスしやすいものにするために、オープンソースのライブラリ MuJoCo MPC (MJPC) は MuJoCoシミュレータの上に直接構築されたMPCアルゴリズムと実装を提供する。しかし、MJPCは有限差分(FD)を基礎となる MuJoCo シミュレータによる微分の計算に頼っているため、特に高DOF システムや複雑なシーンにおいて、時間に敏感なタスクには不当にコストがかかる。本稿では,Web of Affine Spaces (WASP) 誘導体をFDのドロップイン代替としてMJPC内に導入する。 WASPは、精度の高い微分近似のシーケンスを効率的に計算するための、最近開発されたアプローチである。 WASPは、関連するデリバティブ計算からの情報を再利用することによって、新しいデリバティブの計算を加速し、安定化し、特にMPCの反復的できめ細かな更新に適している。我々は,複数のロボットを対象とする多種多様なMJPCタスクを対象としたWASPの評価を行った。タスク間をシームレスに統合し、一貫した堅牢なパフォーマンスを提供し、iLQGのようなデリバティブベースのプランナーで使用する場合、FDバックエンドと比較して最大2$\mathsf{x}$スピードアップを達成する。さらに、WASPベースのMPCは、我々の評価タスクにおいて、MJPCの確率的サンプリングベースのプランナーよりも優れ、効率と信頼性の両方を提供する。採用と今後の研究を支援するため、WASP誘導体を完全統合したMJPCのオープンソース実装をリリースする。

関連論文リスト

Unbiased Dynamic Pruning for Efficient Group-Based Policy Optimization [60.87651283510059]
Group Relative Policy Optimization (GRPO) はLLM推論を効果的にスケールするが、計算コストは禁じている。本研究では,非バイアス勾配推定を保ちながら動的プルーニングを可能にする動的プルーニングポリシー最適化(DPPO)を提案する。刈り込みによって引き起こされるデータの空間性を軽減するため,ウィンドウベースの欲求戦略であるDense Prompt Packingを導入する。
論文参考訳（メタデータ） (2026-03-04T14:48:53Z)
Intra-DP: A High Performance Collaborative Inference System for Mobile Edge Computing [67.98609858326951]
Intra-DPはモバイルデバイス上でのディープニューラルネットワーク(DNN)に最適化された高性能な協調推論システムである。推論毎のレイテンシを最大50%削減し、最先端のベースラインと比較してエネルギー消費量を最大75%削減する。評価の結果,DP内の遅延は,最先端のベースラインと比較して最大50%,エネルギー消費は最大75%減少することがわかった。
論文参考訳（メタデータ） (2025-07-08T09:50:57Z)
MPCritic: A plug-and-play MPC architecture for reinforcement learning [2.217971863441725]
本稿では,MPCriticについて述べる。MPCriticは機械学習に優しいアーキテクチャで,MPCツールとシームレスに連携する。 MPCriticは、パラメータ化されたMPC問題によって定義された損失状況を利用して、バッチトレーニングステップに対する"ソフト"最適化に重点を置いている。
論文参考訳（メタデータ） (2025-04-01T18:07:07Z)
PLM: Efficient Peripheral Language Models Hardware-Co-Designed for Ubiquitous Computing [48.30406812516552]
我々は、モデルアーキテクチャとエッジシステムの制約を協調的に最適化する共同設計プロセスを通じて開発された、周辺言語モデルであるPLMを紹介する。 PLMはMulti-head Latent Attentionメカニズムを採用し、正方形ReLUアクティベーション機能を採用してスパーシティを促進し、ピークメモリフットプリントを減少させる。評価の結果, PLMは, 公開されているデータに基づいて訓練された既存の小言語モデルよりも優れていた。
論文参考訳（メタデータ） (2025-03-15T15:11:17Z)
Parameter-Adaptive Approximate MPC: Tuning Neural-Network Controllers without Retraining [50.00291020618743]
この研究は、大規模なデータセットを再計算し、再トレーニングすることなくオンラインチューニングが可能な、新しいパラメータ適応型AMPCアーキテクチャを導入している。資源制約の厳しいマイクロコントローラ(MCU)を用いた2種類の実カートポールシステムの揺らぎを制御し,パラメータ適応型AMPCの有効性を示す。これらの貢献は、現実世界のシステムにおけるAMPCの実践的応用に向けた重要な一歩である。
論文参考訳（メタデータ） (2024-04-08T20:02:19Z)
On Building Myopic MPC Policies using Supervised Learning [0.0]
本稿では,教師付き学習を用いて最適値関数をオフラインで学習する代替戦略について考察する。これは、非常に短い予測地平線を持つミオピックMPCのコスト・ツー・ゴー関数として使用できる。
論文参考訳（メタデータ） (2024-01-23T08:08:09Z)
Introducing a Deep Neural Network-based Model Predictive Control Framework for Rapid Controller Implementation [41.38091115195305]
本研究は、HCCI燃焼制御のためのディープニューラルネットワーク(DNN)に基づく非線形MPCの実験的実装を示す。 ARM Cortex A72上のMPCのリアルタイム実装を可能にするために、Acadosソフトウェアパッケージを使用することで、最適化計算は1.4ms以内で完了する。現像した制御器のIMEP軌道は, プロセス制約の観測に加えて, 根平均2乗誤差0.133バールで良好であった。
論文参考訳（メタデータ） (2023-10-12T15:03:50Z)
MPC-Pipe: an Efficient Pipeline Scheme for Secure Multi-party Machine Learning Inference [5.7203077366666015]
重なり合う計算と通信の手順を慎重に整理することは可能であることを示す。 MPC-Pipeは機械学習ワークロードのトレーニングと推論の両方に効率的なMPCシステムである。
論文参考訳（メタデータ） (2022-09-27T19:16:26Z)
An Adaptive Device-Edge Co-Inference Framework Based on Soft Actor-Critic [72.35307086274912]
高次元パラメータモデルと大規模数学的計算は、特にIoT(Internet of Things)デバイスにおける実行効率を制限する。本稿では,ソフトポリシーの繰り返しによるエフェキシット点,エフェキシット点,エンフェキシット点を生成する離散的(SAC-d)のための新しい深層強化学習(DRL)-ソフトアクタ批判法を提案する。レイテンシと精度を意識した報酬設計に基づいて、そのような計算は動的無線チャンネルや任意の処理のような複雑な環境によく適応でき、5G URLをサポートすることができる。
論文参考訳（メタデータ） (2022-01-09T09:31:50Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。