論文の概要: Real-World Deployment of Massively Parallel Sampling-Based MPC for Contact-Rich Manipulation
- arxiv url: http://arxiv.org/abs/2606.20712v1
- Date: Tue, 16 Jun 2026 12:24:05 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-26 15:51:10.348373
- Title: Real-World Deployment of Massively Parallel Sampling-Based MPC for Contact-Rich Manipulation
- Title(参考訳): コンタクトリッチマニピュレーションのための大規模並列サンプリング型MPCの実世界展開
- Authors: Magnus Dierking, Joao Carvalho, An Thai Le, Georgia Chalvatzaki, Jan Peters,
- Abstract要約: 大規模並列化と効率的な計算に JAX を利用する MPC フレームワークを提案する。
我々は、Franka Research 3上でPush-T操作タスクを実行し、完全な実-実-実-実-実-パイプラインを通してデプロイする。
これらの知見は, コンタクトリッチな操作・接触感度, 厳密な計算予算, 情報伝達領域のランダム化信号のリアルタイム取得の難しさにおいて, サンプリングベースMPCの課題を浮き彫りにした。
- 参考スコア(独自算出の注目度): 21.501604407170273
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Sampling-based Model Predictive Control (SMPC) is a promising strategy for contact-rich robotic manipulation, combining gradient-free optimization with massively parallel GPU simulation. Yet, most prior work relies on simplified dynamics or remains confined to simulation. We present an MPC framework that leverages JAX for large-scale parallelization and efficient computation, coupled with the high-fidelity MuJoCo MJX simulator, and deploy it on a Franka Research 3 executing the Push-T manipulation task through a complete real-to-sim-to-real pipeline. The MTP variant with structured global sampling outperforms unimodal baselines such as CEM, MPPI, and PS across tasks that require mode switching, both in simulation and on hardware. Furthermore, we evaluate online domain randomization within the MPC sample budget, showing that contact-initiation parameters yield interpretable adaptation signals, whereas global physics parameters provide feedback that is too weak for reliable exploitation at typical replanning frequencies. These findings highlight key challenges for sampling-based MPC in contact-rich manipulation-contact sensitivity, tight compute budgets, and the difficulty of obtaining informative domain-randomization signals in real time.
- Abstract(参考訳): サンプリングベースのモデル予測制御(SMPC)は、非勾配最適化と超並列GPUシミュレーションを組み合わせた、コンタクトリッチなロボット操作のための有望な戦略である。
しかし、これまでのほとんどの研究は単純化された力学やシミュレーションに限られていた。
本稿では,JAX を大規模並列化と効率的な計算に利用する MPC フレームワークと高忠実度 MuJoCo MJX シミュレータを併用し,Push-T 操作タスクを実行するFranka Research 3 上に,完全な実-sim-to-real パイプラインを通じてデプロイする。
構造化されたグローバルサンプリングを備えたMPPは、シミュレーションとハードウェアの両方でモード切替を必要とするタスクにわたって、CEM、MPPI、PSのような単調なベースラインを上回ります。
さらに、MPCサンプル予算内でのオンライン領域ランダム化を評価し、接触開始パラメータが解釈可能な適応信号を生成するのに対し、グローバル物理パラメータは典型的な再計画周波数での信頼性の高い利用には弱すぎるフィードバックを提供する。
これらの知見は, コンタクトリッチな操作・接触感度, 厳密な計算予算, 情報伝達領域のランダム化信号のリアルタイム取得の難しさにおいて, サンプリングベースMPCの課題を浮き彫りにした。
関連論文リスト
- Fine-Tuning of Neural Network Approximate MPC without Retraining via Bayesian Optimization [81.35990332700389]
近似モデル予測制御(AMPC)は、MPCの動作をニューラルネットワークで模倣することを目的としている。
デプロイメント中、基盤となるMPCのパラメータは通常、微調整されなければならない。
最近の研究は、MPC最適化問題の近似感度を用いてAMPCを調整することなく適用することでこの問題に対処している。
論文 参考訳(メタデータ) (2025-12-16T12:24:08Z) - Simulating Environments with Reasoning Models for Agent Training [55.98861707136674]
トレーニング用の起動環境の構築は重く、脆く、進捗を制限します。
我々はSimia-SFTとSimia-RLの2つのフレームワークを提案する。
Simia-SFTとSimia-RLは、環境工学を使わずにスケーラブルなエージェントトレーニングを可能にする。
論文 参考訳(メタデータ) (2025-11-03T18:29:57Z) - Feedback-MPPI: Fast Sampling-Based MPC via Rollout Differentiation -- Adios low-level controllers [0.9674641730446749]
モデル予測経路積分制御は、複雑なロボット作業に適したサンプリングベースの強力なアプローチである。
本稿では,勾配型MPCの感度から得られる頑健なフィードバックゲインを紹介する。
2つのロボットプラットフォームにおける実環境実験によるシミュレーションにおけるF-MPPIの有効性を実証する。
論文 参考訳(メタデータ) (2025-06-17T07:47:33Z) - G-Sim: Generative Simulations with Large Language Models and Gradient-Free Calibration [48.948187359727996]
G-Simは、厳密な経験的校正によるシミュレータ構築を自動化するハイブリッドフレームワークである。
信頼性のある因果的インフォームドシミュレータを生成し、データ効率を軽減し、堅牢なシステムレベルの介入を可能にする。
論文 参考訳(メタデータ) (2025-06-10T22:14:34Z) - An Real-Sim-Real (RSR) Loop Framework for Generalizable Robotic Policy Transfer with Differentiable Simulation [13.15220962477623]
本稿では,シミュレーションと実環境のギャップを解消する新しいリアルタイムループフレームワークを提案する。
我々の研究の重要な貢献は、多様で代表的な実世界のデータの収集を促進する情報的コスト関数の設計である。
我々のアプローチは多機能なMJXプラットフォーム上で実装されており、我々のフレームワークは幅広いロボットシステムと互換性がある。
論文 参考訳(メタデータ) (2025-03-13T07:27:05Z) - Resilient Control of Networked Microgrids using Vertical Federated
Reinforcement Learning: Designs and Real-Time Test-Bed Validations [5.394255369988441]
本稿では、(a)モデル複雑度、(b)ISRデバイスの未知の動的挙動、(b)マルチパーティ所有のネットワークグリッドにおけるデータ共有に関するプライバシー問題、(2)シミュレーションからハードウェア・イン・ザ・ループテストベッドへの学習制御の移行について、新しいフェデレーション強化学習(Fed-RL)アプローチを提案する。
実験により,シミュレータ学習したRLコントローラは実時間テストベッドのセットアップによる説得力のある結果が得られ,sim-to-realギャップの最小化が検証された。
論文 参考訳(メタデータ) (2023-11-21T00:59:27Z) - Maximize to Explore: One Objective Function Fusing Estimation, Planning,
and Exploration [87.53543137162488]
我々はtextttMEX というオンライン強化学習(オンラインRL)フレームワークを提案する。
textttMEXは、自動的に探索エクスプロイトのバランスをとりながら、見積もりと計画コンポーネントを統合する。
様々な MuJoCo 環境では,ベースラインを安定的なマージンで上回り,十分な報酬を得られる。
論文 参考訳(メタデータ) (2023-05-29T17:25:26Z) - Reinforcement Learning for Adaptive Mesh Refinement [63.7867809197671]
マルコフ決定過程としてのAMRの新規な定式化を提案し,シミュレーションから直接改良政策を訓練するために深部強化学習を適用した。
これらのポリシーアーキテクチャのモデルサイズはメッシュサイズに依存しないため、任意に大きく複雑なシミュレーションにスケールします。
論文 参考訳(メタデータ) (2021-03-01T22:55:48Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。