論文の概要: TurboMPC: Fast, Scalable, and Differentiable Model Predictive Control on the GPU
- arxiv url: http://arxiv.org/abs/2606.24039v1
- Date: Tue, 23 Jun 2026 00:42:33 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-24 22:16:48.717484
- Title: TurboMPC: Fast, Scalable, and Differentiable Model Predictive Control on the GPU
- Title(参考訳): TurboMPC: GPUの高速、スケーラブル、および微分可能なモデル予測制御
- Authors: Gabriel Bravo-Palacios, Jianghan Zhang, Zachary Pestrikov, Brian Plancher, Thomas Lew,
- Abstract要約: TurboMPCは、GPUで完全に動作する差別化可能なMPCソルバである。
TurboMPCは、状態と制御の制約、暗黙的、クロスタイムの結合コスト、スラック変数をサポートする。
我々は、制約付き計画、ヒューマノイド模倣学習、ニューラルネットワークコスト関数タスクによる強化学習についてTurboMPCを検証する。
- 参考スコア(独自算出の注目度): 7.225671751980973
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Robotics increasingly relies on GPUs for parallel simulation, large-scale learning, and neural-network inference. For model predictive control (MPC) to scale with this paradigm, solvers must run efficiently on this hardware while remaining fast, differentiable, and compatible with expressive MPC formulations used in robotics. We present TurboMPC, a differentiable MPC solver that runs entirely on the GPU and supports state and control inequality constraints, implicit integrators, cross-time-coupled costs, and slack variables. TurboMPC combines sequential quadratic programming (SQP), an alternating direction method of multipliers (ADMM) inner solver, implicit differentiation, and a co-designed JAX-CUDA implementation for efficiency and ease of use. In simulation, we validate TurboMPC on constrained planning, humanoid imitation learning, and reinforcement learning with neural-network cost function tasks, achieving up to $15\times$ and $58\times$ speedups over state-of-the-art CPU and GPU differentiable solvers, respectively. We deploy TurboMPC on a full-scale car for minimum-time racing and find that batched, GPU-accelerated tuning of MPC parameters via Bayesian optimization yields significantly faster driving than a hand-tuned baseline. TurboMPC also scales to planning horizons of over $8000$ knot points while maintaining control of the vehicle. We open-source TurboMPC at: https://github.com/ToyotaResearchInstitute/turbompc
- Abstract(参考訳): ロボットはますます、並列シミュレーション、大規模学習、ニューラルネットワーク推論にGPUに依存している。
モデル予測制御(MPC)がこのパラダイムでスケールするためには、解法は高速で微分可能であり、ロボット工学で使われる表現力のあるMPCの定式化と互換性を持ちながら、このハードウェア上で効率的に動作する必要がある。
我々は、GPU上で完全に動作し、状態と制御の不等式制約、暗黙積分器、クロスタイム結合コスト、スラック変数をサポートする差別化可能なMPC解決器であるTurboMPCを提案する。
TurboMPCは、シーケンシャル2次プログラミング(SQP)、乗算器内解法(ADMM)の交互方向法、暗黙差分法、および効率と使いやすさのための共設計のJAX-CUDA実装を組み合わせた。
シミュレーションでは,制約付き計画,ヒューマノイド模倣学習,ニューラルネットワークコスト関数タスクによる強化学習のTurboMPCを検証する。
我々はTurboMPCをミニマルタイムレース用のフルスケールカーにデプロイし、ベイジアン最適化によるMPCパラメータのバッチ化されたGPUアクセラレーションにより、手動のベースラインよりもかなり高速な運転が得られることを発見した。
ターボMPCはまた、車両の制御を維持しながら8000ドル以上のノットポイントの地平線を計画している。
https://github.com/ToyotaResearchInstitute/turbompc.comでTurboMPCをオープンソース化しました。
関連論文リスト
- UniLab: A Heterogeneous Architecture for Robot RL Beyond GPU-Dominant Paradigms [68.40808444348735]
シミュレーション支配型ロボット制御では、どのプロセッサが物理を実行するかではなく、シミュレーションスループット、ポリシー学習、実行時同期が効率的なエンドツーエンドループを形成するかどうかが重要な問題である。
データ移動、バッファリング、同期のための統一ランタイムを通じて、GPUポリシー更新からCPU並列シミュレーションを分離する、異種CPU常駐/GPU学習アーキテクチャであるUniLabを提案する。
論文 参考訳(メタデータ) (2026-05-28T17:53:50Z) - Real-Time, Energy-Efficient, Sampling-Based Optimal Control via FPGA Acceleration [8.086534156824486]
FPGAに最適化されたMPPI設計は、微細な並列性を露呈し、同期ボトルネックをなくす。
これにより、組み込みGPUとCPUの最適化実装よりも平均3.1倍から7.5倍のスピードアップを実現し、同時にエネルギー使用量の2.5倍から5.4倍の削減を実現した。
論文 参考訳(メタデータ) (2026-01-23T23:47:09Z) - Differentiable Model Predictive Control on the GPU [2.9273915933729047]
微分モデル予測制御(MPC)は、学習と制御を組み合わせた強力なフレームワークを提供する。
本稿では,GPUを高速化したMPC用微分可能最適化ツールを導入することで,このボトルネックに対処する。
我々は、CPUとGPUベースのベースラインよりも大幅にスピードアップし、最先端のトレーニング時間を大幅に改善した。
論文 参考訳(メタデータ) (2025-10-07T17:42:17Z) - Energy-efficient Task Adaptation for NLP Edge Inference Leveraging
Heterogeneous Memory Architectures [68.91874045918112]
Adapter-ALBERTは、様々なタスクにわたる最大データ再利用のための効率的なモデル最適化である。
検証されたNLPエッジアクセラレータ上でシミュレーションを行うことにより、モデルを不均一なオンチップメモリアーキテクチャにマッピングする利点を実証する。
論文 参考訳(メタデータ) (2023-03-25T14:40:59Z) - A Length Adaptive Algorithm-Hardware Co-design of Transformer on FPGA
Through Sparse Attention and Dynamic Pipelining [28.336502115532905]
本稿ではトランスフォーマーアクセラレーションのためのコヒーレントシーケンス長適応型アルゴリズム-ハードウェア共設計を提案する。
ハードウェアフレンドリーなスパースアテンション演算子と長編ハードウェアリソーススケジューリングアルゴリズムを開発した。
我々の設計は、非常に小さな精度の損失があり、CPUやGPUの実装と比較して80.2$times$と2.6$times$ Speedupがある。
論文 参考訳(メタデータ) (2022-08-07T05:48:38Z) - Batch-efficient EigenDecomposition for Small and Medium Matrices [65.67315418971688]
EigenDecomposition (ED)は多くのコンピュータビジョンアルゴリズムとアプリケーションの中心にある。
本稿では,コンピュータビジョンの応用シナリオに特化したQRベースのED手法を提案する。
論文 参考訳(メタデータ) (2022-07-09T09:14:12Z) - Spatiotemporal Costmap Inference for MPC via Deep Inverse Reinforcement
Learning [27.243603228431564]
目標条件付き時間報酬関数を学習するIRLRLアルゴリズムを提案する。
結果として生じるコストマップは、Model Predictive Controllers (MPC) によってタスクの実行に使用される。
論文 参考訳(メタデータ) (2022-01-17T17:36:29Z) - Lettuce: PyTorch-based Lattice Boltzmann Framework [0.0]
格子ボルツマン法 (LBM) は計算流体力学などにおける効率的なシミュレーション手法である。
本稿では,PyTorch ベースの LBM コードである Lettuce について紹介する。
論文 参考訳(メタデータ) (2021-06-24T11:44:21Z) - Edge Federated Learning Via Unit-Modulus Over-The-Air Computation
(Extended Version) [64.76619508293966]
本稿では,効率の良いエッジフェデレーション学習を実現するために,UM-AirCompフレームワークを提案する。
ローカルモデルパラメータを同時にアップロードし、アナログビームフォーミングを通じてグローバルモデルパラメータを更新する。
車両間自動運転シミュレーションプラットフォームにおけるUM-AirCompの実装を実演する。
論文 参考訳(メタデータ) (2021-01-28T15:10:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。