論文の概要: Gauss-Newton accelerated MPPI Control
- arxiv url: http://arxiv.org/abs/2512.04579v3
- Date: Wed, 25 Feb 2026 10:13:25 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-23 08:17:40.124408
- Title: Gauss-Newton accelerated MPPI Control
- Title(参考訳): ガウスニュートン加速MPPI制御
- Authors: Hannes Homburger, Katrin Baumgärtner, Moritz Diehl, Johannes Reuter,
- Abstract要約: モデル予測パス積分(MPPI)制御はサンプリングに基づく最適化手法であり,近年注目されている。
MPPIには、柔軟性、堅牢性、実装の容易さ、固有の並列化性など、いくつかの重要な利点がある。
本稿では,ジャコビアン再構成法と一般化ガウスニュートン法を併用したMPPI法を提案する。
- 参考スコア(独自算出の注目度): 0.9741305928417096
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Model Predictive Path Integral (MPPI) control is a sampling-based optimization method that has recently attracted attention, particularly in the robotics and reinforcement learning communities. MPPI has been widely applied as a GPU-accelerated random search method to deterministic direct single-shooting optimal control problems arising in model predictive control (MPC) formulations. MPPI offers several key advantages, including flexibility, robustness, ease of implementation, and inherent parallelizability. However, its performance can deteriorate in high-dimensional settings since the optimal control problem is solved via Monte Carlo sampling. To address this limitation, this paper proposes an enhanced MPPI method that incorporates a Jacobian reconstruction technique and the second-order Generalized Gauss-Newton method. This novel approach is called \textit{Gauss-Newton accelerated MPPI}. The numerical results show that the Gauss-Newton accelerated MPPI approach substantially improves MPPI scalability and computational efficiency while preserving the key benefits of the classical MPPI framework, making it a promising approach even for high-dimensional problems.
- Abstract(参考訳): モデル予測経路積分(MPPI)制御はサンプリングに基づく最適化手法であり,特にロボティクスや強化学習コミュニティにおいて注目されている。
MPPIは、モデル予測制御(MPC)の定式化に伴う決定論的直接単発最適制御問題に対して、GPU加速ランダム探索法として広く応用されている。
MPPIには、柔軟性、堅牢性、実装の容易さ、固有の並列化性など、いくつかの重要な利点がある。
しかし,モンテカルロサンプリングにより最適制御問題を解くため,高次元設定では性能が低下する可能性がある。
本稿では,ジャコビアン再構成法と2階一般化ガウスニュートン法を組み合わせたMPPI法を提案する。
この新しいアプローチは \textit{Gauss-Newton accelerated MPPI} と呼ばれる。
その結果,ガウスニュートン加速MPPI法は,従来のMPPIフレームワークの重要な利点を保ちながら,MPPIのスケーラビリティと計算効率を大幅に向上し,高次元問題においても有望なアプローチであることがわかった。
関連論文リスト
- Fine-Tuning of Neural Network Approximate MPC without Retraining via Bayesian Optimization [81.35990332700389]
近似モデル予測制御(AMPC)は、MPCの動作をニューラルネットワークで模倣することを目的としている。
デプロイメント中、基盤となるMPCのパラメータは通常、微調整されなければならない。
最近の研究は、MPC最適化問題の近似感度を用いてAMPCを調整することなく適用することでこの問題に対処している。
論文 参考訳(メタデータ) (2025-12-16T12:24:08Z) - Predictive Lagrangian Optimization for Constrained Reinforcement Learning [15.082498910832529]
制約付き最適化は、複雑な制御タスクに対処するための強化学習で一般的に見られる。
本稿では,制約付き最適化とフィードバック制御システムとの接続を構築するための,より汎用的な等価フレームワークを提案する。
論文 参考訳(メタデータ) (2025-01-25T13:39:45Z) - Optimization of Quantum Systems Emulation via a Variant of the Bandwidth Minimization Problem [41.94295877935867]
重み付きBMPは帯域最小化問題(BMP)の変種である
この問題をMILP (Mixed Linear Program) を用いて定式化し, 解法の状態を用いて最適に解く。
数値実験により、重み付きBMP法は逆カットヒル・マッキー法(RCM)よりも優れていることが示された。
論文 参考訳(メタデータ) (2024-04-23T16:04:37Z) - Parameter-Adaptive Approximate MPC: Tuning Neural-Network Controllers without Retraining [50.00291020618743]
この研究は、大規模なデータセットを再計算し、再トレーニングすることなくオンラインチューニングが可能な、新しいパラメータ適応型AMPCアーキテクチャを導入している。
資源制約の厳しいマイクロコントローラ(MCU)を用いた2種類の実カートポールシステムの揺らぎを制御し,パラメータ適応型AMPCの有効性を示す。
これらの貢献は、現実世界のシステムにおけるAMPCの実践的応用に向けた重要な一歩である。
論文 参考訳(メタデータ) (2024-04-08T20:02:19Z) - CoVO-MPC: Theoretical Analysis of Sampling-based MPC and Optimal
Covariance Design [8.943418808959494]
我々は,広く使用されているサンプリングベースモデル予測経路積分制御(MPPI)法の収束特性を特徴付ける。
時間変動LQRシステムをカバーする2次最適化では,MPPIは少なくとも線形収束率を満足することを示す。
我々の理論解析は、サンプリングに基づく新しいMPCアルゴリズム、CoVo-MPCに直結する。
実証的には、CoVo-MPCはシミュレーションと現実世界のクワッドアジャイルコントロールの両方で標準MPPIを43~54%上回っている。
論文 参考訳(メタデータ) (2024-01-14T21:10:59Z) - From Optimization to Control: Quasi Policy Iteration [2.0769172070951067]
準政治反復(QPI)と呼ばれる新しい制御アルゴリズムを提案する。
QPIは、MDP特有の2つの線形構造制約を利用し、遷移確率カーネルの事前情報を組み込むことができる。
論文 参考訳(メタデータ) (2023-11-18T21:00:14Z) - Covert Model Poisoning Against Federated Learning: Algorithm Design and
Optimization [76.51980153902774]
フェデレーテッド・ラーニング(FL)はパラメータ伝達中にFLモデルに対する外部攻撃に対して脆弱である。
本稿では,最先端の防御アグリゲーション機構に対処する有効なMPアルゴリズムを提案する。
実験の結果,提案したCMPアルゴリズムは,既存の攻撃機構よりも効果的で,かなり優れていることが示された。
論文 参考訳(メタデータ) (2021-01-28T03:28:18Z) - Plug-And-Play Learned Gaussian-mixture Approximate Message Passing [71.74028918819046]
そこで本研究では,従来のi.i.d.ソースに適した圧縮圧縮センシング(CS)リカバリアルゴリズムを提案する。
我々のアルゴリズムは、Borgerdingの学習AMP(LAMP)に基づいて構築されるが、アルゴリズムに普遍的な復調関数を採用することにより、それを大幅に改善する。
数値評価により,L-GM-AMPアルゴリズムは事前の知識を必要とせず,最先端の性能を実現する。
論文 参考訳(メタデータ) (2020-11-18T16:40:45Z) - Gaussian Process-based Min-norm Stabilizing Controller for
Control-Affine Systems with Uncertain Input Effects and Dynamics [90.81186513537777]
本稿では,この問題の制御・アフィン特性を捉えた新しい化合物カーネルを提案する。
この結果の最適化問題は凸であることを示し、ガウス過程に基づく制御リャプノフ関数第二次コーンプログラム(GP-CLF-SOCP)と呼ぶ。
論文 参考訳(メタデータ) (2020-11-14T01:27:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。