論文の概要: Manifold-Constrained MPPI: Real-Time Sampling-Based Control Under Hard Constraints
- arxiv url: http://arxiv.org/abs/2605.24813v1
- Date: Sun, 24 May 2026 01:57:18 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-26 19:50:18.460965
- Title: Manifold-Constrained MPPI: Real-Time Sampling-Based Control Under Hard Constraints
- Title(参考訳): マニフォールド制約MPPI:ハード制約下でのリアルタイムサンプリングベース制御
- Authors: Seulchan Lee, Sanghyun Kim,
- Abstract要約: Manifold-Constrained MPPI (MC-MPPI) はリアルタイムサンプリングベースの制御フレームワークである。
MPPIの計算上の利点を保ちながら、多様体ベースの等式制約を強制する。
シミュレーションと実世界の両方の環境で14-DoFクローズドチェーンのデュアルアームシステムの実験は、MC-MPPIが安定して100Hzで動作することを示した。
- 参考スコア(独自算出の注目度): 8.747309323431802
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Sampling-based model predictive control methods, such as Model Predictive Path Integral (MPPI), offer derivative-free optimization and robustness in complex robotic systems. However, standard MPPI relies on cost-based soft penalties that cannot guarantee hard-constraint satisfaction, severely limiting its applicability to highly constrained tasks such as closed-chain manipulation. To address this, we propose Manifold-Constrained MPPI (MC-MPPI), a real-time sampling-based control framework that enforces manifold-based equality constraints while preserving the computational advantages of MPPI. The key idea is to decouple the constrained optimal control problem into latent-space planning and execution-level correction. At the planning stage, a Variational Autoencoder (VAE) learns a low-dimensional latent representation of the constraint manifold, enabling MPPI to efficiently generate near-feasible candidate trajectories without per-sample modification. Since this reference enables accurate linearization of the equality constraints, an execution-level Quadratic Programming (QP) controller resolves the residual manifold mismatch in a single solve rather than through iterative projection. Experiments on a 14-DoF closed-chain dual-arm system in both simulation and real-world settings demonstrate that MC-MPPI operates stably at 100 Hz, reliably navigates dynamic environments while effectively maintaining hard equality constraints, and significantly outperforms baseline methods in tracking accuracy. Supplementary videos and implementation details are available at https://rcilab.github.io/mcmppi.
- Abstract(参考訳): モデル予測パス積分(MPPI)のようなサンプリングに基づくモデル予測制御手法は、複雑なロボットシステムにおいて微分自由最適化とロバスト性を提供する。
しかし、標準的なMPPIは、ハードコントラストの満足度を保証できないコストベースのソフトペナルティに依存しており、クローズドチェーン操作のような高度に制約されたタスクに適用性を大幅に制限している。
そこで我々は,MPPIの計算的優位性を維持しつつ,多様体に基づく等式制約を強制するリアルタイムサンプリングベース制御フレームワークであるManifold-Constrained MPPI (MC-MPPI)を提案する。
鍵となる考え方は、制約された最適制御問題を遅延空間計画と実行レベルの修正に分離することである。
計画段階では、可変オートエンコーダ(VAE)が制約多様体の低次元潜在表現を学習し、MPPIがサンプルごとの修正なしにほぼ可能な候補軌道を効率的に生成することができる。
この基準は等式制約の正確な線形化を可能にするため、実行レベル準計画法(英語版)(QP)コントローラは反復射影よりも単一の解における残留多様体のミスマッチを解く。
シミュレーションと実世界の両方の環境で14-DoFクローズドチェーンのデュアルアームシステムの実験は、MC-MPPIが安定して100Hzで動作し、動的環境を確実にナビゲートし、ハードイコリティの制約を効果的に維持し、精度のトラッキングにおいてベースライン法を著しく上回ることを示した。
追加のビデオと実装の詳細はhttps://rcilab.github.io/mcmppi.comで公開されている。
関連論文リスト
- Multi-scale Coarse-to-fine Modeling for Test-time Human Motion Control [51.92884966472683]
MSCoTは、テストタイムの人間のモーション合成と制御のための、マルチスケールで粗い粒度モデルである。
MSCoTは動きを多スケールの階層表現に識別し、各時間スケールでトークンシーケンス全体を予測する。
論文 参考訳(メタデータ) (2026-05-14T15:09:49Z) - COSMIK-MPPI: Scaling Constrained Model Predictive Control to Collision Avoidance in Close-Proximity Dynamic Human Environments [4.711880574101941]
モデル予測制御(MPC)は、制約を扱う能力のおかげで、適切なフレームワークとして登場した。
GB-MPCソルバは複雑な環境下での衝突回避性能に限界があることを示した。
本稿では,MPPIと人間の動き推定ツールボックスを組み合わせた衝突回避フレームワークCOSMIK-MPPIを提案する。
論文 参考訳(メタデータ) (2026-04-11T22:04:22Z) - Unsupervised Conformal Inference: Bootstrapping and Alignment to Control LLM Uncertainty [49.19257648205146]
生成のための教師なし共形推論フレームワークを提案する。
我々のゲートは、分断されたUPPよりも厳密で安定した閾値を提供する。
その結果は、ラベルのない、API互換の、テスト時間フィルタリングのゲートになる。
論文 参考訳(メタデータ) (2025-09-26T23:40:47Z) - Safe Beyond the Horizon: Efficient Sampling-based MPC with Neural Control Barrier Functions [23.693610702522236]
モデル予測制御(MPC)を実際に使用する場合の一般的な問題は、予測地平線を超えた安全仕様の満足度である。
本稿では、推定最適制御のばらつきを大幅に低減し、サンプル効率を向上し、CPU上でのリアルタイム計画を可能にする新しいサンプリング戦略を提案する。
論文 参考訳(メタデータ) (2025-02-20T19:59:11Z) - Progressive Mixed-Precision Decoding for Efficient LLM Inference [49.05448842542558]
我々は,デコーディングのメモリバウンドネスに対処するために,プログレッシブ・ミックス・プレシジョン・デコーディング(PMPD)を導入する。
PMPDはfp16モデルの行列ベクトル乗算において1.4$-$12.2$times$ Speedupを達成する。
我々の手法は、fp16モデルよりも3.8$-$8.0$times$、均一量子化アプローチよりも1.54$times$のスループット向上をもたらす。
論文 参考訳(メタデータ) (2024-10-17T11:46:33Z) - Learning Sampling Distributions for Model Predictive Control [36.82905770866734]
モデル予測制御(MPC)に対するサンプリングに基づくアプローチは、MPCに対する現代のアプローチの基盤となっている。
我々は、学習された分布を最大限に活用できるように、潜在空間における全ての操作を実行することを提案する。
具体的には、学習問題を双方向の最適化として捉え、バックプロパゲーションスルータイムでコントローラをトレーニングする方法を示す。
論文 参考訳(メタデータ) (2022-12-05T20:35:36Z) - Modular Deep Reinforcement Learning for Continuous Motion Planning with
Temporal Logic [59.94347858883343]
本稿では,マルコフ決定過程(MDP)をモデルとした自律動的システムの運動計画について検討する。
LDGBA と MDP の間に組込み製品 MDP (EP-MDP) を設計することである。
モデルフリー強化学習(RL)のためのLDGBAベースの報酬形成と割引スキームは、EP-MDP状態にのみ依存する。
論文 参考訳(メタデータ) (2021-02-24T01:11:25Z) - Gaussian Process-based Min-norm Stabilizing Controller for
Control-Affine Systems with Uncertain Input Effects and Dynamics [90.81186513537777]
本稿では,この問題の制御・アフィン特性を捉えた新しい化合物カーネルを提案する。
この結果の最適化問題は凸であることを示し、ガウス過程に基づく制御リャプノフ関数第二次コーンプログラム(GP-CLF-SOCP)と呼ぶ。
論文 参考訳(メタデータ) (2020-11-14T01:27:32Z) - Stochastic Finite State Control of POMDPs with LTL Specifications [14.163899014007647]
部分的に観測可能なマルコフ決定プロセス(POMDP)は、不確実性の下での自律的な意思決定のためのモデリングフレームワークを提供する。
本稿では,POMDPに対する準最適有限状態制御器(sFSC)の合成に関する定量的問題について考察する。
本稿では,sFSC サイズが制御される有界ポリシアルゴリズムと,連続的な繰り返しにより制御器の性能が向上する任意の時間アルゴリズムを提案する。
論文 参考訳(メタデータ) (2020-01-21T18:10:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。