論文の概要: Algorithmic design and implementation considerations of deep MPC
- arxiv url: http://arxiv.org/abs/2511.17233v1
- Date: Fri, 21 Nov 2025 13:21:20 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-24 18:08:19.039414
- Title: Algorithmic design and implementation considerations of deep MPC
- Title(参考訳): 深部MPCのアルゴリズム設計と実装
- Authors: Prabhat K. Mishra, Mateus V. Gasparino, Girish Chowdhary,
- Abstract要約: この原稿は、Deep MPCの実装上の課題を説明し、制御権限の分散における不適切な選択は、パフォーマンスの低下につながるかもしれないと論じている。
4輪スキッドステア動力学の数値実験により, 性能低下の理由が説明できる。
- 参考スコア(独自算出の注目度): 8.23660331371415
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Deep Model Predictive Control (Deep MPC) is an evolving field that integrates model predictive control and deep learning. This manuscript is focused on a particular approach, which employs deep neural network in the loop with MPC. This class of approaches distributes control authority between a neural network and an MPC controller, in such a way that the neural network learns the model uncertainties while the MPC handles constraints. The approach is appealing because training data collected while the system is in operation can be used to fine-tune the neural network, and MPC prevents unsafe behavior during those learning transients. This manuscript explains implementation challenges of Deep MPC, algorithmic way to distribute control authority and argues that a poor choice in distributing control authority may lead to poor performance. A reason of poor performance is explained through a numerical experiment on a four-wheeled skid-steer dynamics.
- Abstract(参考訳): Deep Model Predictive Control (Deep MPC)は、モデル予測制御とディープラーニングを統合した進化型フィールドである。
この原稿は、MPCのループにディープニューラルネットワークを使用する、特定のアプローチに焦点を当てている。
このタイプのアプローチは、ニューラルネットワークとMPCコントローラの間で制御権限を分散し、MPCが制約を処理する間、ニューラルネットワークがモデルの不確実性を学ぶようにする。
このアプローチは、システムが動作中に収集されたトレーニングデータをニューラルネットワークの微調整に使用することができ、MPCは学習の過渡期における安全でない行動を防ぐため、魅力的である。
この原稿は、制御権限を分散するアルゴリズム的な方法であるDeep MPCの実装上の課題を説明し、制御権限を分散する際の貧弱な選択が性能の低下につながると主張している。
4輪スキッドステア動力学の数値実験により, 性能低下の理由が説明できる。
関連論文リスト
- A Novel Deep Reinforcement Learning Method for Computation Offloading in Multi-User Mobile Edge Computing with Decentralization [6.091253785653884]
モバイルエッジコンピューティング(MEC)は、計算能力に制限のある計算集約的なタスクの可能性がある近隣のMECサーバに、アプライアンスによってワークロードをオフロードすることを可能にする。
本稿では,MECシステムにおいて深部強化学習(DRL)アルゴリズムを用いて,分散化された動的計算オフロード戦略を提案する。
そこで我々は,Twin Delayed DDPGアルゴリズムに基づくこの問題に対する新しいアプローチを提案し,この傾向を克服し,モバイルユーザがポータブルであるケースを調査する。
論文 参考訳(メタデータ) (2025-06-03T05:22:02Z) - Diffusion Predictive Control with Constraints [51.91057765703533]
拡散予測制御(Diffusion predictive control with constraints,DPCC)は、拡散に基づく制御のアルゴリズムである。
DPCCは,新しいテスト時間制約を満たすために,既存の手法よりも優れた性能を示すロボットマニピュレータのシミュレーションを通して示す。
論文 参考訳(メタデータ) (2024-12-12T15:10:22Z) - Reservoir computing for system identification and predictive control with limited data [3.1484174280822845]
我々は、ベンチマーク制御システムの力学を学習し、モデル予測制御(MPC)の代理モデルとして機能するRNN変種の評価を行う。
エコー状態ネットワーク(ESN)は、計算複雑性の低減、より有効な予測時間、MPC目的関数のコスト削減など、競合するアーキテクチャよりも様々な利点がある。
論文 参考訳(メタデータ) (2024-10-23T21:59:07Z) - Dropout MPC: An Ensemble Neural MPC Approach for Systems with Learned Dynamics [0.0]
そこで本研究では,モンテカルロのドロップアウト手法を学習システムモデルに応用した,サンプリングベースアンサンブルニューラルMPCアルゴリズムを提案する。
この手法は一般に複雑な力学を持つ不確実なシステムを対象としており、第一原理から派生したモデルは推論が難しい。
論文 参考訳(メタデータ) (2024-06-04T17:15:25Z) - A minimax optimal control approach for robust neural ODEs [44.99833362998488]
我々は、頑健な制御の観点から、ニューラルなODEの敵対的訓練に対処する。
我々はポントリャーギンの最大原理の形で一階最適条件を導出する。
論文 参考訳(メタデータ) (2023-10-26T17:07:43Z) - Unmatched uncertainty mitigation through neural network supported model
predictive control [7.036452261968766]
学習ベースMPC(LBMPC)の基本最適化問題において,深層ニューラルネットワーク(DNN)をオラクルとして利用する。
我々は、ニューラルネットワークの最後のレイヤの重みをリアルタイムで更新するデュアル・タイムスケール適応機構を採用している。
その結果,提案手法はリアルタイムに実装可能であり,LBMPCの理論的保証を担っていることがわかった。
論文 参考訳(メタデータ) (2023-04-22T04:49:48Z) - Learning High-Level Policies for Model Predictive Control [54.00297896763184]
Model Predictive Control (MPC)は、ロボット制御タスクに対する堅牢なソリューションを提供する。
ニューラルネットワークの高レベルポリシーを学習するための自己教師付き学習アルゴリズムを提案する。
提案手法は, 標準的なMPCでは困難な状況に対処できることを示す。
論文 参考訳(メタデータ) (2020-07-20T17:12:34Z) - Online Reinforcement Learning Control by Direct Heuristic Dynamic
Programming: from Time-Driven to Event-Driven [80.94390916562179]
時間駆動学習は、新しいデータが到着すると予測モデルのパラメータを継続的に更新する機械学習手法を指す。
ノイズなどの重要なシステムイベントによる時間駆動型dHDPの更新を防止することが望ましい。
イベント駆動型dHDPアルゴリズムは,従来の時間駆動型dHDPと比較して動作することを示す。
論文 参考訳(メタデータ) (2020-06-16T05:51:25Z) - On Training and Evaluation of Neural Network Approaches for Model
Predictive Control [9.8918553325509]
本稿では,制約ニューラルネットワークを用いて実装されたモデル予測制御(MPC)のトレーニングと評価を行うフレームワークである。
モチベーションは、安全クリティカルフィードバック制御システムのリアルタイム最適化を、ニューラルネットワークと最適化層という形で学習されたマッピングに置き換えることである。
論文 参考訳(メタデータ) (2020-05-08T15:37:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。