論文の概要: On Training and Evaluation of Neural Network Approaches for Model
Predictive Control
- arxiv url: http://arxiv.org/abs/2005.04112v1
- Date: Fri, 8 May 2020 15:37:55 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-05 12:16:56.485119
- Title: On Training and Evaluation of Neural Network Approaches for Model
Predictive Control
- Title(参考訳): モデル予測制御のためのニューラルネットワークアプローチの訓練と評価について
- Authors: Rebecka Winqvist, Arun Venkitaraman, Bo Wahlberg
- Abstract要約: 本稿では,制約ニューラルネットワークを用いて実装されたモデル予測制御(MPC)のトレーニングと評価を行うフレームワークである。
モチベーションは、安全クリティカルフィードバック制御システムのリアルタイム最適化を、ニューラルネットワークと最適化層という形で学習されたマッピングに置き換えることである。
- 参考スコア(独自算出の注目度): 9.8918553325509
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The contribution of this paper is a framework for training and evaluation of
Model Predictive Control (MPC) implemented using constrained neural networks.
Recent studies have proposed to use neural networks with differentiable convex
optimization layers to implement model predictive controllers. The motivation
is to replace real-time optimization in safety critical feedback control
systems with learnt mappings in the form of neural networks with optimization
layers. Such mappings take as the input the state vector and predict the
control law as the output. The learning takes place using training data
generated from off-line MPC simulations. However, a general framework for
characterization of learning approaches in terms of both model validation and
efficient training data generation is lacking in literature. In this paper, we
take the first steps towards developing such a coherent framework. We discuss
how the learning problem has similarities with system identification, in
particular input design, model structure selection and model validation. We
consider the study of neural network architectures in PyTorch with the explicit
MPC constraints implemented as a differentiable optimization layer using CVXPY.
We propose an efficient approach of generating MPC input samples subject to the
MPC model constraints using a hit-and-run sampler. The corresponding true
outputs are generated by solving the MPC offline using OSOP. We propose
different metrics to validate the resulting approaches. Our study further aims
to explore the advantages of incorporating domain knowledge into the network
structure from a training and evaluation perspective. Different model
structures are numerically tested using the proposed framework in order to
obtain more insights in the properties of constrained neural networks based
MPC.
- Abstract(参考訳): 本稿では,制約付きニューラルネットワークを用いたモデル予測制御(mpc)の学習と評価のための枠組みを提案する。
近年、モデル予測コントローラを実装するために、微分可能な凸最適化層を持つニューラルネットワークの利用が提案されている。
モチベーションは、安全クリティカルフィードバック制御システムにおけるリアルタイム最適化をニューラルネットワークの形式で学習マッピングに置き換えることである。
このような写像は状態ベクトルを入力とし、制御則を出力として予測する。
学習は、オフラインMPCシミュレーションから生成されたトレーニングデータを用いて行われる。
しかし、モデル検証と効率的なトレーニングデータ生成の両方の観点から学習アプローチを特徴づけるための一般的な枠組みは、文献に欠けている。
本稿では,このようなコヒーレントなフレームワークの開発に向けて第一歩を踏み出す。
本稿では,学習問題とシステム識別,特に入力設計,モデル構造選択,モデル検証の類似性について論じる。
PyTorchにおけるニューラルネットワークアーキテクチャの研究を,CVXPYを用いた微分可能な最適化層として実装された明示的なMPC制約を用いて検討する。
そこで本研究では,MPCモデル制約を考慮したMPC入力サンプルを生成する手法を提案する。
osopを用いてmpcをオフラインで解いて対応する真の出力を生成する。
得られたアプローチを検証するために、異なるメトリクスを提案する。
本研究は,ネットワーク構造にドメイン知識を組み込むことの利点を,学習・評価の観点から検討することを目的とする。
制約付きニューラルネットワークに基づくmpcの特性に関するさらなる知見を得るために,提案手法を用いて異なるモデル構造を数値的に検証した。
関連論文リスト
- End-to-End Reinforcement Learning of Koopman Models for Economic
Nonlinear Model Predictive Control [50.0791489606211]
非線形モデル予測制御((e)NMPC)は、すべての状態空間領域において十分正確なシステムモデルを必要とする。
メカニスティックモデルのためのデータ駆動サロゲートモデルは、(e)NMPCの計算負担を軽減するために使用できる。
In this method for end-to-end reinforcement learning of dynamic surrogate model for optimal performance in (e)NMPC applications。
論文 参考訳(メタデータ) (2023-08-03T10:21:53Z) - Iterative self-transfer learning: A general methodology for response
time-history prediction based on small dataset [0.0]
本研究では,小さなデータセットに基づいてニューラルネットワークを学習するための反復的自己伝達学習手法を提案する。
提案手法は,小さなデータセットに対して,ほぼ一桁の精度でモデル性能を向上させることができることを示す。
論文 参考訳(メタデータ) (2023-06-14T18:48:04Z) - Model Predictive Control via On-Policy Imitation Learning [28.96122879515294]
我々は,データ駆動型モデル予測制御のための新しいサンプル複雑性結果と性能保証を開発する。
我々のアルゴリズムは制約付き線形MPCの構造を用いており、解析は明示的なMPC解の特性を用いて、最適性能を達成するのに必要なオンラインMPCトラジェクトリの数を理論的に制限する。
論文 参考訳(メタデータ) (2022-10-17T16:06:06Z) - Fitting a Directional Microstructure Model to Diffusion-Relaxation MRI
Data with Self-Supervised Machine Learning [2.8167227950959206]
教師付き学習の魅力的な代替手段として、自己教師型機械学習が登場している。
本稿では,指向性マイクロ構造モデルに適用可能な自己教師型機械学習モデルを実証する。
提案手法は, パラメータ推定と計算時間において, 通常の非線形最小二乗整合と比較して明らかに改善されている。
論文 参考訳(メタデータ) (2022-10-05T15:51:39Z) - Learning to Learn with Generative Models of Neural Network Checkpoints [71.06722933442956]
ニューラルネットワークのチェックポイントのデータセットを構築し,パラメータの生成モデルをトレーニングする。
提案手法は,幅広い損失プロンプトに対するパラメータの生成に成功している。
我々は、教師付きおよび強化学習における異なるニューラルネットワークアーキテクチャとタスクに本手法を適用した。
論文 参考訳(メタデータ) (2022-09-26T17:59:58Z) - Real-time Neural-MPC: Deep Learning Model Predictive Control for
Quadrotors and Agile Robotic Platforms [59.03426963238452]
モデル予測制御パイプライン内の動的モデルとして,大規模で複雑なニューラルネットワークアーキテクチャを効率的に統合するフレームワークであるReal-time Neural MPCを提案する。
ニューラルネットワークを使わずに、最先端のMPCアプローチと比較して、位置追跡誤差を最大82%削減することで、実世界の問題に対する我々のフレームワークの実現可能性を示す。
論文 参考訳(メタデータ) (2022-03-15T09:38:15Z) - Hybridization of Capsule and LSTM Networks for unsupervised anomaly
detection on multivariate data [0.0]
本稿では,Long-Short-Term-Memory(LSTM)とCapsule Networksを1つのネットワークに結合した新しいNNアーキテクチャを提案する。
提案手法は教師なし学習手法を用いて大量のラベル付きトレーニングデータを見つける際の問題を克服する。
論文 参考訳(メタデータ) (2022-02-11T10:33:53Z) - Gone Fishing: Neural Active Learning with Fisher Embeddings [55.08537975896764]
ディープニューラルネットワークと互換性のあるアクティブな学習アルゴリズムの必要性が高まっている。
本稿では,ニューラルネットワークのための抽出可能かつ高性能な能動学習アルゴリズムBAITを紹介する。
論文 参考訳(メタデータ) (2021-06-17T17:26:31Z) - Edge-assisted Democratized Learning Towards Federated Analytics [67.44078999945722]
本稿では,エッジ支援型民主化学習機構であるEdge-DemLearnの階層的学習構造を示す。
また、Edge-DemLearnを柔軟なモデルトレーニングメカニズムとして検証し、リージョンに分散制御と集約の方法論を構築する。
論文 参考訳(メタデータ) (2020-12-01T11:46:03Z) - Belief Propagation Reloaded: Learning BP-Layers for Labeling Problems [83.98774574197613]
最も単純な推論手法の1つとして、切り詰められた最大積のBelief伝播を取り上げ、それをディープラーニングモデルの適切なコンポーネントにするために必要となるものを加えます。
このBP-Layerは畳み込みニューラルネットワーク(CNN)の最終ブロックまたは中間ブロックとして使用できる
このモデルは様々な密集予測問題に適用可能であり、パラメータ効率が高く、ステレオ、光フロー、セマンティックセグメンテーションにおける堅牢な解を提供する。
論文 参考訳(メタデータ) (2020-03-13T13:11:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。