論文の概要: ReLU Networks for Model Predictive Control: Network Complexity and Performance Guarantees
- arxiv url: http://arxiv.org/abs/2601.16764v1
- Date: Fri, 23 Jan 2026 14:12:10 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-26 14:27:27.711341
- Title: ReLU Networks for Model Predictive Control: Network Complexity and Performance Guarantees
- Title(参考訳): モデル予測制御のためのReLUネットワーク:ネットワーク複雑度と性能保証
- Authors: Xingchen Li, Keyou You,
- Abstract要約: 本稿では, 制約を強制し, 最適MPCコスト関数に対する状態依存リプシッツ連続性特性を確立するプロジェクションに基づく手法を提案する。
閉ループ性能を保証したMPCポリシーを近似するためのReLUネットワーク幅と深さの明示的な境界を導出する。
- 参考スコア(独自算出の注目度): 10.106606525540688
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Recent years have witnessed a resurgence in using ReLU neural networks (NNs) to represent model predictive control (MPC) policies. However, determining the required network complexity to ensure closed-loop performance remains a fundamental open problem. This involves a critical precision-complexity trade-off: undersized networks may fail to capture the MPC policy, while oversized ones may outweigh the benefits of ReLU network approximation. In this work, we propose a projection-based method to enforce hard constraints and establish a state-dependent Lipschitz continuity property for the optimal MPC cost function, which enables sharp convergence analysis of the closed-loop system. For the first time, we derive explicit bounds on ReLU network width and depth for approximating MPC policies with guaranteed closed-loop performance. To further reduce network complexity and enhance closed-loop performance, we propose a non-uniform error framework with a state-aware scaling function to adaptively adjust both the input and output of the ReLU network. Our contributions provide a foundational step toward certifiable ReLU NN-based MPC.
- Abstract(参考訳): 近年、モデル予測制御(MPC)ポリシーを表現するためにReLUニューラルネットワーク(NN)の使用が復活しているのを目撃している。
しかし、クローズドループ性能を保証するために必要なネットワークの複雑さを決定することは、依然として根本的なオープンな問題である。
低サイズのネットワークはMPCポリシーを捉えず、大きすぎるネットワークはReLUネットワーク近似の利点を上回る可能性がある。
本研究では, 閉ループシステムの急激な収束解析を可能にするため, 厳密な制約を強制し, 最適MPCコスト関数に対する状態依存リプシッツ連続性特性を確立するプロジェクションに基づく手法を提案する。
閉ループ性能を保証したMPCポリシーを近似するためのReLUネットワーク幅と深さの明示的な境界を導出する。
ネットワークの複雑性をさらに低減し,閉ループ性能を向上させるために,ReLUネットワークの入力と出力を適応的に調整する状態認識スケーリング機能を備えた非一様エラーフレームワークを提案する。
我々のコントリビューションは、ReLU NNベースのMPCの認定に向けた基礎的なステップを提供する。
関連論文リスト
- Graph Neural Networks for Resource Allocation in Interference-limited Multi-Channel Wireless Networks with QoS Constraints [24.147078012070285]
最小データレートの制約を満たすことは、無線通信システムにおいて重要な課題である。
従来のディープラーニングアプローチは、損失関数とハイパーチューニングにペナルティ項を組み込むことによって、これらの制約に対処することが多い。
We build the structure of the WMMSE algorithm and extended it to a multi-channel set。
我々は,GNNベースのアルゴリズムであるJCPGNN-Mを開発し,ユーザ毎の同時マルチチャネル割り当てをサポートする。
論文 参考訳(メタデータ) (2025-09-08T07:28:10Z) - Lightweight Federated Learning over Wireless Edge Networks [83.4818741890634]
Federated (FL) はネットワークエッジの代替品であるが、無線ネットワークでは代替品である。
閉形式式FL収束ギャップ伝送パワー,モデルプルーニング誤差,量子化を導出する。
LTFLは、実世界のデータセットの実験において最先端のスキームよりも優れている。
論文 参考訳(メタデータ) (2025-07-13T09:14:17Z) - LLM4DistReconfig: A Fine-tuned Large Language Model for Power Distribution Network Reconfiguration [1.3453966060917504]
DERの統合と顧客参加の増加により、配電ネットワークは進化している。
最適動作を維持し、損失を最小限に抑え、様々な負荷要求を満たすためには、頻繁なネットワーク再構成が必要である。
データ駆動の再構成は、不完全なネットワークデータに対する正確性、速度、堅牢性のために勢いを増している。
論文 参考訳(メタデータ) (2025-01-24T22:46:14Z) - REBEL: Reinforcement Learning via Regressing Relative Rewards [59.68420022466047]
生成モデルの時代における最小限のRLアルゴリズムであるREBELを提案する。
理論的には、自然ポリシーグラディエントのような基本的なRLアルゴリズムはREBELの変種と見なすことができる。
我々はREBELが言語モデリングと画像生成に一貫したアプローチを提供し、PPOやDPOとより強くあるいは類似した性能を実現することを発見した。
論文 参考訳(メタデータ) (2024-04-25T17:20:45Z) - Fixing the NTK: From Neural Network Linearizations to Exact Convex
Programs [63.768739279562105]
学習目標に依存しない特定のマスクウェイトを選択する場合、このカーネルはトレーニングデータ上のゲートReLUネットワークのNTKと等価であることを示す。
この目標への依存の欠如の結果として、NTKはトレーニングセット上の最適MKLカーネルよりもパフォーマンスが良くない。
論文 参考訳(メタデータ) (2023-09-26T17:42:52Z) - Optimization Guarantees of Unfolded ISTA and ADMM Networks With Smooth
Soft-Thresholding [57.71603937699949]
我々は,学習エポックの数の増加とともに,ほぼゼロに近いトレーニング損失を達成するための最適化保証について検討した。
トレーニングサンプル数に対する閾値は,ネットワーク幅の増加とともに増加することを示す。
論文 参考訳(メタデータ) (2023-09-12T13:03:47Z) - Optimal Sets and Solution Paths of ReLU Networks [56.40911684005949]
最適なReLUネットワークの集合を特徴付ける分析フレームワークを開発した。
我々は、ReLUネットワークのニューラル化を継続する条件を確立し、ReLUネットワークに対する感度結果を開発する。
論文 参考訳(メタデータ) (2023-05-31T18:48:16Z) - State-Augmented Learnable Algorithms for Resource Management in Wireless
Networks [124.89036526192268]
本稿では,無線ネットワークにおける資源管理問題を解決するためのステート拡張アルゴリズムを提案する。
提案アルゴリズムは, RRM決定を可能, ほぼ最適に行うことができることを示す。
論文 参考訳(メタデータ) (2022-07-05T18:02:54Z) - Reliably-stabilizing piecewise-affine neural network controllers [5.203329540700177]
モデル予測制御(MPC)ポリシーのニューラルネットワーク(NN)近似に影響を与える一般的な問題は、NNベースのコントローラの動作の下でクローズドループシステムの安定性を評価するための分析ツールがないことである。
本稿では、そのような制御器の性能を定量化したり、与えられたMPCスキームの望ましい特性を保持する最小の複雑性NNを設計するための一般的な手順を提案する。
論文 参考訳(メタデータ) (2021-11-13T20:01:43Z) - Proactive and AoI-aware Failure Recovery for Stateful NFV-enabled
Zero-Touch 6G Networks: Model-Free DRL Approach [0.0]
ゼロタッチPFR(ZT-PFR)と呼ばれるモデルフリー深部強化学習(DRL)に基づくアクティブ障害回復フレームワークを提案する。
ZT-PFRは、ネットワーク機能仮想化(NFV)対応ネットワークにおける組み込みステートフル仮想ネットワーク機能(VNF)用です。
論文 参考訳(メタデータ) (2021-02-02T21:40:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。