論文の概要: QRnet: optimal regulator design with LQR-augmented neural networks
- arxiv url: http://arxiv.org/abs/2009.05686v2
- Date: Mon, 16 Nov 2020 18:39:17 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-19 22:15:56.295230
- Title: QRnet: optimal regulator design with LQR-augmented neural networks
- Title(参考訳): QRnet:LQR強化ニューラルネットワークによる最適レギュレータ設計
- Authors: Tenavi Nakamura-Zimmerer, Qi Gong, Wei Kang
- Abstract要約: 本研究では,高次元非線形系の最適レギュレータを設計するための新しい計算手法を提案する。
提案手法は,高次元ハミルトン・ヤコビ・ベルマン方程式を解くために物理インフォームド・機械学習を利用する。
我々は、状態空間を離散化せずに生成されたデータに基づいて拡張モデルを訓練し、高次元問題への適用を可能にする。
- 参考スコア(独自算出の注目度): 2.8725913509167156
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In this paper we propose a new computational method for designing optimal
regulators for high-dimensional nonlinear systems. The proposed approach
leverages physics-informed machine learning to solve high-dimensional
Hamilton-Jacobi-Bellman equations arising in optimal feedback control.
Concretely, we augment linear quadratic regulators with neural networks to
handle nonlinearities. We train the augmented models on data generated without
discretizing the state space, enabling application to high-dimensional
problems. We use the proposed method to design a candidate optimal regulator
for an unstable Burgers' equation, and through this example, demonstrate
improved robustness and accuracy compared to existing neural network
formulations.
- Abstract(参考訳): 本稿では,高次元非線形系の最適レギュレータ設計のための新しい計算手法を提案する。
提案手法は, 最適フィードバック制御による高次元ハミルトン・ヤコビ・ベルマン方程式を解くために, 物理インフォームド・機械学習を利用する。
具体的には,線形二次レギュレータをニューラルネットワークで拡張し,非線形性を扱う。
我々は、状態空間を離散化せずに生成されたデータで拡張モデルを訓練し、高次元問題への応用を可能にする。
提案手法を用いて不安定なバーガー方程式の最適レギュレータを設計し、この例を通して既存のニューラルネットワークの定式化よりも堅牢性と精度が向上したことを示す。
関連論文リスト
- Optimization Over Trained Neural Networks: Taking a Relaxing Walk [4.517039147450688]
ニューラルネットワークモデルの大域的および局所的線形緩和を探索し,よりスケーラブルな解法を提案する。
我々の解法は最先端のMILP解法と競合し、それ以前には入力、深さ、ニューロン数の増加によるより良い解法を導出する。
論文 参考訳(メタデータ) (2024-01-07T11:15:00Z) - ILP-based Resource Optimization Realized by Quantum Annealing for
Optical Wide-area Communication Networks -- A Framework for Solving
Combinatorial Problems of a Real-world Application by Quantum Annealing [6.472397166280681]
近年の研究では、D-Wave AdvantageTM量子アニールシステムに組み込むことができる2次非拘束二元最適化(QUBO)問題として、そのような問題をいかに実装できるかを実証した。
本稿では、システムパラメータの最適化に関する調査と、ソリューションの品質をさらに向上させるために機械学習(ML)技術をどのように取り入れているかについて報告する。
我々は、このNNを単純な整数線形プログラミング(ILP)の例で実装し、どのようにNNが解空間を完全にマッピングできるかをD-Waveが捉えていないかを実証した。
論文 参考訳(メタデータ) (2024-01-01T17:52:58Z) - The Convex Landscape of Neural Networks: Characterizing Global Optima
and Stationary Points via Lasso Models [75.33431791218302]
ディープニューラルネットワーク(DNN)モデルは、プログラミング目的に使用される。
本稿では,凸型神経回復モデルについて検討する。
定常的非次元目的物はすべて,グローバルサブサンプリング型凸解法プログラムとして特徴付けられることを示す。
また, 静止非次元目的物はすべて, グローバルサブサンプリング型凸解法プログラムとして特徴付けられることを示す。
論文 参考訳(メタデータ) (2023-12-19T23:04:56Z) - Safety Filter Design for Neural Network Systems via Convex Optimization [35.87465363928146]
ニューラルネットワーク(NN)システムの安全性を確保するために,凸最適化に依存する新しい安全フィルタを提案する。
非線形振り子システムにおいて,提案手法の有効性を数値的に示す。
論文 参考訳(メタデータ) (2023-08-16T01:30:13Z) - Constrained Optimization via Exact Augmented Lagrangian and Randomized
Iterative Sketching [55.28394191394675]
等式制約付き非線形非IBS最適化問題に対する適応的不正確なニュートン法を開発した。
ベンチマーク非線形問題,LVMのデータによる制約付きロジスティック回帰,PDE制約問題において,本手法の優れた性能を示す。
論文 参考訳(メタデータ) (2023-05-28T06:33:37Z) - Pontryagin Optimal Control via Neural Networks [19.546571122359534]
我々は,ニューラルネットワークをポントリャーギンの最大原理(PMP)と統合し,NN-PMP-Gradient の効率的なフレームワークを提案する。
結果として生じるコントローラは、未知の複雑な力学を持つシステムに実装することができる。
モデルフリーおよびモデルベース強化学習(RL)アルゴリズムと比較して, NN-PMP-Gradientは, 制御目的の観点から高いサンプル効率と性能を実現する。
論文 参考訳(メタデータ) (2022-12-30T06:47:03Z) - Unsupervised Optimal Power Flow Using Graph Neural Networks [172.33624307594158]
グラフニューラルネットワークを用いて、要求された電力と対応するアロケーションとの間の非線形パラメトリゼーションを学習する。
シミュレーションを通して、この教師なし学習コンテキストにおけるGNNの使用は、標準解法に匹敵するソリューションにつながることを示す。
論文 参考訳(メタデータ) (2022-10-17T17:30:09Z) - A novel Deep Neural Network architecture for non-linear system
identification [78.69776924618505]
非線形システム識別のための新しいDeep Neural Network (DNN)アーキテクチャを提案する。
メモリシステムにインスパイアされたインダクティブバイアス(アーキテクチャ)と正規化(損失関数)を導入する。
このアーキテクチャは、利用可能なデータのみに基づいて、自動的な複雑性の選択を可能にする。
論文 参考訳(メタデータ) (2021-06-06T10:06:07Z) - Joint Deep Reinforcement Learning and Unfolding: Beam Selection and
Precoding for mmWave Multiuser MIMO with Lens Arrays [54.43962058166702]
離散レンズアレイを用いたミリ波マルチユーザマルチインプット多重出力(MU-MIMO)システムに注目が集まっている。
本研究では、DLA を用いた mmWave MU-MIMO システムのビームプリコーディング行列の共同設計について検討する。
論文 参考訳(メタデータ) (2021-01-05T03:55:04Z) - Optimization-driven Machine Learning for Intelligent Reflecting Surfaces
Assisted Wireless Networks [82.33619654835348]
インテリジェントサーフェス(IRS)は、個々の散乱素子の位相シフトを制御して無線チャネルを再形成するために用いられる。
散乱素子の規模が大きいため、受動ビームフォーミングは一般に高い計算複雑性によって挑戦される。
本稿では、IRS支援無線ネットワークの性能向上のための機械学習(ML)アプローチに焦点を当てる。
論文 参考訳(メタデータ) (2020-08-29T08:39:43Z) - Loss landscapes and optimization in over-parameterized non-linear
systems and neural networks [20.44438519046223]
広域ニューラルネットワークがPL$*$条件を満たすことを示し、(S)GD収束を大域最小値に説明する。
広域ニューラルネットワークがPL$*$条件を満たすことを示し、(S)GD収束を大域最小値に説明する。
論文 参考訳(メタデータ) (2020-02-29T17:18:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。