論文の概要: QRnet: optimal regulator design with LQR-augmented neural networks
- arxiv url: http://arxiv.org/abs/2009.05686v2
- Date: Mon, 16 Nov 2020 18:39:17 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-19 22:15:56.295230
- Title: QRnet: optimal regulator design with LQR-augmented neural networks
- Title(参考訳): QRnet:LQR強化ニューラルネットワークによる最適レギュレータ設計
- Authors: Tenavi Nakamura-Zimmerer, Qi Gong, Wei Kang
- Abstract要約: 本研究では,高次元非線形系の最適レギュレータを設計するための新しい計算手法を提案する。
提案手法は,高次元ハミルトン・ヤコビ・ベルマン方程式を解くために物理インフォームド・機械学習を利用する。
我々は、状態空間を離散化せずに生成されたデータに基づいて拡張モデルを訓練し、高次元問題への適用を可能にする。
- 参考スコア(独自算出の注目度): 2.8725913509167156
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In this paper we propose a new computational method for designing optimal
regulators for high-dimensional nonlinear systems. The proposed approach
leverages physics-informed machine learning to solve high-dimensional
Hamilton-Jacobi-Bellman equations arising in optimal feedback control.
Concretely, we augment linear quadratic regulators with neural networks to
handle nonlinearities. We train the augmented models on data generated without
discretizing the state space, enabling application to high-dimensional
problems. We use the proposed method to design a candidate optimal regulator
for an unstable Burgers' equation, and through this example, demonstrate
improved robustness and accuracy compared to existing neural network
formulations.
- Abstract(参考訳): 本稿では,高次元非線形系の最適レギュレータ設計のための新しい計算手法を提案する。
提案手法は, 最適フィードバック制御による高次元ハミルトン・ヤコビ・ベルマン方程式を解くために, 物理インフォームド・機械学習を利用する。
具体的には,線形二次レギュレータをニューラルネットワークで拡張し,非線形性を扱う。
我々は、状態空間を離散化せずに生成されたデータで拡張モデルを訓練し、高次元問題への応用を可能にする。
提案手法を用いて不安定なバーガー方程式の最適レギュレータを設計し、この例を通して既存のニューラルネットワークの定式化よりも堅牢性と精度が向上したことを示す。
関連論文リスト
- A Guaranteed-Stable Neural Network Approach for Optimal Control of Nonlinear Systems [3.5000297213981653]
非線形システムの最適制御に対する有望なアプローチは、システムを反復線形化し、最適制御入力を決定するために各タイミングで最適化問題を解くことである。
このアプローチはオンライン最適化に依存するため、計算コストがかかるため、限られた計算資源を持つシステムでは非現実的である。
この問題の潜在的な解決策の1つは、ニューラルネットワーク(NN)を制御ループに組み込むことである。
論文 参考訳(メタデータ) (2025-01-28T22:55:47Z) - RandONet: Shallow-Networks with Random Projections for learning linear and nonlinear operators [0.0]
ランダムプロジェクションに基づく演算子ネットワーク(RandONets)を提案する。
ランダムネット(RandONets)は、線形および非線形作用素を学習するランダムプロジェクションを持つ浅いネットワークである。
このタスクにおいて、RandONetsは数値近似の精度と計算コストの両面で、バニラ"DeepOnetsよりも優れていることを示す。
論文 参考訳(メタデータ) (2024-06-08T13:20:48Z) - A neural network-based approach to hybrid systems identification for control [4.324244627273018]
本研究では,未知の力学系の機械学習モデルの設計を有限個の(状態入力)状態データポイントから検討する。
ニューラルネットワーク(NN)アーキテクチャを採用して、適切なトレーニングをすれば、連続的なピースワイズ-ファインダイナミクスを備えたハイブリッドシステムが得られるのです。
NNの重みを慎重に選択すると、有限地平面最適制御問題の一部として使用する場合に非常に有利な構造特性を持つハイブリッドシステムモデルが得られることを示す。
論文 参考訳(メタデータ) (2024-04-02T10:16:30Z) - The Convex Landscape of Neural Networks: Characterizing Global Optima
and Stationary Points via Lasso Models [75.33431791218302]
ディープニューラルネットワーク(DNN)モデルは、プログラミング目的に使用される。
本稿では,凸型神経回復モデルについて検討する。
定常的非次元目的物はすべて,グローバルサブサンプリング型凸解法プログラムとして特徴付けられることを示す。
また, 静止非次元目的物はすべて, グローバルサブサンプリング型凸解法プログラムとして特徴付けられることを示す。
論文 参考訳(メタデータ) (2023-12-19T23:04:56Z) - Constrained Optimization via Exact Augmented Lagrangian and Randomized
Iterative Sketching [55.28394191394675]
等式制約付き非線形非IBS最適化問題に対する適応的不正確なニュートン法を開発した。
ベンチマーク非線形問題,LVMのデータによる制約付きロジスティック回帰,PDE制約問題において,本手法の優れた性能を示す。
論文 参考訳(メタデータ) (2023-05-28T06:33:37Z) - Pontryagin Optimal Control via Neural Networks [19.546571122359534]
我々は,ニューラルネットワークをポントリャーギンの最大原理(PMP)と統合し,NN-PMP-Gradient の効率的なフレームワークを提案する。
結果として生じるコントローラは、未知の複雑な力学を持つシステムに実装することができる。
モデルフリーおよびモデルベース強化学習(RL)アルゴリズムと比較して, NN-PMP-Gradientは, 制御目的の観点から高いサンプル効率と性能を実現する。
論文 参考訳(メタデータ) (2022-12-30T06:47:03Z) - Unsupervised Optimal Power Flow Using Graph Neural Networks [172.33624307594158]
グラフニューラルネットワークを用いて、要求された電力と対応するアロケーションとの間の非線形パラメトリゼーションを学習する。
シミュレーションを通して、この教師なし学習コンテキストにおけるGNNの使用は、標準解法に匹敵するソリューションにつながることを示す。
論文 参考訳(メタデータ) (2022-10-17T17:30:09Z) - A novel Deep Neural Network architecture for non-linear system
identification [78.69776924618505]
非線形システム識別のための新しいDeep Neural Network (DNN)アーキテクチャを提案する。
メモリシステムにインスパイアされたインダクティブバイアス(アーキテクチャ)と正規化(損失関数)を導入する。
このアーキテクチャは、利用可能なデータのみに基づいて、自動的な複雑性の選択を可能にする。
論文 参考訳(メタデータ) (2021-06-06T10:06:07Z) - Joint Deep Reinforcement Learning and Unfolding: Beam Selection and
Precoding for mmWave Multiuser MIMO with Lens Arrays [54.43962058166702]
離散レンズアレイを用いたミリ波マルチユーザマルチインプット多重出力(MU-MIMO)システムに注目が集まっている。
本研究では、DLA を用いた mmWave MU-MIMO システムのビームプリコーディング行列の共同設計について検討する。
論文 参考訳(メタデータ) (2021-01-05T03:55:04Z) - Optimization-driven Machine Learning for Intelligent Reflecting Surfaces
Assisted Wireless Networks [82.33619654835348]
インテリジェントサーフェス(IRS)は、個々の散乱素子の位相シフトを制御して無線チャネルを再形成するために用いられる。
散乱素子の規模が大きいため、受動ビームフォーミングは一般に高い計算複雑性によって挑戦される。
本稿では、IRS支援無線ネットワークの性能向上のための機械学習(ML)アプローチに焦点を当てる。
論文 参考訳(メタデータ) (2020-08-29T08:39:43Z) - Loss landscapes and optimization in over-parameterized non-linear
systems and neural networks [20.44438519046223]
広域ニューラルネットワークがPL$*$条件を満たすことを示し、(S)GD収束を大域最小値に説明する。
広域ニューラルネットワークがPL$*$条件を満たすことを示し、(S)GD収束を大域最小値に説明する。
論文 参考訳(メタデータ) (2020-02-29T17:18:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。