論文の概要: Pontryagin Optimal Control via Neural Networks
- arxiv url: http://arxiv.org/abs/2212.14566v2
- Date: Sun, 7 Jan 2024 19:54:08 GMT
- ステータス: 処理完了
- システム内更新日: 2024-01-10 00:21:53.650829
- Title: Pontryagin Optimal Control via Neural Networks
- Title(参考訳): ニューラルネットワークによるポントリャーギン最適制御
- Authors: Chengyang Gu, Hui Xiong and Yize Chen
- Abstract要約: 我々は,ニューラルネットワークをポントリャーギンの最大原理(PMP)と統合し,NN-PMP-Gradient の効率的なフレームワークを提案する。
結果として生じるコントローラは、未知の複雑な力学を持つシステムに実装することができる。
モデルフリーおよびモデルベース強化学習(RL)アルゴリズムと比較して, NN-PMP-Gradientは, 制御目的の観点から高いサンプル効率と性能を実現する。
- 参考スコア(独自算出の注目度): 19.546571122359534
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Solving real-world optimal control problems are challenging tasks, as the
complex, high-dimensional system dynamics are usually unrevealed to the
decision maker. It is thus hard to find the optimal control actions
numerically. To deal with such modeling and computation challenges, in this
paper, we integrate Neural Networks with the Pontryagin's Maximum Principle
(PMP), and propose a sample efficient framework NN-PMP-Gradient. The resulting
controller can be implemented for systems with unknown and complex dynamics. By
taking an iterative approach, the proposed framework not only utilizes the
accurate surrogate models parameterized by neural networks, it also efficiently
recovers the optimality conditions along with the optimal action sequences via
PMP conditions. Numerical simulations on Linear Quadratic Regulator, energy
arbitrage of grid-connected lossy battery, control of single pendulum, and two
MuJoCo locomotion tasks demonstrate our proposed NN-PMP-Gradient is a general
and versatile computation tool for finding optimal solutions. And compared with
the widely applied model-free and model-based reinforcement learning (RL)
algorithms, our NN-PMP-Gradient achieves higher sample-efficiency and
performance in terms of control objectives.
- Abstract(参考訳): 現実の最適制御問題の解決は難しい作業であり、複雑で高次元のシステムダイナミクスは意思決定者には明らかにされない。
したがって、最適制御動作を数値的に見つけることは困難である。
このようなモデリングと計算の課題に対処するため,本論文では,ニューラルネットワークとpontryaginの最大原理(pmp)を統合し,nn-pmp-gradientのサンプル効率的なフレームワークを提案する。
結果として生じるコントローラは未知の複雑な力学を持つシステムに実装することができる。
提案手法は,ニューラルネットワークによってパラメータ化される精度の高いサロゲートモデルを利用するだけでなく,pmp条件による最適動作シーケンスとともに最適条件を効率的に回復する。
線形二次レギュレータの数値シミュレーション,グリッド接続型損失電池のエネルギー仲裁,単一振り子制御,および2つのMuJoCo移動タスクにより,提案したNN-PMP-Gradientは最適解を求める汎用的で汎用的な計算ツールであることを示す。
また, モデルフリーおよびモデルベース強化学習(RL)アルゴリズムと比較して, NN-PMP-Gradientは, 制御目的の観点から高いサンプル効率と性能を実現する。
関連論文リスト
- Receding Hamiltonian-Informed Optimal Neural Control and State Estimation for Closed-Loop Dynamical Systems [4.05766189327054]
Hamiltonian-Informed Optimal Neural (Hion) コントローラは、動的システムのためのニューラルネットワークベースの新しいクラスである。
ヒオンコントローラは将来の状態を推定し、ポントリャーギンの原理を用いて最適制御入力を計算する。
論文 参考訳(メタデータ) (2024-11-02T16:06:29Z) - Reservoir computing for system identification and predictive control with limited data [3.1484174280822845]
我々は、ベンチマーク制御システムの力学を学習し、モデル予測制御(MPC)の代理モデルとして機能するRNN変種の評価を行う。
エコー状態ネットワーク(ESN)は、計算複雑性の低減、より有効な予測時間、MPC目的関数のコスト削減など、競合するアーキテクチャよりも様々な利点がある。
論文 参考訳(メタデータ) (2024-10-23T21:59:07Z) - A neural network-based approach to hybrid systems identification for control [4.324244627273018]
本研究では,未知の力学系の機械学習モデルの設計を有限個の(状態入力)状態データポイントから検討する。
ニューラルネットワーク(NN)アーキテクチャを採用して、適切なトレーニングをすれば、連続的なピースワイズ-ファインダイナミクスを備えたハイブリッドシステムが得られるのです。
NNの重みを慎重に選択すると、有限地平面最適制御問題の一部として使用する場合に非常に有利な構造特性を持つハイブリッドシステムモデルが得られることを示す。
論文 参考訳(メタデータ) (2024-04-02T10:16:30Z) - Model-Based Control with Sparse Neural Dynamics [23.961218902837807]
モデル学習と予測制御を統合した新しいフレームワークを提案する。
我々は,既存の最先端手法よりもクローズドループ性能を向上できることを示す。
論文 参考訳(メタデータ) (2023-12-20T06:25:02Z) - Pointer Networks with Q-Learning for Combinatorial Optimization [55.2480439325792]
我々は、モデルフリーQ値ポリシー近似をPointer Networks(Ptr-Nets)と統合したハイブリッドニューラルネットワークであるPointer Q-Network(PQN)を紹介する。
実験により,本手法の有効性を実証し,不安定な環境でモデルをテストする。
論文 参考訳(メタデータ) (2023-11-05T12:03:58Z) - Robust optimal well control using an adaptive multi-grid reinforcement
learning framework [0.0]
強化学習は、堅牢な最適ウェルコントロール問題を解決するための有望なツールである。
提案するフレームワークは、最先端のモデルフリーポリシーベースのRLアルゴリズムを用いて実証される。
計算効率の顕著な向上は,提案したフレームワークを用いて,1つのファイングリッドの計算コストの約60~70%を削減した。
論文 参考訳(メタデータ) (2022-07-07T12:08:57Z) - Real-time Neural-MPC: Deep Learning Model Predictive Control for
Quadrotors and Agile Robotic Platforms [59.03426963238452]
モデル予測制御パイプライン内の動的モデルとして,大規模で複雑なニューラルネットワークアーキテクチャを効率的に統合するフレームワークであるReal-time Neural MPCを提案する。
ニューラルネットワークを使わずに、最先端のMPCアプローチと比較して、位置追跡誤差を最大82%削減することで、実世界の問題に対する我々のフレームワークの実現可能性を示す。
論文 参考訳(メタデータ) (2022-03-15T09:38:15Z) - Joint Deep Reinforcement Learning and Unfolding: Beam Selection and
Precoding for mmWave Multiuser MIMO with Lens Arrays [54.43962058166702]
離散レンズアレイを用いたミリ波マルチユーザマルチインプット多重出力(MU-MIMO)システムに注目が集まっている。
本研究では、DLA を用いた mmWave MU-MIMO システムのビームプリコーディング行列の共同設計について検討する。
論文 参考訳(メタデータ) (2021-01-05T03:55:04Z) - Data-Driven Random Access Optimization in Multi-Cell IoT Networks with
NOMA [78.60275748518589]
非直交多重アクセス(NOMA)は、5Gネットワーク以降で大規模なマシンタイプ通信(mMTC)を可能にする重要な技術です。
本稿では,高密度空間分散マルチセル無線IoTネットワークにおけるランダムアクセス効率向上のために,NOMAを適用した。
ユーザ期待容量の幾何学的平均を最大化するために,各IoTデバイスの伝送確率を調整したランダムチャネルアクセス管理の新たな定式化を提案する。
論文 参考訳(メタデータ) (2021-01-02T15:21:08Z) - Learning High-Level Policies for Model Predictive Control [54.00297896763184]
Model Predictive Control (MPC)は、ロボット制御タスクに対する堅牢なソリューションを提供する。
ニューラルネットワークの高レベルポリシーを学習するための自己教師付き学習アルゴリズムを提案する。
提案手法は, 標準的なMPCでは困難な状況に対処できることを示す。
論文 参考訳(メタデータ) (2020-07-20T17:12:34Z) - Iterative Algorithm Induced Deep-Unfolding Neural Networks: Precoding
Design for Multiuser MIMO Systems [59.804810122136345]
本稿では,AIIDNN(ディープ・アンフォールディング・ニューラルネット)を一般化した,ディープ・アンフォールディングのためのフレームワークを提案する。
古典的重み付き最小二乗誤差(WMMSE)反復アルゴリズムの構造に基づく効率的なIAIDNNを提案する。
提案したIAIDNNは,計算複雑性を低減した反復WMMSEアルゴリズムの性能を効率よく向上することを示す。
論文 参考訳(メタデータ) (2020-06-15T02:57:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。