論文の概要: Is Pontryagin's Maximum Principle all you need? Solving optimal control problems with PMP-inspired neural networks
- arxiv url: http://arxiv.org/abs/2410.06277v2
- Date: Sat, 09 Nov 2024 00:45:46 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-11-12 14:04:51.674993
- Title: Is Pontryagin's Maximum Principle all you need? Solving optimal control problems with PMP-inspired neural networks
- Title(参考訳): ポントリャーギンの最大原理は必要か?
- Authors: Kawisorn Kamtue, Jose M. F. Moura, Orathai Sangpetch,
- Abstract要約: 変分計算は最適な制御と推論を学ぶための堅牢なフレームワークを提供する。
このフレームワークは、制御と推論の課題を解決するために、ニューラルネットワークの設計にどのように活用できるのか?
本稿では,PMP-net(Pongryagin's Maximum Principle Neural Network)を提案する。
- 参考スコア(独自算出の注目度): 0.2633434651741688
- License:
- Abstract: Calculus of Variations is the mathematics of functional optimization, i.e., when the solutions are functions over a time interval. This is particularly important when the time interval is unknown like in minimum-time control problems, so that forward in time solutions are not possible. Calculus of Variations offers a robust framework for learning optimal control and inference. How can this framework be leveraged to design neural networks to solve challenges in control and inference? We propose the Pontryagin's Maximum Principle Neural Network (PMP-net) that is tailored to estimate control and inference solutions, in accordance with the necessary conditions outlined by Pontryagin's Maximum Principle. We assess PMP-net on two classic optimal control and inference problems: optimal linear filtering and minimum-time control. Our findings indicate that PMP-net can be effectively trained in an unsupervised manner to solve these problems without the need for ground-truth data, successfully deriving the classical "Kalman filter" and "bang-bang" control solution. This establishes a new approach for addressing general, possibly yet unsolved, optimal control problems.
- Abstract(参考訳): 変分法 (Calculus of Variations) は関数最適化の数学、すなわち解が時間間隔で関数であるときの数学である。
これは、最小時間制御問題のように時間間隔が未知である場合に特に重要であり、時間解の進行は不可能である。
変分計算は最適な制御と推論を学ぶための堅牢なフレームワークを提供する。
このフレームワークは、制御と推論の課題を解決するために、ニューラルネットワークの設計にどのように活用できるのか?
本稿では,ポントリャーギンの最大原理ニューラルネットワーク(PMP-net)を提案する。
最適線形フィルタリングと最小時間制御の2つの古典的最適制御および推論問題についてPMP-netを評価する。
以上の結果から,PMP-netは,従来の"カルマンフィルタ"と"バンバンバン"制御ソリューションの導出に成功して,これらの問題を解決するために,教師なしの方法で効果的に訓練できることが示唆された。
これにより、一般的な、しかし解決されていない、最適制御問題に対処する新しいアプローチが確立される。
関連論文リスト
- Learning Multiple Initial Solutions to Optimization Problems [52.9380464408756]
厳密なランタイム制約の下で、同様の最適化問題を順次解決することは、多くのアプリケーションにとって不可欠である。
本稿では,問題インスタンスを定義するパラメータが与えられた初期解を多種多様に予測する学習を提案する。
提案手法は,すべての評価設定において有意かつ一貫した改善を実現し,必要な初期解の数に応じて効率よくスケールできることを実証した。
論文 参考訳(メタデータ) (2024-11-04T15:17:19Z) - Neural Time-Reversed Generalized Riccati Equation [60.92253836775246]
ハミルトン方程式は、コストテートとして知られる補助変数を通して最適性の解釈を提供する。
本稿では,前向きに作業することを目的とした,新しいニューラルベースによる最適制御手法を提案する。
論文 参考訳(メタデータ) (2023-12-14T19:29:37Z) - Stochastic Optimal Control Matching [53.156277491861985]
最適制御のための新しい反復拡散最適化(IDO)技術である最適制御マッチング(SOCM)を導入する。
この制御は、一致するベクトル場に適合しようとすることで、最小二乗問題を通じて学習される。
実験により,本アルゴリズムは最適制御のための既存のすべての IDO 手法よりも低い誤差を実現する。
論文 参考訳(メタデータ) (2023-12-04T16:49:43Z) - Safe Neural Control for Non-Affine Control Systems with Differentiable
Control Barrier Functions [58.19198103790931]
本稿では,非アフィン制御系における安全クリティカル制御の問題に対処する。
制御バリア関数(CBF)を用いて,状態制約と制御制約の2次コストの最適化を2次プログラムのシーケンス(QP)にサブ最適化できることが示されている。
我々は,高次CBFをニューラル常微分方程式に基づく学習モデルに差分CBFとして組み込んで,非アフィン制御系の安全性を保証する。
論文 参考訳(メタデータ) (2023-09-06T05:35:48Z) - An Application of Pontryagin Neural Networks to Solve Optimal Quantum
Control Problems [1.5469452301122175]
ポントリャーギンの最大原理は、最適時間またはエネルギーにおける最大忠実度を達成するために重要な役割を果たすことが証明されている。
制御制約付き最適制御問題を定式化し、時間と双線型シュロディンガー方程式を満たす量子系に従属するエネルギーを最小化する。
我々は、pythonのいわゆるqutipパッケージと、新しく開発されたtfc pythonパッケージを利用する。
論文 参考訳(メタデータ) (2023-02-01T17:48:07Z) - Pontryagin Optimal Control via Neural Networks [19.546571122359534]
我々は,ニューラルネットワークをポントリャーギンの最大原理(PMP)と統合し,NN-PMP-Gradient の効率的なフレームワークを提案する。
結果として生じるコントローラは、未知の複雑な力学を持つシステムに実装することができる。
モデルフリーおよびモデルベース強化学習(RL)アルゴリズムと比較して, NN-PMP-Gradientは, 制御目的の観点から高いサンプル効率と性能を実現する。
論文 参考訳(メタデータ) (2022-12-30T06:47:03Z) - Unsupervised Optimal Power Flow Using Graph Neural Networks [172.33624307594158]
グラフニューラルネットワークを用いて、要求された電力と対応するアロケーションとの間の非線形パラメトリゼーションを学習する。
シミュレーションを通して、この教師なし学習コンテキストにおけるGNNの使用は、標準解法に匹敵するソリューションにつながることを示す。
論文 参考訳(メタデータ) (2022-10-17T17:30:09Z) - Application of Pontryagin's Maximum Principle to Quantum Metrology in
Dissipative Systems [8.920103626492315]
我々は「ツイスト・アンド・ターン」問題に対して量子フィッシャー情報を最大化する最適制御を求める。
最適制御は散逸することなく特異であるが、量子デコヒーレンスを導入すると非有界となる。
論文 参考訳(メタデータ) (2022-04-30T00:02:57Z) - Neural Predictive Control for the Optimization of Smart Grid Flexibility
Schedules [0.0]
モデル予測制御(MPC)は,格子フレキシビリティの最適スケジューリング問題を数学的に定式化する手法である。
MPC法は時間制約グリッド最適化の正確な結果を約束するが、大規模で複雑な電力系統モデルに必要な計算時間によって本質的に制限される。
線形及び非線形電力系統の最適制御ポリシーを模倣により学習するニューラルネットワーク予測制御方式を提案する。
論文 参考訳(メタデータ) (2021-08-19T15:12:35Z) - Unsupervised Deep Learning for Optimizing Wireless Systems with
Instantaneous and Statistic Constraints [29.823814915538463]
我々は、教師なしのディープラーニングを用いて、瞬時的制約と統計的制約の両方で、双方の問題を解決する統一的な枠組みを確立する。
教師なし学習は、最適政策の違反確率と近似精度の観点から教師あり学習より優れていることを示す。
論文 参考訳(メタデータ) (2020-05-30T13:37:14Z) - Optimizing Wireless Systems Using Unsupervised and
Reinforced-Unsupervised Deep Learning [96.01176486957226]
無線ネットワークにおけるリソース割り当てとトランシーバーは、通常最適化問題の解決によって設計される。
本稿では,変数最適化と関数最適化の両問題を解くための教師なし・教師なし学習フレームワークを紹介する。
論文 参考訳(メタデータ) (2020-01-03T11:01:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。