論文の概要: Application of deep and reinforcement learning to boundary control
problems
- arxiv url: http://arxiv.org/abs/2310.15191v1
- Date: Sat, 21 Oct 2023 10:56:32 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-25 22:44:29.260358
- Title: Application of deep and reinforcement learning to boundary control
problems
- Title(参考訳): 深層・強化学習の境界制御問題への応用
- Authors: Zenin Easa Panthakkalakath, Juraj Kardo\v{s}, Olaf Schenk
- Abstract要約: 目的は、囲まれたドメインが所望の状態値に達するように、ドメイン境界に対する最適な値を見つけることである。
本研究は,ディープラーニングと強化学習による境界制御問題の解決の可能性を探る。
- 参考スコア(独自算出の注目度): 0.6906005491572401
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The boundary control problem is a non-convex optimization and control problem
in many scientific domains, including fluid mechanics, structural engineering,
and heat transfer optimization. The aim is to find the optimal values for the
domain boundaries such that the enclosed domain adhering to the governing
equations attains the desired state values. Traditionally, non-linear
optimization methods, such as the Interior-Point method (IPM), are used to
solve such problems.
This project explores the possibilities of using deep learning and
reinforcement learning to solve boundary control problems. We adhere to the
framework of iterative optimization strategies, employing a spatial neural
network to construct well-informed initial guesses, and a spatio-temporal
neural network learns the iterative optimization algorithm using policy
gradients. Synthetic data, generated from the problems formulated in the
literature, is used for training, testing and validation. The numerical
experiments indicate that the proposed method can rival the speed and accuracy
of existing solvers. In our preliminary results, the network attains costs
lower than IPOPT, a state-of-the-art non-linear IPM, in 51\% cases. The overall
number of floating point operations in the proposed method is similar to that
of IPOPT. Additionally, the informed initial guess method and the learned
momentum-like behaviour in the optimizer method are incorporated to avoid
convergence to local minima.
- Abstract(参考訳): 境界制御問題は、流体力学、構造工学、伝熱最適化を含む多くの科学領域における非凸最適化と制御問題である。
目的は、支配方程式に忠実な囲い領域が所望の状態値を達成するようなドメイン境界に対する最適値を見つけることである。
伝統的に、内部点法(IPM)のような非線形最適化法は、そのような問題を解決するために用いられる。
このプロジェクトは、境界制御問題を解決するためにディープラーニングと強化学習を使用する可能性を探る。
我々は,空間的ニューラルネットワークを用いて適切な初期推定を行う反復最適化戦略の枠組みに固執し,時空間的ニューラルネットワークは方針勾配を用いて反復最適化アルゴリズムを学習する。
文献で定式化された問題から生成される合成データは、トレーニング、テスト、検証に使用される。
数値実験により,提案手法は既存の解法の速度と精度に匹敵することを示す。
予備的な結果では、51\%のケースで、最先端の非線形IPMであるIPOPTよりもコストが低い。
提案手法における浮動小数点演算の総数はIPOPTと類似している。
さらに、局所最小値への収束を避けるため、情報付き初期推定法とオプティマイザ法における学習運動量様の挙動を組み込んだ。
関連論文リスト
- A Simulation-Free Deep Learning Approach to Stochastic Optimal Control [12.699529713351287]
最適制御(SOC)における一般問題の解法のためのシミュレーションフリーアルゴリズムを提案する。
既存の手法とは異なり、我々の手法は随伴問題の解を必要としない。
論文 参考訳(メタデータ) (2024-10-07T16:16:53Z) - WANCO: Weak Adversarial Networks for Constrained Optimization problems [5.257895611010853]
まず、拡張ラグランジアン法を用いてミニマックス問題をミニマックス問題に変換する。
次に、それぞれ原始変数と双対変数を表すために、2つの(または複数の)ディープニューラルネットワークを使用します。
ニューラルネットワークのパラメータは、敵のプロセスによって訓練される。
論文 参考訳(メタデータ) (2024-07-04T05:37:48Z) - Learning rate adaptive stochastic gradient descent optimization methods: numerical simulations for deep learning methods for partial differential equations and convergence analyses [5.052293146674794]
標準降下(SGD)最適化法は、学習率が0に収束しない場合、アダムのような加速および適応SGD最適化法が収束しないことが知られている。
本研究では,経験的推定に基づいて学習率を調整するSGD最適化手法の学習速度適応手法を提案し,検討する。
論文 参考訳(メタデータ) (2024-06-20T14:07:39Z) - Large-Scale OD Matrix Estimation with A Deep Learning Method [70.78575952309023]
提案手法は,ディープラーニングと数値最適化アルゴリズムを統合し,行列構造を推論し,数値最適化を導出する。
大規模合成データセットを用いて,提案手法の優れた一般化性能を実証するために実験を行った。
論文 参考訳(メタデータ) (2023-10-09T14:30:06Z) - Lower Bounds and Optimal Algorithms for Smooth and Strongly Convex
Decentralized Optimization Over Time-Varying Networks [79.16773494166644]
通信ネットワークのノード間を分散的に保存するスムーズで強い凸関数の和を最小化するタスクについて検討する。
我々は、これらの下位境界を達成するための2つの最適アルゴリズムを設計する。
我々は,既存の最先端手法と実験的な比較を行うことにより,これらのアルゴリズムの理論的効率を裏付ける。
論文 参考訳(メタデータ) (2021-06-08T15:54:44Z) - Learning Sampling Policy for Faster Derivative Free Optimization [100.27518340593284]
ランダムサンプリングではなく,ZO最適化における摂動を生成するためのサンプリングポリシを学習する,新たな強化学習ベースのZOアルゴリズムを提案する。
その結果,ZO-RLアルゴリズムはサンプリングポリシを学習することでZO勾配の分散を効果的に低減し,既存のZOアルゴリズムよりも高速に収束できることが示唆された。
論文 参考訳(メタデータ) (2021-04-09T14:50:59Z) - Avoiding local minima in Variational Quantum Algorithms with Neural
Networks [0.0]
変分量子アルゴリズムは、短期計算の先導パラダイムとして登場してきた。
本稿では,勾配景観問題の事例をベンチマークする2つのアルゴリズムを提案する。
提案手法は,コストランドスケープが短期量子コンピューティングアルゴリズムを改善するための実りある道であることを示唆している。
論文 参考訳(メタデータ) (2021-04-07T07:07:28Z) - Deep Reinforcement Learning for Field Development Optimization [0.0]
本研究の目的は,畳み込みニューラルネットワーク(CNN)深部強化学習(DRL)アルゴリズムをフィールド開発最適化問題に適用することである。
近似ポリシー最適化 (PPO) アルゴリズムは2つのCNNアーキテクチャで様々な層と構成を持つ。
両ネットワークは、ハイブリッド粒子群最適化(PSO-MADS)アルゴリズムと比較して満足な結果をもたらすポリシーを得た。
論文 参考訳(メタデータ) (2020-08-05T06:26:13Z) - IDEAL: Inexact DEcentralized Accelerated Augmented Lagrangian Method [64.15649345392822]
本稿では,局所関数が滑らかで凸な分散最適化環境下での原始的手法設計のためのフレームワークを提案する。
提案手法は,加速ラグランジアン法により誘導されるサブプロブレム列を概ね解いたものである。
加速度勾配降下と組み合わせることで,収束速度が最適で,最近導出された下界と一致した新しい原始アルゴリズムが得られる。
論文 参考訳(メタデータ) (2020-06-11T18:49:06Z) - Self-Directed Online Machine Learning for Topology Optimization [58.920693413667216]
自己指向型オンライン学習最適化は、ディープニューラルネットワーク(DNN)と有限要素法(FEM)計算を統合している。
本アルゴリズムは, コンプライアンスの最小化, 流体構造最適化, 伝熱促進, トラス最適化の4種類の問題によって検証された。
その結果, 直接使用法と比較して計算時間を2~5桁削減し, 実験で検証した全ての最先端アルゴリズムより優れていた。
論文 参考訳(メタデータ) (2020-02-04T20:00:28Z) - Optimizing Wireless Systems Using Unsupervised and
Reinforced-Unsupervised Deep Learning [96.01176486957226]
無線ネットワークにおけるリソース割り当てとトランシーバーは、通常最適化問題の解決によって設計される。
本稿では,変数最適化と関数最適化の両問題を解くための教師なし・教師なし学習フレームワークを紹介する。
論文 参考訳(メタデータ) (2020-01-03T11:01:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。