Fugu-MT 論文翻訳(概要): Application of deep and reinforcement learning to boundary control problems

論文の概要: Application of deep and reinforcement learning to boundary control problems

arxiv url: http://arxiv.org/abs/2310.15191v1
Date: Sat, 21 Oct 2023 10:56:32 GMT
ステータス: 翻訳完了
システム内更新日: 2023-10-25 22:44:29.260358
Title: Application of deep and reinforcement learning to boundary control problems
Title（参考訳）: 深層・強化学習の境界制御問題への応用
Authors: Zenin Easa Panthakkalakath, Juraj Kardo\v{s}, Olaf Schenk
Abstract要約: 目的は、囲まれたドメインが所望の状態値に達するように、ドメイン境界に対する最適な値を見つけることである。本研究は,ディープラーニングと強化学習による境界制御問題の解決の可能性を探る。
参考スコア（独自算出の注目度）: 0.6906005491572401
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: The boundary control problem is a non-convex optimization and control problem in many scientific domains, including fluid mechanics, structural engineering, and heat transfer optimization. The aim is to find the optimal values for the domain boundaries such that the enclosed domain adhering to the governing equations attains the desired state values. Traditionally, non-linear optimization methods, such as the Interior-Point method (IPM), are used to solve such problems. This project explores the possibilities of using deep learning and reinforcement learning to solve boundary control problems. We adhere to the framework of iterative optimization strategies, employing a spatial neural network to construct well-informed initial guesses, and a spatio-temporal neural network learns the iterative optimization algorithm using policy gradients. Synthetic data, generated from the problems formulated in the literature, is used for training, testing and validation. The numerical experiments indicate that the proposed method can rival the speed and accuracy of existing solvers. In our preliminary results, the network attains costs lower than IPOPT, a state-of-the-art non-linear IPM, in 51\% cases. The overall number of floating point operations in the proposed method is similar to that of IPOPT. Additionally, the informed initial guess method and the learned momentum-like behaviour in the optimizer method are incorporated to avoid convergence to local minima.
Abstract（参考訳）: 境界制御問題は、流体力学、構造工学、伝熱最適化を含む多くの科学領域における非凸最適化と制御問題である。目的は、支配方程式に忠実な囲い領域が所望の状態値を達成するようなドメイン境界に対する最適値を見つけることである。伝統的に、内部点法(IPM)のような非線形最適化法は、そのような問題を解決するために用いられる。このプロジェクトは、境界制御問題を解決するためにディープラーニングと強化学習を使用する可能性を探る。我々は,空間的ニューラルネットワークを用いて適切な初期推定を行う反復最適化戦略の枠組みに固執し,時空間的ニューラルネットワークは方針勾配を用いて反復最適化アルゴリズムを学習する。文献で定式化された問題から生成される合成データは、トレーニング、テスト、検証に使用される。数値実験により,提案手法は既存の解法の速度と精度に匹敵することを示す。予備的な結果では、51\%のケースで、最先端の非線形IPMであるIPOPTよりもコストが低い。提案手法における浮動小数点演算の総数はIPOPTと類似している。さらに、局所最小値への収束を避けるため、情報付き初期推定法とオプティマイザ法における学習運動量様の挙動を組み込んだ。

関連論文リスト

Decentralized Nonconvex Composite Federated Learning with Gradient Tracking and Momentum [78.27945336558987]
分散サーバ(DFL)はクライアント・クライアント・アーキテクチャへの依存をなくす。非滑らかな正規化はしばしば機械学習タスクに組み込まれる。本稿では,これらの問題を解決する新しいDNCFLアルゴリズムを提案する。
論文参考訳（メタデータ） (2025-04-17T08:32:25Z)
Hard constraint learning approaches with trainable influence functions for evolutionary equations [8.812375888020398]
本稿では進化方程式を解くための新しい深層学習手法を開発する。逐次学習戦略は、大きな時間領域を複数のサブインターバルに分割し、時系列順に1つずつ解決する。改良されたハード制約戦略は、時間間隔ノードにおけるPINNソリューションの連続性と滑らかさを厳密に保証する。
論文参考訳（メタデータ） (2025-02-21T07:54:01Z)
PACMANN: Point Adaptive Collocation Method for Artificial Neural Networks [44.99833362998488]
PINNは、一組のコロケーションポイントに対して決定されたPDE残差を含む損失関数を最小化する。これまでの研究では、これらのコロケーションポイントの数と分布がPINNソリューションの精度に大きな影響を与えることが示されている。ニューラルネットワーク(PACMANN)のための点適応コロケーション法を提案する。
論文参考訳（メタデータ） (2024-11-29T11:31:11Z)
A Simulation-Free Deep Learning Approach to Stochastic Optimal Control [12.699529713351287]
最適制御(SOC)における一般問題の解法のためのシミュレーションフリーアルゴリズムを提案する。既存の手法とは異なり、我々の手法は随伴問題の解を必要としない。
論文参考訳（メタデータ） (2024-10-07T16:16:53Z)
WANCO: Weak Adversarial Networks for Constrained Optimization problems [5.257895611010853]
まず、拡張ラグランジアン法を用いてミニマックス問題をミニマックス問題に変換する。次に、それぞれ原始変数と双対変数を表すために、2つの(または複数の)ディープニューラルネットワークを使用します。ニューラルネットワークのパラメータは、敵のプロセスによって訓練される。
論文参考訳（メタデータ） (2024-07-04T05:37:48Z)
Learning rate adaptive stochastic gradient descent optimization methods: numerical simulations for deep learning methods for partial differential equations and convergence analyses [5.052293146674794]
標準降下(SGD)最適化法は、学習率が0に収束しない場合、アダムのような加速および適応SGD最適化法が収束しないことが知られている。本研究では,経験的推定に基づいて学習率を調整するSGD最適化手法の学習速度適応手法を提案し,検討する。
論文参考訳（メタデータ） (2024-06-20T14:07:39Z)
Large-Scale OD Matrix Estimation with A Deep Learning Method [70.78575952309023]
提案手法は,ディープラーニングと数値最適化アルゴリズムを統合し,行列構造を推論し,数値最適化を導出する。大規模合成データセットを用いて,提案手法の優れた一般化性能を実証するために実験を行った。
論文参考訳（メタデータ） (2023-10-09T14:30:06Z)
Lower Bounds and Optimal Algorithms for Smooth and Strongly Convex Decentralized Optimization Over Time-Varying Networks [79.16773494166644]
通信ネットワークのノード間を分散的に保存するスムーズで強い凸関数の和を最小化するタスクについて検討する。我々は、これらの下位境界を達成するための2つの最適アルゴリズムを設計する。我々は,既存の最先端手法と実験的な比較を行うことにより,これらのアルゴリズムの理論的効率を裏付ける。
論文参考訳（メタデータ） (2021-06-08T15:54:44Z)
Learning Sampling Policy for Faster Derivative Free Optimization [100.27518340593284]
ランダムサンプリングではなく,ZO最適化における摂動を生成するためのサンプリングポリシを学習する,新たな強化学習ベースのZOアルゴリズムを提案する。その結果,ZO-RLアルゴリズムはサンプリングポリシを学習することでZO勾配の分散を効果的に低減し,既存のZOアルゴリズムよりも高速に収束できることが示唆された。
論文参考訳（メタデータ） (2021-04-09T14:50:59Z)
Avoiding local minima in Variational Quantum Algorithms with Neural Networks [0.0]
変分量子アルゴリズムは、短期計算の先導パラダイムとして登場してきた。本稿では,勾配景観問題の事例をベンチマークする2つのアルゴリズムを提案する。提案手法は,コストランドスケープが短期量子コンピューティングアルゴリズムを改善するための実りある道であることを示唆している。
論文参考訳（メタデータ） (2021-04-07T07:07:28Z)
Deep Reinforcement Learning for Field Development Optimization [0.0]
本研究の目的は,畳み込みニューラルネットワーク(CNN)深部強化学習(DRL)アルゴリズムをフィールド開発最適化問題に適用することである。近似ポリシー最適化 (PPO) アルゴリズムは2つのCNNアーキテクチャで様々な層と構成を持つ。両ネットワークは、ハイブリッド粒子群最適化(PSO-MADS)アルゴリズムと比較して満足な結果をもたらすポリシーを得た。
論文参考訳（メタデータ） (2020-08-05T06:26:13Z)
IDEAL: Inexact DEcentralized Accelerated Augmented Lagrangian Method [64.15649345392822]
本稿では,局所関数が滑らかで凸な分散最適化環境下での原始的手法設計のためのフレームワークを提案する。提案手法は,加速ラグランジアン法により誘導されるサブプロブレム列を概ね解いたものである。加速度勾配降下と組み合わせることで,収束速度が最適で,最近導出された下界と一致した新しい原始アルゴリズムが得られる。
論文参考訳（メタデータ） (2020-06-11T18:49:06Z)
Self-Directed Online Machine Learning for Topology Optimization [58.920693413667216]
自己指向型オンライン学習最適化は、ディープニューラルネットワーク(DNN)と有限要素法(FEM)計算を統合している。本アルゴリズムは, コンプライアンスの最小化, 流体構造最適化, 伝熱促進, トラス最適化の4種類の問題によって検証された。その結果, 直接使用法と比較して計算時間を2～5桁削減し, 実験で検証した全ての最先端アルゴリズムより優れていた。
論文参考訳（メタデータ） (2020-02-04T20:00:28Z)
Optimizing Wireless Systems Using Unsupervised and Reinforced-Unsupervised Deep Learning [96.01176486957226]
無線ネットワークにおけるリソース割り当てとトランシーバーは、通常最適化問題の解決によって設計される。本稿では,変数最適化と関数最適化の両問題を解くための教師なし・教師なし学習フレームワークを紹介する。
論文参考訳（メタデータ） (2020-01-03T11:01:52Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。