論文の概要: Single-step deep reinforcement learning for open-loop control of laminar
and turbulent flows
- arxiv url: http://arxiv.org/abs/2006.02979v2
- Date: Wed, 24 Mar 2021 14:44:23 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-25 12:49:29.022204
- Title: Single-step deep reinforcement learning for open-loop control of laminar
and turbulent flows
- Title(参考訳): 層流と乱流の開ループ制御のための単段深部強化学習
- Authors: H. Ghraieb, J. Viquerat, A. Larcher, P. Meliga, E. Hachem
- Abstract要約: 本研究は,流体力学系の最適化と制御を支援するための深部強化学習(DRL)技術の能力を評価する。
原型ポリシー最適化(PPO)アルゴリズムの新たな"退化"バージョンを組み合わせることで、学習エピソード当たり1回だけシステムを最適化するニューラルネットワークをトレーニングする。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This research gauges the ability of deep reinforcement learning (DRL)
techniques to assist the optimization and control of fluid mechanical systems.
It combines a novel, "degenerate" version of the proximal policy optimization
(PPO) algorithm, that trains a neural network in optimizing the system only
once per learning episode, and an in-house stabilized finite elements
environment implementing the variational multiscale (VMS) method, that computes
the numerical reward fed to the neural network. Three prototypical examples of
separated flows in two dimensions are used as testbed for developing the
methodology, each of which adds a layer of complexity due either to the
unsteadiness of the flow solutions, or the sharpness of the objective function,
or the dimension of the control parameter space. Relevance is carefully
assessed by comparing systematically to reference data obtained by canonical
direct and adjoint methods. Beyond adding value to the shallow literature on
this subject, these findings establish the potential of single-step PPO for
reliable black-box optimization of computational fluid dynamics (CFD) systems,
which paves the way for future progress in optimal flow control using this new
class of methods.
- Abstract(参考訳): 本研究は,流体力学系の最適化と制御を支援するための深部強化学習(DRL)技術の能力を評価する。
これは、学習エピソード毎に1回だけシステムを最適化するためにニューラルネットワークを訓練するproximal policy optimization (ppo)アルゴリズムの新しい「縮退」バージョンと、ニューラルネットワークに供給される数値報酬を計算する変分多スケール(vms)法を実装する内部安定化有限要素環境を組み合わせたものである。
2次元の分離流れの3つの原型的な例は、フロー解の不安定性、目的関数の鋭さ、あるいは制御パラメータ空間の次元によって複雑さの層を付加する手法を開発するためのテストベッドとして用いられる。
正準直接法と随伴法で得られた参照データと系統的に比較することにより、関連性を慎重に評価する。
これらの結果から,計算流体力学(CFD)システムのブラックボックス最適化のための単一ステップPPOの可能性が確立され,この新たな手法を用いた最適流量制御の今後の進歩の道が開かれた。
関連論文リスト
- MPC of Uncertain Nonlinear Systems with Meta-Learning for Fast Adaptation of Neural Predictive Models [6.031205224945912]
ニューラル状態空間モデル(NSSM)は、ディープエンコーダネットワークがデータから非線形性を学ぶ非線形系を近似するために用いられる。
これにより非線形系を潜在空間の線形系に変換し、モデル予測制御(MPC)を用いて効果的な制御動作を決定する。
論文 参考訳(メタデータ) (2024-04-18T11:29:43Z) - Large-Scale OD Matrix Estimation with A Deep Learning Method [70.78575952309023]
提案手法は,ディープラーニングと数値最適化アルゴリズムを統合し,行列構造を推論し,数値最適化を導出する。
大規模合成データセットを用いて,提案手法の優れた一般化性能を実証するために実験を行った。
論文 参考訳(メタデータ) (2023-10-09T14:30:06Z) - Unsupervised Deep Unfolded PGD for Transmit Power Allocation in Wireless
Systems [0.6091702876917281]
本稿では,反復射影勾配(PGD)アルゴリズムをニューラルネットワークの層に深く展開し,ステップサイズパラメータを学習する,単純な低複素性TPCアルゴリズムを提案する。
高密度デバイス間通信(D2D)における性能評価の結果,提案手法は2回以上の繰り返し回数で反復アルゴリズムよりも優れた性能が得られることがわかった。
論文 参考訳(メタデータ) (2023-06-20T19:51:21Z) - Optimization of a Hydrodynamic Computational Reservoir through Evolution [58.720142291102135]
我々は,スタートアップが開発中の流体力学系のモデルと,計算貯水池としてインターフェースする。
我々は、進化探索アルゴリズムを用いて、読み出し時間と入力を波の振幅や周波数にどのようにマッピングするかを最適化した。
この貯水池システムに進化的手法を適用することで、手作業パラメータを用いた実装と比較して、XNORタスクの分離性が大幅に向上した。
論文 参考訳(メタデータ) (2023-04-20T19:15:02Z) - Interval Reachability of Nonlinear Dynamical Systems with Neural Network
Controllers [5.543220407902113]
本稿では、ニューラルネットワークコントローラを用いた非線形連続時間力学系の厳密な検証のための区間解析に基づく計算効率の良いフレームワークを提案する。
混合単調理論に着想を得て,ニューラルネットワークの包摂関数と開ループシステムの分解関数を用いて,閉ループ力学をより大きなシステムに組み込む。
埋め込みシステムの単一軌跡を用いて、到達可能な集合の超矩形超近似を効率的に計算できることが示される。
論文 参考訳(メタデータ) (2023-01-19T06:46:36Z) - Semi-supervised Learning of Partial Differential Operators and Dynamical
Flows [68.77595310155365]
本稿では,超ネットワーク解法とフーリエニューラル演算子アーキテクチャを組み合わせた新しい手法を提案する。
本手法は, 1次元, 2次元, 3次元の非線形流体を含む様々な時間発展PDEを用いて実験を行った。
その結果、新しい手法は、監督点の時点における学習精度を向上し、任意の中間時間にその解を補間できることを示した。
論文 参考訳(メタデータ) (2022-07-28T19:59:14Z) - Comparative analysis of machine learning methods for active flow control [60.53767050487434]
遺伝的プログラミング(GP)と強化学習(RL)はフロー制御において人気を集めている。
この研究は2つの比較分析を行い、地球規模の最適化手法に対して最も代表的なアルゴリズムのいくつかをベンチマークする。
論文 参考訳(メタデータ) (2022-02-23T18:11:19Z) - Robust Visual Odometry Using Position-Aware Flow and Geometric Bundle
Adjustment [16.04240592057438]
まず,位置認識機構上に構築された新しい光フローネットワーク(PANet)を提案する。
そこで本研究では,エゴモーション学習のための典型的なネットワークを使わずに,深度,光学的流れ,エゴモーションを共同で推定するシステムを提案する。
実験により,提案システムは深度,流れ,VO推定の点で,他の最先端手法よりも優れていることがわかった。
論文 参考訳(メタデータ) (2021-11-22T12:05:27Z) - Efficient Model-Based Multi-Agent Mean-Field Reinforcement Learning [89.31889875864599]
マルチエージェントシステムにおける学習に有効なモデルベース強化学習アルゴリズムを提案する。
我々の理論的な貢献は、MFCのモデルベース強化学習における最初の一般的な後悔の限界である。
コア最適化問題の実用的なパラメトリゼーションを提供する。
論文 参考訳(メタデータ) (2021-07-08T18:01:02Z) - Unsupervised learning of disentangled representations in deep restricted
kernel machines with orthogonality constraints [15.296955630621566]
Constr-DRKMは、非教師なしデータ表現の学習のためのディープカーネル手法である。
本研究では,不整合特徴学習における提案手法の有効性を定量的に評価する。
論文 参考訳(メタデータ) (2020-11-25T11:40:10Z) - An Ode to an ODE [78.97367880223254]
我々は、O(d) 群上の行列フローに応じて主フローの時間依存パラメータが進化する ODEtoODE と呼ばれるニューラルODE アルゴリズムの新しいパラダイムを提案する。
この2つの流れのネストされたシステムは、訓練の安定性と有効性を提供し、勾配の消滅・爆発問題を確実に解決する。
論文 参考訳(メタデータ) (2020-06-19T22:05:19Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。