Fugu-MT 論文翻訳(概要): Single-step deep reinforcement learning for open-loop control of laminar and turbulent flows

論文の概要: Single-step deep reinforcement learning for open-loop control of laminar and turbulent flows

arxiv url: http://arxiv.org/abs/2006.02979v2
Date: Wed, 24 Mar 2021 14:44:23 GMT
ステータス: 翻訳完了
システム内更新日: 2022-11-25 12:49:29.022204
Title: Single-step deep reinforcement learning for open-loop control of laminar and turbulent flows
Title（参考訳）: 層流と乱流の開ループ制御のための単段深部強化学習
Authors: H. Ghraieb, J. Viquerat, A. Larcher, P. Meliga, E. Hachem
Abstract要約: 本研究は,流体力学系の最適化と制御を支援するための深部強化学習(DRL)技術の能力を評価する。原型ポリシー最適化(PPO)アルゴリズムの新たな"退化"バージョンを組み合わせることで、学習エピソード当たり1回だけシステムを最適化するニューラルネットワークをトレーニングする。
参考スコア（独自算出の注目度）: 0.0
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: This research gauges the ability of deep reinforcement learning (DRL) techniques to assist the optimization and control of fluid mechanical systems. It combines a novel, "degenerate" version of the proximal policy optimization (PPO) algorithm, that trains a neural network in optimizing the system only once per learning episode, and an in-house stabilized finite elements environment implementing the variational multiscale (VMS) method, that computes the numerical reward fed to the neural network. Three prototypical examples of separated flows in two dimensions are used as testbed for developing the methodology, each of which adds a layer of complexity due either to the unsteadiness of the flow solutions, or the sharpness of the objective function, or the dimension of the control parameter space. Relevance is carefully assessed by comparing systematically to reference data obtained by canonical direct and adjoint methods. Beyond adding value to the shallow literature on this subject, these findings establish the potential of single-step PPO for reliable black-box optimization of computational fluid dynamics (CFD) systems, which paves the way for future progress in optimal flow control using this new class of methods.
Abstract（参考訳）: 本研究は,流体力学系の最適化と制御を支援するための深部強化学習(DRL)技術の能力を評価する。これは、学習エピソード毎に1回だけシステムを最適化するためにニューラルネットワークを訓練するproximal policy optimization (ppo)アルゴリズムの新しい「縮退」バージョンと、ニューラルネットワークに供給される数値報酬を計算する変分多スケール(vms)法を実装する内部安定化有限要素環境を組み合わせたものである。 2次元の分離流れの3つの原型的な例は、フロー解の不安定性、目的関数の鋭さ、あるいは制御パラメータ空間の次元によって複雑さの層を付加する手法を開発するためのテストベッドとして用いられる。正準直接法と随伴法で得られた参照データと系統的に比較することにより、関連性を慎重に評価する。これらの結果から,計算流体力学(CFD)システムのブラックボックス最適化のための単一ステップPPOの可能性が確立され,この新たな手法を用いた最適流量制御の今後の進歩の道が開かれた。

関連論文リスト

Iterative Refinement of Flow Policies in Probability Space for Online Reinforcement Learning [56.47948583452555]
固定ステップのEulerスキームによるフローマッチング推論プロセスの離散化は,最適輸送から変化するJordan-Kinderlehrer-Otto原理と整合する,というキーインサイトに基づいて,SWFP(Stepwise Flow Policy)フレームワークを紹介した。 SWFPは、大域的な流れを、プロキシメート分布間の小さな漸進的な変換の列に分解する。この分解は、小さな流れブロックのカスケードを介して事前訓練された流れを微調整する効率的なアルゴリズムを導き、大きな利点をもたらす。
論文参考訳（メタデータ） (2025-10-17T07:43:51Z)
End-to-End Learning Framework for Solving Non-Markovian Optimal Control [9.156265463755807]
本稿では、FOLTIシステムのための革新的なシステム識別方法制御戦略を提案する。また、最初のエンドツーエンドデータ駆動学習フレームワークであるFractional-Order Learning for Optimal Control(FOLOC)も開発しています。
論文参考訳（メタデータ） (2025-02-07T04:18:56Z)
Latent feedback control of distributed systems in multiple scenarios through deep learning-based reduced order models [3.5161229331588095]
高次元分散システムの継続的な監視とリアルタイム制御は、望まれる物理的な振る舞いを保証するためにアプリケーションに不可欠である。完全順序モデルに依存する従来のフィードバック制御設計は、制御計算の遅延のため、これらの要求を満たすことができない。非線形非侵襲的深層学習に基づく還元順序モデル(DL-ROM)により強化されたリアルタイム閉ループ制御戦略を提案する。
論文参考訳（メタデータ） (2024-12-13T08:04:21Z)
MPC of Uncertain Nonlinear Systems with Meta-Learning for Fast Adaptation of Neural Predictive Models [6.031205224945912]
ニューラル状態空間モデル(NSSM)は、ディープエンコーダネットワークがデータから非線形性を学ぶ非線形系を近似するために用いられる。これにより非線形系を潜在空間の線形系に変換し、モデル予測制御(MPC)を用いて効果的な制御動作を決定する。
論文参考訳（メタデータ） (2024-04-18T11:29:43Z)
Large-Scale OD Matrix Estimation with A Deep Learning Method [70.78575952309023]
提案手法は,ディープラーニングと数値最適化アルゴリズムを統合し,行列構造を推論し,数値最適化を導出する。大規模合成データセットを用いて,提案手法の優れた一般化性能を実証するために実験を行った。
論文参考訳（メタデータ） (2023-10-09T14:30:06Z)
Unsupervised Deep Unfolded PGD for Transmit Power Allocation in Wireless Systems [0.6091702876917281]
本稿では,反復射影勾配(PGD)アルゴリズムをニューラルネットワークの層に深く展開し,ステップサイズパラメータを学習する,単純な低複素性TPCアルゴリズムを提案する。高密度デバイス間通信(D2D)における性能評価の結果,提案手法は2回以上の繰り返し回数で反復アルゴリズムよりも優れた性能が得られることがわかった。
論文参考訳（メタデータ） (2023-06-20T19:51:21Z)
Optimization of a Hydrodynamic Computational Reservoir through Evolution [58.720142291102135]
我々は,スタートアップが開発中の流体力学系のモデルと,計算貯水池としてインターフェースする。我々は、進化探索アルゴリズムを用いて、読み出し時間と入力を波の振幅や周波数にどのようにマッピングするかを最適化した。この貯水池システムに進化的手法を適用することで、手作業パラメータを用いた実装と比較して、XNORタスクの分離性が大幅に向上した。
論文参考訳（メタデータ） (2023-04-20T19:15:02Z)
Interval Reachability of Nonlinear Dynamical Systems with Neural Network Controllers [5.543220407902113]
本稿では、ニューラルネットワークコントローラを用いた非線形連続時間力学系の厳密な検証のための区間解析に基づく計算効率の良いフレームワークを提案する。混合単調理論に着想を得て,ニューラルネットワークの包摂関数と開ループシステムの分解関数を用いて,閉ループ力学をより大きなシステムに組み込む。埋め込みシステムの単一軌跡を用いて、到達可能な集合の超矩形超近似を効率的に計算できることが示される。
論文参考訳（メタデータ） (2023-01-19T06:46:36Z)
Semi-supervised Learning of Partial Differential Operators and Dynamical Flows [68.77595310155365]
本稿では,超ネットワーク解法とフーリエニューラル演算子アーキテクチャを組み合わせた新しい手法を提案する。本手法は, 1次元, 2次元, 3次元の非線形流体を含む様々な時間発展PDEを用いて実験を行った。その結果、新しい手法は、監督点の時点における学習精度を向上し、任意の中間時間にその解を補間できることを示した。
論文参考訳（メタデータ） (2022-07-28T19:59:14Z)
Comparative analysis of machine learning methods for active flow control [60.53767050487434]
遺伝的プログラミング(GP)と強化学習(RL)はフロー制御において人気を集めている。この研究は2つの比較分析を行い、地球規模の最適化手法に対して最も代表的なアルゴリズムのいくつかをベンチマークする。
論文参考訳（メタデータ） (2022-02-23T18:11:19Z)
Robust Visual Odometry Using Position-Aware Flow and Geometric Bundle Adjustment [16.04240592057438]
まず,位置認識機構上に構築された新しい光フローネットワーク(PANet)を提案する。そこで本研究では,エゴモーション学習のための典型的なネットワークを使わずに,深度,光学的流れ,エゴモーションを共同で推定するシステムを提案する。実験により,提案システムは深度,流れ,VO推定の点で,他の最先端手法よりも優れていることがわかった。
論文参考訳（メタデータ） (2021-11-22T12:05:27Z)
Efficient Model-Based Multi-Agent Mean-Field Reinforcement Learning [89.31889875864599]
マルチエージェントシステムにおける学習に有効なモデルベース強化学習アルゴリズムを提案する。我々の理論的な貢献は、MFCのモデルベース強化学習における最初の一般的な後悔の限界である。コア最適化問題の実用的なパラメトリゼーションを提供する。
論文参考訳（メタデータ） (2021-07-08T18:01:02Z)
Unsupervised learning of disentangled representations in deep restricted kernel machines with orthogonality constraints [15.296955630621566]
Constr-DRKMは、非教師なしデータ表現の学習のためのディープカーネル手法である。本研究では,不整合特徴学習における提案手法の有効性を定量的に評価する。
論文参考訳（メタデータ） (2020-11-25T11:40:10Z)
An Ode to an ODE [78.97367880223254]
我々は、O(d) 群上の行列フローに応じて主フローの時間依存パラメータが進化する ODEtoODE と呼ばれるニューラルODE アルゴリズムの新しいパラダイムを提案する。この2つの流れのネストされたシステムは、訓練の安定性と有効性を提供し、勾配の消滅・爆発問題を確実に解決する。
論文参考訳（メタデータ） (2020-06-19T22:05:19Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。