論文の概要: Deep Reinforcement Learning for Online Control of Stochastic Partial
Differential Equations
- arxiv url: http://arxiv.org/abs/2110.11265v1
- Date: Thu, 21 Oct 2021 16:45:50 GMT
- ステータス: 処理完了
- システム内更新日: 2021-10-22 20:53:22.025218
- Title: Deep Reinforcement Learning for Online Control of Stochastic Partial
Differential Equations
- Title(参考訳): 確率部分微分方程式のオンライン制御のための深層強化学習
- Authors: Erfan Pirmorad, Faraz Khoshbakhtian, Farnam Mansouri, Amir-massoud
Farahmand
- Abstract要約: 強化学習問題として偏微分方程式を制御する問題を定式化する。
本研究では,高次元状態空間を持つSPDEシステムのオンライン制御のための学習に基づく分散制御手法を提案する。
- 参考スコア(独自算出の注目度): 10.746602033809943
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In many areas, such as the physical sciences, life sciences, and finance,
control approaches are used to achieve a desired goal in complex dynamical
systems governed by differential equations. In this work we formulate the
problem of controlling stochastic partial differential equations (SPDE) as a
reinforcement learning problem. We present a learning-based, distributed
control approach for online control of a system of SPDEs with high dimensional
state-action space using deep deterministic policy gradient method. We tested
the performance of our method on the problem of controlling the stochastic
Burgers' equation, describing a turbulent fluid flow in an infinitely large
domain.
- Abstract(参考訳): 物理科学、生命科学、金融など多くの分野において、制御アプローチは微分方程式によって支配される複雑な力学系において望ましい目標を達成するために用いられる。
本研究では,確率偏微分方程式(spde)を強化学習問題として制御する問題を定式化する。
本稿では,高次元状態動作空間を有するspdシステムのオンライン制御のための,深い決定論的ポリシー勾配法を用いた学習に基づく分散制御手法を提案する。
本研究では, 確率バーガー方程式の制御問題に対して, 無限大領域における乱流を記述する手法の性能を検証した。
関連論文リスト
- Learning Controlled Stochastic Differential Equations [61.82896036131116]
本研究では,非一様拡散を伴う連続多次元非線形微分方程式のドリフト係数と拡散係数の両方を推定する新しい手法を提案する。
我々は、(L2)、(Linfty)の有限サンプル境界や、係数の正則性に適応する学習率を持つリスクメトリクスを含む、強力な理論的保証を提供する。
当社のメソッドはオープンソースPythonライブラリとして利用可能です。
論文 参考訳(メタデータ) (2024-11-04T11:09:58Z) - A Simulation-Free Deep Learning Approach to Stochastic Optimal Control [12.699529713351287]
最適制御(SOC)における一般問題の解法のためのシミュレーションフリーアルゴリズムを提案する。
既存の手法とは異なり、我々の手法は随伴問題の解を必要としない。
論文 参考訳(メタデータ) (2024-10-07T16:16:53Z) - DeepSPoC: A Deep Learning-Based PDE Solver Governed by Sequential Propagation of Chaos [7.808454074695533]
カオスの逐次伝播(SPoC)は,最近開発された平均場微分方程式の解法である。
本稿では,SPoCの相互作用粒子系と深層学習を組み合わせた新しい手法(deepSPoC)を提案する。
高次元問題に対しては、深部SPoCの精度と効率をさらに向上するために空間適応法が設計されている。
論文 参考訳(メタデータ) (2024-08-29T10:02:29Z) - GRAPE optimization for open quantum systems with time-dependent
decoherence rates driven by coherent and incoherent controls [77.34726150561087]
グラディエントアセンセントパルス工学(GRAPE)法は量子制御の最適化に広く用いられている。
我々は、コヒーレント制御と非コヒーレント制御の両方によって駆動されるオープン量子系の目的関数を最適化するために、GRAPE法を採用する。
状態-状態遷移問題に対する数値シミュレーションによりアルゴリズムの効率を実証する。
論文 参考訳(メタデータ) (2023-07-17T13:37:18Z) - Semi-supervised Learning of Partial Differential Operators and Dynamical
Flows [68.77595310155365]
本稿では,超ネットワーク解法とフーリエニューラル演算子アーキテクチャを組み合わせた新しい手法を提案する。
本手法は, 1次元, 2次元, 3次元の非線形流体を含む様々な時間発展PDEを用いて実験を行った。
その結果、新しい手法は、監督点の時点における学習精度を向上し、任意の中間時間にその解を補間できることを示した。
論文 参考訳(メタデータ) (2022-07-28T19:59:14Z) - Physics-constrained Unsupervised Learning of Partial Differential
Equations using Meshes [1.066048003460524]
グラフニューラルネットワークは、不規則にメッシュ化されたオブジェクトを正確に表現し、それらのダイナミクスを学ぶことを約束する。
本研究では、メッシュをグラフとして自然に表現し、グラフネットワークを用いてそれらを処理し、物理に基づく損失を定式化し、偏微分方程式(PDE)の教師なし学習フレームワークを提供する。
本フレームワークは, ソフトボディ変形のモデルベース制御など, PDEソルバをインタラクティブな設定に適用する。
論文 参考訳(メタデータ) (2022-03-30T19:22:56Z) - Deep Learning Approximation of Diffeomorphisms via Linear-Control
Systems [91.3755431537592]
我々は、制御に線形に依存する$dot x = sum_i=1lF_i(x)u_i$という形の制御系を考える。
対応するフローを用いて、コンパクトな点のアンサンブル上の微分同相写像の作用を近似する。
論文 参考訳(メタデータ) (2021-10-24T08:57:46Z) - DySMHO: Data-Driven Discovery of Governing Equations for Dynamical
Systems via Moving Horizon Optimization [77.34726150561087]
本稿では,スケーラブルな機械学習フレームワークである移動水平最適化(DySMHO)による動的システムの発見について紹介する。
DySMHOは、基底関数の大きな辞書から基礎となる支配方程式を逐次学習する。
標準非線形力学系の例は、DySMHOが規則を正確に回復できることを示すために用いられる。
論文 参考訳(メタデータ) (2021-07-30T20:35:03Z) - Learning to Control PDEs with Differentiable Physics [102.36050646250871]
本稿では,ニューラルネットワークが長い時間をかけて複雑な非線形物理系の理解と制御を学べる新しい階層型予測器・相関器手法を提案する。
本手法は,複雑な物理系の理解に成功し,PDEに関わるタスクに対してそれらを制御できることを実証する。
論文 参考訳(メタデータ) (2020-01-21T11:58:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。