論文の概要: Controlling Rayleigh-B\'enard convection via Reinforcement Learning
- arxiv url: http://arxiv.org/abs/2003.14358v1
- Date: Tue, 31 Mar 2020 16:39:25 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-18 01:59:51.928971
- Title: Controlling Rayleigh-B\'enard convection via Reinforcement Learning
- Title(参考訳): 強化学習によるrayleigh-b\'enard対流制御
- Authors: Gerben Beintema, Alessandro Corbetta, Luca Biferale, Federico Toschi
- Abstract要約: 固定外熱勾配下での対流熱交換を抑制または促進するための効果的な制御戦略の同定は、重要な基本的かつ技術的問題である。
本研究では,最先端の強化学習(RL)アルゴリズムに基づく新しい手法を提案する。
我々のRL制御は導電系を安定させ、対流の開始をレイリー数にすることができることを示す。
- 参考スコア(独自算出の注目度): 62.997667081978825
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Thermal convection is ubiquitous in nature as well as in many industrial
applications. The identification of effective control strategies to, e.g.,
suppress or enhance the convective heat exchange under fixed external thermal
gradients is an outstanding fundamental and technological issue. In this work,
we explore a novel approach, based on a state-of-the-art Reinforcement Learning
(RL) algorithm, which is capable of significantly reducing the heat transport
in a two-dimensional Rayleigh-B\'enard system by applying small temperature
fluctuations to the lower boundary of the system. By using numerical
simulations, we show that our RL-based control is able to stabilize the
conductive regime and bring the onset of convection up to a Rayleigh number
$Ra_c \approx 3 \cdot 10^4$, whereas in the uncontrolled case it holds
$Ra_{c}=1708$. Additionally, for $Ra > 3 \cdot 10^4$, our approach outperforms
other state-of-the-art control algorithms reducing the heat flux by a factor of
about $2.5$. In the last part of the manuscript, we address theoretical limits
connected to controlling an unstable and chaotic dynamics as the one considered
here. We show that controllability is hindered by observability and/or
capabilities of actuating actions, which can be quantified in terms of
characteristic time delays. When these delays become comparable with the
Lyapunov time of the system, control becomes impossible.
- Abstract(参考訳): 熱対流は自然界でも多くの工業用途でも広く見られる。
対流熱交換を一定温度勾配下で抑制または強化する効果的な制御戦略の特定は、基礎的かつ技術的に優れた課題である。
本研究では,2次元レイリー・b・エナード系における熱輸送を,低温度ゆらぎをシステムの下部境界に適用することにより著しく低減できる,最先端の強化学習(rl)アルゴリズムに基づく新しい手法を検討する。
数値シミュレーションにより、我々のRL制御は導電系を安定させ、対流の開始をレイリー数$Ra_c \approx 3 \cdot 10^4$にすることができるが、制御されていない場合には$Ra_{c}=1708$であることを示す。
さらに、$Ra > 3 \cdot 10^4$の場合、我々の手法は他の最先端制御アルゴリズムよりも2.5ドル程度の熱フラックスを低減できる。
原稿の最後の部分では、ここで考えるように不安定でカオス的なダイナミクスを制御することに関連する理論的限界を取り上げている。
制御性は可観測性とアクティベーション動作の能力によって阻害され,特性的時間遅延によって定量化できることを示した。
これらの遅延がシステムのリャプノフ時間に匹敵すると、制御は不可能になる。
関連論文リスト
- Provably Efficient Action-Manipulation Attack Against Continuous Reinforcement Learning [49.48615590763914]
我々は,モンテカルロ木探索法を用いて効率的な行動探索と操作を行うLCBTというブラックボックス攻撃アルゴリズムを提案する。
提案手法は, DDPG, PPO, TD3の3つの攻撃的アルゴリズムに対して, 連続的な設定で実行し, 攻撃性能が期待できることを示す。
論文 参考訳(メタデータ) (2024-11-20T08:20:29Z) - Multi-agent reinforcement learning for the control of three-dimensional Rayleigh-Bénard convection [0.7864304771129751]
マルチエージェントRL (MARL) は単一エージェントRLよりも局所性および翻訳的不変性を示すフローを制御するのに有効であることが示されている。
MARLによる3次元レイリー・ブエナード対流の制御の実装を初めて提示する。
論文 参考訳(メタデータ) (2024-07-31T12:41:20Z) - Dicke superradiant enhancement of the heat current in circuit QED [0.0]
Dicke superradiant emissionのような集団効果は、量子デバイスの性能を高めることができる。
本研究では, 冷湯と熱湯の間に流れる熱流を, N$ qubitsのアンサンブルを通して調査した。
論文 参考訳(メタデータ) (2024-01-30T22:06:37Z) - Demand response for residential building heating: Effective Monte Carlo Tree Search control based on physics-informed neural networks [4.1860949813005375]
本稿では,住宅の暖房システムのエネルギー消費を抑えるために,需要応答(DR)アルゴリズムを用いることに焦点をあてる。
そのようなRL手法の1つはMCTS(Monte Carlo Tree Search)であり、ボードゲーム(ゴー、チェス)で素晴らしい成功を収めている。
論文 参考訳(メタデータ) (2023-12-06T09:06:14Z) - Genetically-inspired convective heat transfer enhancement in a turbulent
boundary layer [0.0]
平板上の乱流境界層(TBL)における対流熱伝達を人工知能を用いて促進する。
アクチュエータは、フリーストリームに整列した6つのスロットジェットの集合である。
制御法則は、未飽和のTBLと定常ジェットによる作動に関して最適化される。
論文 参考訳(メタデータ) (2023-04-25T07:28:32Z) - Direct data-driven forecast of local turbulent heat flux in
Rayleigh-B\'{e}nard convection [0.0]
Prandtl number $rm Pr=7$とRayleigh number $rm Ra=107$の2次元乱流Rayleigh-B'enard対流
縮小潜在データ空間における流れデータの時間進行に2つの繰り返しニューラルネットワークを適用する。
12層を隠蔽した畳み込み自己エンコーダは、乱流データの次元を元の大きさの0.2%まで縮めることができる。
論文 参考訳(メタデータ) (2022-02-26T12:39:19Z) - Finite-time System Identification and Adaptive Control in Autoregressive
Exogenous Systems [79.67879934935661]
未知のARXシステムのシステム識別と適応制御の問題について検討する。
我々は,オープンループとクローズループの両方のデータ収集の下で,ARXシステムに対する有限時間学習保証を提供する。
論文 参考訳(メタデータ) (2021-08-26T18:00:00Z) - Regret-optimal Estimation and Control [52.28457815067461]
後悔最適推定器と後悔最適制御器は状態空間形式で導出可能であることを示す。
非線形力学系に対するモデル予測制御(MPC)と拡張KalmanFilter(EKF)の残差最適類似性を提案する。
論文 参考訳(メタデータ) (2021-06-22T23:14:21Z) - Adaptive Control and Regret Minimization in Linear Quadratic Gaussian
(LQG) Setting [91.43582419264763]
我々は不確実性に直面した楽観主義の原理に基づく新しい強化学習アルゴリズムLqgOptを提案する。
LqgOptはシステムのダイナミクスを効率的に探索し、モデルのパラメータを信頼区間まで推定し、最も楽観的なモデルのコントローラをデプロイする。
論文 参考訳(メタデータ) (2020-03-12T19:56:38Z) - NeurOpt: Neural network based optimization for building energy
management and climate control [58.06411999767069]
モデル同定のコストを削減するために,ニューラルネットワークに基づくデータ駆動制御アルゴリズムを提案する。
イタリアにある10の独立したゾーンを持つ2階建ての建物で、学習と制御のアルゴリズムを検証する。
論文 参考訳(メタデータ) (2020-01-22T00:51:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。