論文の概要: Controlling Rayleigh-B\'enard convection via Reinforcement Learning
- arxiv url: http://arxiv.org/abs/2003.14358v1
- Date: Tue, 31 Mar 2020 16:39:25 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-18 01:59:51.928971
- Title: Controlling Rayleigh-B\'enard convection via Reinforcement Learning
- Title(参考訳): 強化学習によるrayleigh-b\'enard対流制御
- Authors: Gerben Beintema, Alessandro Corbetta, Luca Biferale, Federico Toschi
- Abstract要約: 固定外熱勾配下での対流熱交換を抑制または促進するための効果的な制御戦略の同定は、重要な基本的かつ技術的問題である。
本研究では,最先端の強化学習(RL)アルゴリズムに基づく新しい手法を提案する。
我々のRL制御は導電系を安定させ、対流の開始をレイリー数にすることができることを示す。
- 参考スコア(独自算出の注目度): 62.997667081978825
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Thermal convection is ubiquitous in nature as well as in many industrial
applications. The identification of effective control strategies to, e.g.,
suppress or enhance the convective heat exchange under fixed external thermal
gradients is an outstanding fundamental and technological issue. In this work,
we explore a novel approach, based on a state-of-the-art Reinforcement Learning
(RL) algorithm, which is capable of significantly reducing the heat transport
in a two-dimensional Rayleigh-B\'enard system by applying small temperature
fluctuations to the lower boundary of the system. By using numerical
simulations, we show that our RL-based control is able to stabilize the
conductive regime and bring the onset of convection up to a Rayleigh number
$Ra_c \approx 3 \cdot 10^4$, whereas in the uncontrolled case it holds
$Ra_{c}=1708$. Additionally, for $Ra > 3 \cdot 10^4$, our approach outperforms
other state-of-the-art control algorithms reducing the heat flux by a factor of
about $2.5$. In the last part of the manuscript, we address theoretical limits
connected to controlling an unstable and chaotic dynamics as the one considered
here. We show that controllability is hindered by observability and/or
capabilities of actuating actions, which can be quantified in terms of
characteristic time delays. When these delays become comparable with the
Lyapunov time of the system, control becomes impossible.
- Abstract(参考訳): 熱対流は自然界でも多くの工業用途でも広く見られる。
対流熱交換を一定温度勾配下で抑制または強化する効果的な制御戦略の特定は、基礎的かつ技術的に優れた課題である。
本研究では,2次元レイリー・b・エナード系における熱輸送を,低温度ゆらぎをシステムの下部境界に適用することにより著しく低減できる,最先端の強化学習(rl)アルゴリズムに基づく新しい手法を検討する。
数値シミュレーションにより、我々のRL制御は導電系を安定させ、対流の開始をレイリー数$Ra_c \approx 3 \cdot 10^4$にすることができるが、制御されていない場合には$Ra_{c}=1708$であることを示す。
さらに、$Ra > 3 \cdot 10^4$の場合、我々の手法は他の最先端制御アルゴリズムよりも2.5ドル程度の熱フラックスを低減できる。
原稿の最後の部分では、ここで考えるように不安定でカオス的なダイナミクスを制御することに関連する理論的限界を取り上げている。
制御性は可観測性とアクティベーション動作の能力によって阻害され,特性的時間遅延によって定量化できることを示した。
これらの遅延がシステムのリャプノフ時間に匹敵すると、制御は不可能になる。
関連論文リスト
- Dicke superradiant enhancement of the heat current in circuit QED [0.0]
Dicke superradiant emissionのような集団効果は、量子デバイスの性能を高めることができる。
本研究では, 冷湯と熱湯の間に流れる熱流を, N$ qubitsのアンサンブルを通して調査した。
論文 参考訳(メタデータ) (2024-01-30T22:06:37Z) - Demand response for residential building heating: Effective Monte Carlo
Tree Search control based on physics-informed neural networks [4.573008040057806]
需要応答(DR)による建物内のエネルギー消費の制御は、世界的な二酸化炭素排出量の削減と気候変動の抑制のためにますます重要になっている。
この分野の最近の研究は、モデルベース制御(例えば、モデル予測制御(MPC)や、実用的なDRアルゴリズムを実装するためのモデルフリー強化学習(RL)に重点を置いている。
本稿では,要求応答構築のためのMCTSについて検討し,DR制御問題に対する候補として有望であることを示す。
論文 参考訳(メタデータ) (2023-12-06T09:06:14Z) - Optimization of Time-Dependent Decoherence Rates and Coherent Control
for a Qutrit System [77.34726150561087]
非コヒーレント制御は、特定の制御方法で時間に応じてデコヒーレンス率を決定する。
我々は、システムの最終状態$rho(T)$と与えられたターゲット状態$rho_rmターゲットとの間のヒルベルト・シュミットの重なりを最大化する問題を考察する。
論文 参考訳(メタデータ) (2023-08-08T01:28:50Z) - Bayesian estimation for collisional thermometry and time-optimal
holonomic quantum computation [0.0]
前半では、量子温度測定の問題にベイズ形式がどう導入できるかを考察する。
論文の最後の部分では、非断熱的ホロノミック計算の問題にアプローチする。
論文 参考訳(メタデータ) (2023-07-16T17:46:13Z) - Genetically-inspired convective heat transfer enhancement in a turbulent
boundary layer [0.0]
平板上の乱流境界層(TBL)における対流熱伝達を人工知能を用いて促進する。
アクチュエータは、フリーストリームに整列した6つのスロットジェットの集合である。
制御法則は、未飽和のTBLと定常ジェットによる作動に関して最適化される。
論文 参考訳(メタデータ) (2023-04-25T07:28:32Z) - Direct data-driven forecast of local turbulent heat flux in
Rayleigh-B\'{e}nard convection [0.0]
Prandtl number $rm Pr=7$とRayleigh number $rm Ra=107$の2次元乱流Rayleigh-B'enard対流
縮小潜在データ空間における流れデータの時間進行に2つの繰り返しニューラルネットワークを適用する。
12層を隠蔽した畳み込み自己エンコーダは、乱流データの次元を元の大きさの0.2%まで縮めることができる。
論文 参考訳(メタデータ) (2022-02-26T12:39:19Z) - Finite-time System Identification and Adaptive Control in Autoregressive
Exogenous Systems [79.67879934935661]
未知のARXシステムのシステム識別と適応制御の問題について検討する。
我々は,オープンループとクローズループの両方のデータ収集の下で,ARXシステムに対する有限時間学習保証を提供する。
論文 参考訳(メタデータ) (2021-08-26T18:00:00Z) - Regret-optimal Estimation and Control [52.28457815067461]
後悔最適推定器と後悔最適制御器は状態空間形式で導出可能であることを示す。
非線形力学系に対するモデル予測制御(MPC)と拡張KalmanFilter(EKF)の残差最適類似性を提案する。
論文 参考訳(メタデータ) (2021-06-22T23:14:21Z) - Adaptive Control and Regret Minimization in Linear Quadratic Gaussian
(LQG) Setting [91.43582419264763]
我々は不確実性に直面した楽観主義の原理に基づく新しい強化学習アルゴリズムLqgOptを提案する。
LqgOptはシステムのダイナミクスを効率的に探索し、モデルのパラメータを信頼区間まで推定し、最も楽観的なモデルのコントローラをデプロイする。
論文 参考訳(メタデータ) (2020-03-12T19:56:38Z) - NeurOpt: Neural network based optimization for building energy
management and climate control [58.06411999767069]
モデル同定のコストを削減するために,ニューラルネットワークに基づくデータ駆動制御アルゴリズムを提案する。
イタリアにある10の独立したゾーンを持つ2階建ての建物で、学習と制御のアルゴリズムを検証する。
論文 参考訳(メタデータ) (2020-01-22T00:51:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。