論文の概要: Deep Reinforcement Learning for the Heat Transfer Control of Pulsating
Impinging Jets
- arxiv url: http://arxiv.org/abs/2309.13955v1
- Date: Mon, 25 Sep 2023 08:41:50 GMT
- ステータス: 処理完了
- システム内更新日: 2023-09-26 16:31:09.705810
- Title: Deep Reinforcement Learning for the Heat Transfer Control of Pulsating
Impinging Jets
- Title(参考訳): パルス衝突噴流の熱伝達制御のための深部強化学習
- Authors: Sajad Salavatidezfouli, Giovanni Stabile and Gianluigi Rozza
- Abstract要約: 本研究では,計算流体力学に基づく熱制御における深部強化学習(DRL)の適用性について検討する。
熱制御のためのバニラ深部Q-Network (DQN) 法の有効性と有効性を評価することから始める。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This research study explores the applicability of Deep Reinforcement Learning
(DRL) for thermal control based on Computational Fluid Dynamics. To accomplish
that, the forced convection on a hot plate prone to a pulsating cooling jet
with variable velocity has been investigated. We begin with evaluating the
efficiency and viability of a vanilla Deep Q-Network (DQN) method for thermal
control. Subsequently, a comprehensive comparison between different variants of
DRL is conducted. Soft Double and Duel DQN achieved better thermal control
performance among all the variants due to their efficient learning and action
prioritization capabilities. Results demonstrate that the soft Double DQN
outperforms the hard Double DQN. Moreover, soft Double and Duel can maintain
the temperature in the desired threshold for more than 98% of the control
cycle. These findings demonstrate the promising potential of DRL in effectively
addressing thermal control systems.
- Abstract(参考訳): 本研究では,数値流体力学に基づく熱制御における深部強化学習(DRL)の適用性について検討する。
そこで, 推進冷却ジェットに対する高温板上の強制対流の速度変化について検討した。
熱制御のためのバニラ深部Q-Network(DQN)法の有効性と効率を評価することから始める。
その後、DRLの異なる変種間の包括的比較を行う。
ソフトダブルとデュエルDQNは、効率的な学習と行動優先順位付け能力により、全ての変種で優れた熱制御性能を達成した。
その結果,ソフトダブルDQNはハードダブルDQNよりも優れていた。
さらに、ソフトダブルとデュエルは、制御サイクルの98%以上で所望の閾値の温度を維持することができる。
これらの結果は、DRLが熱制御システムに効果的に対処する可能性を示している。
関連論文リスト
- Experimental evaluation of offline reinforcement learning for HVAC control in buildings [12.542463083734614]
建物における動的HVAC制御のために, 強化学習(RL)技術がますます研究されている。
本稿では,最先端のオフラインRLアルゴリズムの長所と短所を包括的に評価する。
論文 参考訳(メタデータ) (2024-08-15T07:25:52Z) - Dynamic Temperature Knowledge Distillation [9.6046915661065]
知識蒸留(KD)領域におけるラベルソフトネスの調整における温度の役割
従来のアプローチでは、KDプロセス全体を通して静的な温度を用いることが多い。
本研究では,教師モデルと学生モデルの両方に対して,動的かつ協調的な温度制御を同時に導入する動的温度知識蒸留(DTKD)を提案する。
論文 参考訳(メタデータ) (2024-04-19T08:40:52Z) - Function Approximation for Reinforcement Learning Controller for Energy from Spread Waves [69.9104427437916]
マルチジェネレータ・ウェーブ・エナジー・コンバータ(WEC)は、スプレッド・ウェーブと呼ばれる異なる方向から来る複数の同時波を処理しなければならない。
これらの複雑な装置は、エネルギー捕獲効率、維持を制限する構造的ストレスの低減、高波に対する積極的な保護という複数の目的を持つコントローラを必要とする。
本稿では,システム力学のシーケンシャルな性質をモデル化する上で,ポリシーと批判ネットワークの異なる機能近似について検討する。
論文 参考訳(メタデータ) (2024-04-17T02:04:10Z) - DistiLLM: Towards Streamlined Distillation for Large Language Models [53.46759297929675]
DistiLLMは自動回帰言語モデルのためのより効率的で効率的なKDフレームワークである。
DisiLLMは,(1)新しいスキューKulback-Leibler分散損失,(2)学生生成出力の効率向上を目的とした適応型オフ政治アプローチの2つのコンポーネントから構成される。
論文 参考訳(メタデータ) (2024-02-06T11:10:35Z) - An experimental evaluation of Deep Reinforcement Learning algorithms for HVAC control [40.71019623757305]
近年の研究では、Deep Reinforcement Learning (DRL)アルゴリズムが従来のリアクティブコントローラより優れていることが示されている。
本稿では,HVAC制御のためのいくつかの最先端DRLアルゴリズムについて,批判的かつ再現可能な評価を行う。
論文 参考訳(メタデータ) (2024-01-11T08:40:26Z) - Generation of C-NOT, SWAP, and C-Z Gates for Two Qubits Using Coherent
and Incoherent Controls and Stochastic Optimization [56.47577824219207]
我々は、Gorini-Kossakowsky-Sudarchhan-Lindblad型マスター方程式によって決定される開量子系の力学の一般的な形式を考える。
我々は,2ビットのC-NOT,SWAP,C-Zゲートを生成する際の制御問題を,一括定数制御と最適化を用いて解析する。
論文 参考訳(メタデータ) (2023-12-09T17:55:47Z) - Temperature Balancing, Layer-wise Weight Analysis, and Neural Network
Training [58.20089993899729]
本稿では,直感的で効果的な階層学習手法であるTempBalanceを提案する。
我々は、TempBalanceが通常のSGDと注意深く調整されたスペクトルノルム正規化より著しく優れていることを示す。
また、TempBalanceは最先端のメトリクスやスケジューラよりも優れています。
論文 参考訳(メタデータ) (2023-12-01T05:38:17Z) - Deep Reinforcement Learning for Heat Pump Control [0.0]
本研究は, 模擬環境下でのヒートポンプ制御に深部強化学習を適用した。
MPCのような性能を実現するためにDRLをモデルフリーで適用できることが示せる。
論文 参考訳(メタデータ) (2022-12-24T11:24:08Z) - Causal Inference Q-Network: Toward Resilient Reinforcement Learning [57.96312207429202]
観測干渉を有する弾力性のあるDRLフレームワークを検討する。
本稿では、因果推論Q-network (CIQ) と呼ばれる因果推論に基づくDRLアルゴリズムを提案する。
実験の結果,提案手法は観測干渉に対して高い性能と高反発性を実現することができた。
論文 参考訳(メタデータ) (2021-02-18T23:50:20Z) - Towards Optimal District Heating Temperature Control in China with Deep
Reinforcement Learning [0.0]
室内温度を予測するために,シミュレーションデータに基づくリカレントニューラルネットワークを構築した。
このモデルは、供給水温の最適制御のために、2つのDRLエージェントを専門家の指導なしに訓練するために使用される。
論文 参考訳(メタデータ) (2020-12-17T11:16:08Z) - Controlling Rayleigh-B\'enard convection via Reinforcement Learning [62.997667081978825]
固定外熱勾配下での対流熱交換を抑制または促進するための効果的な制御戦略の同定は、重要な基本的かつ技術的問題である。
本研究では,最先端の強化学習(RL)アルゴリズムに基づく新しい手法を提案する。
我々のRL制御は導電系を安定させ、対流の開始をレイリー数にすることができることを示す。
論文 参考訳(メタデータ) (2020-03-31T16:39:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。