論文の概要: Semi-analytical Industrial Cooling System Model for Reinforcement
Learning
- arxiv url: http://arxiv.org/abs/2207.13131v1
- Date: Tue, 26 Jul 2022 18:19:17 GMT
- ステータス: 処理完了
- システム内更新日: 2022-07-28 13:11:12.921477
- Title: Semi-analytical Industrial Cooling System Model for Reinforcement
Learning
- Title(参考訳): 強化学習のための半分析的産業冷却システムモデル
- Authors: Yuri Chervonyi, Praneet Dutta, Piotr Trochim, Octavian Voicu, Cosmin
Paduraru, Crystal Qian, Emre Karagozler, Jared Quincy Davis, Richard
Chippendale, Gautam Bajaj, Sims Witherspoon, Jerry Luo
- Abstract要約: 多物理シミュレーションに解析解を埋め込んだハイブリッド産業用冷却システムモデルを提案する。
モデルの忠実度は,大規模冷却システムによる実世界のデータに対して評価される。
- 参考スコア(独自算出の注目度): 4.272330410469061
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We present a hybrid industrial cooling system model that embeds analytical
solutions within a multi-physics simulation. This model is designed for
reinforcement learning (RL) applications and balances simplicity with
simulation fidelity and interpretability. The model's fidelity is evaluated
against real world data from a large scale cooling system. This is followed by
a case study illustrating how the model can be used for RL research. For this,
we develop an industrial task suite that allows specifying different problem
settings and levels of complexity, and use it to evaluate the performance of
different RL algorithms.
- Abstract(参考訳): 多物理シミュレーションに解析解を埋め込んだハイブリッド産業用冷却システムモデルを提案する。
このモデルは強化学習(RL)応用のために設計され、シミュレーションの忠実度と解釈可能性とのバランスをとる。
モデルの忠実度は,大規模冷却システムによる実世界のデータに対して評価される。
続いて、RL研究にモデルをどのように使用できるかを示すケーススタディがある。
そこで本研究では,異なる問題設定と複雑性レベルを指定可能な産業用タスクスイートを開発し,それを用いてRLアルゴリズムの性能評価を行う。
関連論文リスト
- HarmonyDream: Task Harmonization Inside World Models [93.07314830304193]
モデルベース強化学習(MBRL)は、サンプル効率の学習を約束する。
本稿では,タスク調和性を維持するために損失係数を自動的に調整する,シンプルで効果的なアプローチであるHarmonyDreamを提案する。
論文 参考訳(メタデータ) (2023-09-30T11:38:13Z) - Learning a model is paramount for sample efficiency in reinforcement
learning control of PDEs [5.488334211013093]
RLエージェントの訓練と並行して動作モデルを学ぶことで,実システムからサンプリングしたデータ量を大幅に削減できることを示す。
また、RLトレーニングのバイアスを避けるために、モデルを反復的に更新することが重要であることも示している。
論文 参考訳(メタデータ) (2023-02-14T16:14:39Z) - SAM-RL: Sensing-Aware Model-Based Reinforcement Learning via
Differentiable Physics-Based Simulation and Rendering [49.78647219715034]
本稿では,SAM-RL と呼ばれる感性認識モデルに基づく強化学習システムを提案する。
SAM-RLは、センサーを意識した学習パイプラインによって、ロボットがタスクプロセスを監視するための情報的視点を選択することを可能にする。
我々は,ロボット組立,ツール操作,変形可能なオブジェクト操作という3つの操作タスクを達成するための実世界の実験に,我々のフレームワークを適用した。
論文 参考訳(メタデータ) (2022-10-27T05:30:43Z) - Variational multiscale reinforcement learning for discovering reduced
order closure models of nonlinear spatiotemporal transport systems [0.0]
閉包モデルは、多くの非線形力学系において、順序表現の減少による損失を考慮に入れるのに一般的である。
本研究では,ガレルキン射影に基づく縮小順序モデルの安定化を目的とした動的閉包モデルと探索フレームワークを提案する。
まず、モード依存クロージャポリシーを発見するためのマルチモーダルRL(MMRL)を提案する。
次に,報奨関数の設計において,高忠実度データへのアクセスを必要とせずに閉包モデルを発見するために,変分多スケールRL (VMRL) アプローチを定式化する。
論文 参考訳(メタデータ) (2022-07-07T19:58:47Z) - Extending Process Discovery with Model Complexity Optimization and
Cyclic States Identification: Application to Healthcare Processes [62.997667081978825]
モデル最適化のための半自動支援を実現するプロセスマイニング手法を提案する。
所望の粒度で生モデルを抽象化するモデル単純化手法が提案されている。
医療分野の異なるアプリケーションから得られた3つのデータセットを用いて、技術的ソリューションの能力を実証することを目的としている。
論文 参考訳(メタデータ) (2022-06-10T16:20:59Z) - Using scientific machine learning for experimental bifurcation analysis
of dynamic systems [2.204918347869259]
本研究は、極限サイクルを持つ物理非線形力学系に対する普遍微分方程式(UDE)モデルの訓練に焦点をあてる。
数値シミュレーションによりトレーニングデータを生成する例を考察するとともに,提案するモデリング概念を物理実験に適用する。
ニューラルネットワークとガウス過程の両方を、力学モデルと共に普遍近似器として使用し、UDEモデリングアプローチの正確性と堅牢性を批判的に評価する。
論文 参考訳(メタデータ) (2021-10-22T15:43:03Z) - Reinforcement Learning as One Big Sequence Modeling Problem [84.84564880157149]
強化学習(Reinforcement Learning, RL)は、通常、単一ステップポリシーや単一ステップモデルの推定に関係している。
我々は、RLをシーケンスモデリング問題とみなし、高い報酬のシーケンスにつながる一連のアクションを予測することを目標としている。
論文 参考訳(メタデータ) (2021-06-03T17:58:51Z) - Bellman: A Toolbox for Model-Based Reinforcement Learning in TensorFlow [14.422129911404472]
Bellmanはこのギャップを埋めることを目指しており、モデルベースのRLツールボックスを初めて完全に設計し、テストした。
我々のモジュラーアプローチは、幅広い環境モデルと、最先端アルゴリズムを復元する汎用モデルベースのエージェントクラスを組み合わせることができる。
論文 参考訳(メタデータ) (2021-03-26T11:32:27Z) - Hybrid modeling: Applications in real-time diagnosis [64.5040763067757]
我々は、機械学習にインスパイアされたモデルと物理モデルを組み合わせた、新しいハイブリッドモデリングアプローチの概要を述べる。
このようなモデルをリアルタイム診断に利用しています。
論文 参考訳(メタデータ) (2020-03-04T00:44:57Z) - Information Theoretic Model Predictive Q-Learning [64.74041985237105]
本稿では,情報理論的MPCとエントロピー正規化RLとの新たな理論的関連性を示す。
バイアスモデルを利用したQ-ラーニングアルゴリズムを開発した。
論文 参考訳(メタデータ) (2019-12-31T00:29:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。