論文の概要: SMPL: Simulated Industrial Manufacturing and Process Control Learning
Environments
- arxiv url: http://arxiv.org/abs/2206.08851v1
- Date: Fri, 17 Jun 2022 15:51:35 GMT
- ステータス: 処理完了
- システム内更新日: 2022-06-20 17:32:21.932936
- Title: SMPL: Simulated Industrial Manufacturing and Process Control Learning
Environments
- Title(参考訳): SMPL : 産業生産のシミュレーションとプロセス制御学習環境
- Authors: Mohan Zhang, Xiaozhou Wang, Benjamin Decardi-Nelson, Bo Song, An
Zhang, Jinfeng Liu, Sile Tao, Jiayi Cheng, Xiaohong Liu, DengDeng Yu, Matthew
Poon, Animesh Garg
- Abstract要約: 製造プラントの制御に深層強化学習を適用しようという試みはほとんどない。
我々は,5つの高忠実度シミュレーション環境を含む使い易いライブラリを開発した。
フォローアップ研究の比較のために、オンラインおよびオフライン、モデルベースおよびモデルフリー強化学習アルゴリズムをベンチマークする。
- 参考スコア(独自算出の注目度): 26.451888230418746
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Traditional biological and pharmaceutical manufacturing plants are controlled
by human workers or pre-defined thresholds. Modernized factories have advanced
process control algorithms such as model predictive control (MPC). However,
there is little exploration of applying deep reinforcement learning to control
manufacturing plants. One of the reasons is the lack of high fidelity
simulations and standard APIs for benchmarking. To bridge this gap, we develop
an easy-to-use library that includes five high-fidelity simulation
environments: BeerFMTEnv, ReactorEnv, AtropineEnv, PenSimEnv and mAbEnv, which
cover a wide range of manufacturing processes. We build these environments on
published dynamics models. Furthermore, we benchmark online and offline,
model-based and model-free reinforcement learning algorithms for comparisons of
follow-up research.
- Abstract(参考訳): 伝統的な生物および薬品製造工場は、人間の労働者または事前に定義された閾値によって制御されている。
近代化工場はモデル予測制御(mpc)のような高度なプロセス制御アルゴリズムを備えている。
しかし、製造プラントの制御に深層強化学習を適用することはほとんどない。
その理由の1つは、高忠実度シミュレーションとベンチマークのための標準APIの欠如である。
このギャップを埋めるために,BeerFMTEnv,ReactorEnv,AtropineEnv,PenSimEnv,mAbEnvの5つの高忠実性シミュレーション環境を含む,使い易いライブラリを開発した。
公開されたダイナミクスモデル上でこれらの環境を構築します。
さらに、オンラインおよびオフライン、モデルベースおよびモデルフリー強化学習アルゴリズムをフォローアップ研究の比較のためにベンチマークする。
関連論文リスト
- R-AIF: Solving Sparse-Reward Robotic Tasks from Pixels with Active Inference and World Models [50.19174067263255]
我々は、エージェントがスパース・リワード、継続的なアクション、ゴールベースのロボット制御POMDP環境においてエクササイズするのを助けるために、事前の選好学習手法と自己修正スケジュールを導入する。
我々のエージェントは、累積報酬、相対安定性、成功率の観点から、最先端モデルよりも優れたパフォーマンスを提供する。
論文 参考訳(メタデータ) (2024-09-21T18:32:44Z) - MFRL-BI: Design of a Model-free Reinforcement Learning Process Control
Scheme by Using Bayesian Inference [5.375049126954924]
プロセス制御方式の設計は、製造システムのばらつきを低減するために品質保証に不可欠である。
本稿では,モデルフリー強化学習(MFRL)手法を提案する。
論文 参考訳(メタデータ) (2023-09-17T08:18:55Z) - Reduced Order Modeling of a MOOSE-based Advanced Manufacturing Model
with Operator Learning [2.517043342442487]
先進的製造(AM)は、核材料への潜在的な応用について、原子力コミュニティに多大な関心を集めている。
1つの課題は、実行時に製造プロセスを制御することによって、望ましい材料特性を得ることである。
深部強化学習(DRL)に基づくインテリジェントAMは、最適な設計変数を生成するためのプロセスレベルの自動制御機構に依存している。
論文 参考訳(メタデータ) (2023-08-18T17:38:00Z) - A Comparative Study of Machine Learning Algorithms for Anomaly Detection
in Industrial Environments: Performance and Environmental Impact [62.997667081978825]
本研究は,環境の持続可能性を考慮した高性能機械学習モデルの要求に応えることを目的としている。
Decision TreesやRandom Forestsといった従来の機械学習アルゴリズムは、堅牢な効率性とパフォーマンスを示している。
しかし, 資源消費の累積増加にもかかわらず, 最適化された構成で優れた結果が得られた。
論文 参考訳(メタデータ) (2023-07-01T15:18:00Z) - A Generative Approach for Production-Aware Industrial Network Traffic
Modeling [70.46446906513677]
ドイツにあるTrumpf工場に配備されたレーザー切断機から発生するネットワークトラフィックデータについて検討した。
我々は、トラフィック統計を分析し、マシンの内部状態間の依存関係をキャプチャし、ネットワークトラフィックを生産状態依存プロセスとしてモデル化する。
可変オートエンコーダ(VAE)、条件付き可変オートエンコーダ(CVAE)、生成逆ネットワーク(GAN)など、様々な生成モデルの性能の比較を行った。
論文 参考訳(メタデータ) (2022-11-11T09:46:58Z) - Generating Hidden Markov Models from Process Models Through Nonnegative Tensor Factorization [0.0]
我々は,理論的プロセスモデルと関連する最小隠れマルコフモデルを統合する,数学的に新しい手法を提案する。
提案手法は, (a) 理論的プロセスモデル, (b) HMM, (c) 結合非負行列テンソル因子分解, (d) カスタムモデル選択を集約する。
論文 参考訳(メタデータ) (2022-10-03T16:19:27Z) - Deep Learning based pipeline for anomaly detection and quality
enhancement in industrial binder jetting processes [68.8204255655161]
異常検出は、通常の値空間とは異なる異常状態、インスタンス、あるいはデータポイントを検出する方法を記述する。
本稿では,産業生産における人工知能へのデータ中心のアプローチに寄与する。
論文 参考訳(メタデータ) (2022-09-21T08:14:34Z) - Towards Standardizing Reinforcement Learning Approaches for Stochastic
Production Scheduling [77.34726150561087]
強化学習はスケジューリングの問題を解決するのに使える。
既存の研究は、コードが利用できない複雑なシミュレーションに依存している。
から選ぶべきRLの設計の広大な配列があります。
モデル記述の標準化 - 生産セットアップとRL設計の両方 - と検証スキームは前提条件です。
論文 参考訳(メタデータ) (2021-04-16T16:07:10Z) - Sim-Env: Decoupling OpenAI Gym Environments from Simulation Models [0.0]
強化学習(RL)は、AI研究の最も活発な分野の1つです。
開発方法論はまだ遅れており、RLアプリケーションの開発を促進するための標準APIが不足している。
多目的エージェントベースのモデルと派生した単一目的強化学習環境の分離開発と保守のためのワークフローとツールを提示する。
論文 参考訳(メタデータ) (2021-02-19T09:25:21Z) - Learning Discrete Energy-based Models via Auxiliary-variable Local
Exploration [130.89746032163106]
離散構造データに対する条件付きおよび非条件付きEMMを学習するための新しいアルゴリズムであるALOEを提案する。
エネルギー関数とサンプリング器は、新しい変分型電力繰り返しにより効率よく訓練できることを示す。
本稿では、ソフトウェアテストのためのエネルギーモデルガイド付ファジィザについて、libfuzzerのようなよく設計されたファジィエンジンに匹敵する性能を実現する。
論文 参考訳(メタデータ) (2020-11-10T19:31:29Z) - Data-driven surrogate modelling and benchmarking for process equipment [1.8395181176356432]
化学プロセス機器のモデリングを目的とした計算流体力学(CFD)シミュレーションスイートを開発した。
有限関数評価予算の制約の下で,これらのCFDシミュレータをループ内での回帰型能動学習戦略について検討した。
論文 参考訳(メタデータ) (2020-03-13T18:22:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。