論文の概要: Automated Synthesis of Steady-State Continuous Processes using
Reinforcement Learning
- arxiv url: http://arxiv.org/abs/2101.04422v2
- Date: Mon, 15 Mar 2021 09:42:10 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-04 01:48:22.789404
- Title: Automated Synthesis of Steady-State Continuous Processes using
Reinforcement Learning
- Title(参考訳): 強化学習を用いた定常連続プロセスの自動合成
- Authors: Quirin G\"ottl, Dominik G. Grimm, Jakob Burger
- Abstract要約: 強化学習は、概念設計の事前知識を必要とせずに自動フローシート合成に使用できる。
フローシート合成は、2人の競技者のゲームとしてモデル化される。
この方法は四元系における反応蒸留プロセスにうまく適用される。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Automated flowsheet synthesis is an important field in computer-aided process
engineering. The present work demonstrates how reinforcement learning can be
used for automated flowsheet synthesis without any heuristics of prior
knowledge of conceptual design. The environment consists of a steady-state
flowsheet simulator that contains all physical knowledge. An agent is trained
to take discrete actions and sequentially built up flowsheets that solve a
given process problem. A novel method named SynGameZero is developed to ensure
good exploration schemes in the complex problem. Therein, flowsheet synthesis
is modelled as a game of two competing players. The agent plays this game
against itself during training and consists of an artificial neural network and
a tree search for forward planning. The method is applied successfully to a
reaction-distillation process in a quaternary system.
- Abstract(参考訳): 自動フローシート合成はコンピュータ支援プロセス工学の重要な分野である。
本研究は, 従来の概念設計知識のヒューリスティックを伴わない自動フローシート合成において, 強化学習をいかに活用できるかを示す。
環境は、すべての物理的知識を含む定常フローシートシミュレータで構成されている。
エージェントは個別のアクションを取るように訓練され、所定のプロセス問題を解決するフローシートを順次構築する。
SynGameZero という新しい手法が開発され,複雑な問題に対する適切な探索手法が確立された。
フローシート合成は、競合する2人のプレイヤーのゲームとしてモデル化される。
エージェントはこのゲームをトレーニング中に自力でプレイし、ニューラルネットワークとフォワードプランニングのツリー検索で構成される。
この方法は四元系における反応蒸留プロセスにうまく適用される。
関連論文リスト
- Deep reinforcement learning uncovers processes for separating azeotropic
mixtures without prior knowledge [2.048226951354646]
本稿では,フローシート合成のための汎用的な強化学習手法を提案する。
本稿では,二元共沸混合を分離する一般タスクへの単一エージェントの適応性を示す。
平均して、エージェントは、関与する物質の99%以上を純粋な成分に分離することができる。
論文 参考訳(メタデータ) (2023-10-10T08:36:21Z) - REBOOT: Reuse Data for Bootstrapping Efficient Real-World Dexterous
Manipulation [61.7171775202833]
本稿では,強化学習による巧妙な操作スキルの学習を効率化するシステムを提案する。
我々のアプローチの主な考え方は、サンプル効率のRLとリプレイバッファブートストラップの最近の進歩の統合である。
本システムでは,実世界の学習サイクルを,模倣に基づくピックアップポリシを通じて学習されたリセットを組み込むことで完遂する。
論文 参考訳(メタデータ) (2023-09-06T19:05:31Z) - Incremental procedural and sensorimotor learning in cognitive humanoid
robots [52.77024349608834]
本研究は,手順を段階的に学習する認知エージェントを提案する。
各サブステージで必要とされる認知機能と, エージェントが未解決の課題に, 新たな機能の追加がどう対処するかを示す。
結果は、このアプローチが複雑なタスクを段階的に解くことができることを示している。
論文 参考訳(メタデータ) (2023-04-30T22:51:31Z) - Hindsight States: Blending Sim and Real Task Elements for Efficient
Reinforcement Learning [61.3506230781327]
ロボット工学では、第一原理から導かれた力学モデルに基づくシミュレーションに基づいて、トレーニングデータを生成する方法がある。
ここでは、力学の複雑さの不均衡を利用して、より標本効率のよい学習を行う。
提案手法をいくつかの課題に対して検証し,既存の近視アルゴリズムと組み合わせた場合の学習改善を実証する。
論文 参考訳(メタデータ) (2023-03-03T21:55:04Z) - Transfer learning for process design with reinforcement learning [3.3084327202914476]
本稿では、厳密なシミュレーション手法と組み合わせて、RLを用いたプロセス設計にトランスファーラーニングを活用することを提案する。
トランスファーラーニング(transfer learning)とは、ある問題を解きながら得られた知識を記憶し、異なるターゲットドメインでこの情報を再利用する機械学習から確立されたアプローチである。
その結果,移動学習により,DWSIMで実現可能なフローシートを経済的に設計することが可能となり,収益率8%のフローシートが得られることがわかった。
論文 参考訳(メタデータ) (2023-02-07T10:31:14Z) - Simulation-Based Parallel Training [55.41644538483948]
このようなボトルネックを緩和するトレーニングフレームワークを設計するために、現在進行中の作業を紹介します。
トレーニングプロセスと並行してデータを生成する。
このバイアスをメモリバッファで軽減する戦略を提案する。
論文 参考訳(メタデータ) (2022-11-08T09:31:25Z) - FusionRetro: Molecule Representation Fusion via In-Context Learning for
Retrosynthetic Planning [58.47265392465442]
再合成計画(Retrosynthetic Planning)は、開始物質から標的分子への完全な多段階合成経路を考案することを目的としている。
現在の戦略では、単一ステップの逆合成モデルと探索アルゴリズムの分離されたアプローチを採用している。
本稿では,文脈情報を利用した新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2022-09-30T08:44:58Z) - Flowsheet synthesis through hierarchical reinforcement learning and
graph neural networks [0.4588028371034406]
アクター批判論理に基づく化学プロセス設計のための強化学習アルゴリズムを提案する。
提案アルゴリズムは,化学プロセスをグラフとして表現し,グラフ畳み込みニューラルネットワークを用いてプロセスグラフから学習する。
論文 参考訳(メタデータ) (2022-07-25T10:42:15Z) - A Passive Online Technique for Learning Hybrid Automata from
Input/Output Traces [0.0]
非線形サイバー物理システムの入力出力トレースからハイブリッドオートマトンを合成する新しい手法を提案する。
非線形挙動における類似度検出は、そのようなモデルの抽出の主な課題である。
当社のアプローチは受動的であり、ログされたトレースから自動合成を行う際にシステムとのインタラクションは不要である。
論文 参考訳(メタデータ) (2021-01-18T13:08:14Z) - Thinking While Moving: Deep Reinforcement Learning with Concurrent
Control [122.49572467292293]
本研究では,制御システムの時間的進化とともに,ポリシーからのアクションのサンプリングを同時に行わなければならないような環境下での強化学習について検討する。
人や動物のように、ロボットは思考と移動を同時に行わなければならず、前の動作が完了する前に次の動作を決定する。
論文 参考訳(メタデータ) (2020-04-13T17:49:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。