論文の概要: Deep reinforcement learning uncovers processes for separating azeotropic
mixtures without prior knowledge
- arxiv url: http://arxiv.org/abs/2310.06415v1
- Date: Tue, 10 Oct 2023 08:36:21 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-11 18:22:39.124720
- Title: Deep reinforcement learning uncovers processes for separating azeotropic
mixtures without prior knowledge
- Title(参考訳): 深層強化学習は事前知識のない漸近混合混合物の分離過程を明らかにする
- Authors: Quirin G\"ottl, Jonathan Pirnay, Jakob Burger, Dominik G. Grimm
- Abstract要約: 本稿では,フローシート合成のための汎用的な強化学習手法を提案する。
本稿では,二元共沸混合を分離する一般タスクへの単一エージェントの適応性を示す。
平均して、エージェントは、関与する物質の99%以上を純粋な成分に分離することができる。
- 参考スコア(独自算出の注目度): 2.048226951354646
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Process synthesis in chemical engineering is a complex planning problem due
to vast search spaces, continuous parameters and the need for generalization.
Deep reinforcement learning agents, trained without prior knowledge, have shown
to outperform humans in various complex planning problems in recent years.
Existing work on reinforcement learning for flowsheet synthesis shows promising
concepts, but focuses on narrow problems in a single chemical system, limiting
its practicality. We present a general deep reinforcement learning approach for
flowsheet synthesis. We demonstrate the adaptability of a single agent to the
general task of separating binary azeotropic mixtures. Without prior knowledge,
it learns to craft near-optimal flowsheets for multiple chemical systems,
considering different feed compositions and conceptual approaches. On average,
the agent can separate more than 99% of the involved materials into pure
components, while autonomously learning fundamental process engineering
paradigms. This highlights the agent's planning flexibility, an encouraging
step toward true generality.
- Abstract(参考訳): 化学工学におけるプロセス合成は、広大な探索空間、連続パラメータ、一般化の必要性から複雑な計画問題である。
事前知識のない深層強化学習エージェントは、近年、様々な複雑な計画問題において、人間よりも優れていることが示されている。
フローシート合成のための強化学習に関する既存の研究は、有望な概念を示しているが、1つの化学系における狭い問題に焦点を当て、実用性を制限する。
本稿では,フローシート合成のための一般的な深層強化学習手法を提案する。
本稿では,二元共沸混合を分離する一般タスクへの単一エージェントの適応性を示す。
事前の知識がなければ、異なるフィード組成と概念的アプローチを考慮して、複数の化学系のための準最適フローシートを作成することを学ぶ。
平均して、エージェントは99%以上の材料を純粋なコンポーネントに分離できるが、自律的にプロセスエンジニアリングのパラダイムを学習する。
これはエージェントの計画的柔軟性を強調し、真の汎用性への励みとなる。
関連論文リスト
- Learning Top-k Subtask Planning Tree based on Discriminative Representation Pre-training for Decision Making [9.302910360945042]
複雑な現実世界のタスクから抽出された事前知識による計画は、人間が正確な決定を行うために不可欠である。
マルチエンコーダと個別予測器を導入し、簡単なサブタスクのための十分なデータからタスク固有表現を学習する。
また、注意機構を用いてトップkのサブタスク計画木を生成し、未確認タスクの複雑な決定を導くためにサブタスク実行計画をカスタマイズする。
論文 参考訳(メタデータ) (2023-12-18T09:00:31Z) - AI planning in the imagination: High-level planning on learned abstract
search spaces [68.75684174531962]
我々は,エージェントが訓練中に学習する抽象的な検索空間において,エージェントが計画することを可能にする,PiZeroと呼ばれる新しい手法を提案する。
本研究では,旅行セールスマン問題,ソコバン問題,2048年,施設立地問題,パックマン問題など,複数の分野で評価を行った。
論文 参考訳(メタデータ) (2023-08-16T22:47:16Z) - Incremental procedural and sensorimotor learning in cognitive humanoid
robots [52.77024349608834]
本研究は,手順を段階的に学習する認知エージェントを提案する。
各サブステージで必要とされる認知機能と, エージェントが未解決の課題に, 新たな機能の追加がどう対処するかを示す。
結果は、このアプローチが複雑なタスクを段階的に解くことができることを示している。
論文 参考訳(メタデータ) (2023-04-30T22:51:31Z) - Compositional Generalization and Decomposition in Neural Program
Synthesis [59.356261137313275]
本稿では,学習プログラムシンセサイザーの合成一般化能力の測定に焦点をあてる。
まず、プログラム合成法が一般化されるであろういくつかの異なる軸を特徴付ける。
2つの一般的な既存のデータセットに基づいて、これらの能力を評価するためのタスクのベンチマークスイートを導入する。
論文 参考訳(メタデータ) (2022-04-07T22:16:05Z) - HALMA: Humanlike Abstraction Learning Meets Affordance in Rapid Problem
Solving [104.79156980475686]
人間は自然主義的タスクの構造に応じて構成的および因果的抽象化、つまり知識を学ぶ。
エージェントがその知識をどのように表現するかには、知覚、概念、アルゴリズムの3段階の一般化がある、と我々は主張する。
このベンチマークは、ビジュアルコンセプト開発と迅速な問題解決のための新しいタスクドメイン、HALMAを中心にしています。
論文 参考訳(メタデータ) (2021-02-22T20:37:01Z) - Automated Synthesis of Steady-State Continuous Processes using
Reinforcement Learning [0.0]
強化学習は、概念設計の事前知識を必要とせずに自動フローシート合成に使用できる。
フローシート合成は、2人の競技者のゲームとしてモデル化される。
この方法は四元系における反応蒸留プロセスにうまく適用される。
論文 参考訳(メタデータ) (2021-01-12T11:49:34Z) - Variable-Shot Adaptation for Online Meta-Learning [123.47725004094472]
従来のタスクから静的データにまたがるメタラーニングによって,少数の固定された例から新しいタスクを学習する問題について検討する。
メタラーニングは,従来の教師付き手法に比べて,ラベルの総数が少なく,累積性能も高いタスクセットを解く。
これらの結果から,メタラーニングは,一連の問題を継続的に学習し,改善する学習システムを構築する上で重要な要素であることが示唆された。
論文 参考訳(メタデータ) (2020-12-14T18:05:24Z) - Importance Weighted Policy Learning and Adaptation [89.46467771037054]
政治外学習の最近の進歩の上に構築された,概念的にシンプルで,汎用的で,モジュール的な補完的アプローチについて検討する。
このフレームワークは確率論的推論文学のアイデアにインスパイアされ、堅牢な非政治学習と事前の行動を組み合わせる。
提案手法は,メタ強化学習ベースラインと比較して,ホールドアウトタスクにおける競合適応性能を実現し,複雑なスパース・リワードシナリオにスケールすることができる。
論文 参考訳(メタデータ) (2020-09-10T14:16:58Z) - Deep Inverse Reinforcement Learning for Structural Evolution of Small
Molecules [0.0]
強化学習は主に 新たな化合物を生成するために 文献で活用されています
学習目的を簡潔に表わす報酬関数を設計する必要性は、ある種の複雑な領域においてばかばかしいことを証明できる。
本稿では,エントロピー逆強化学習パラダイムに基づく複合生成と伝達可能な報酬関数の学習のためのフレームワークを提案する。
論文 参考訳(メタデータ) (2020-07-24T17:21:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。