論文の概要: Data augmentation for machine learning of chemical process flowsheets
- arxiv url: http://arxiv.org/abs/2302.03379v1
- Date: Tue, 7 Feb 2023 10:35:24 GMT
- ステータス: 処理完了
- システム内更新日: 2023-02-08 16:41:38.106872
- Title: Data augmentation for machine learning of chemical process flowsheets
- Title(参考訳): 化学プロセスフローシートの機械学習のためのデータ拡張
- Authors: Lukas Schulze Balhorn, Edwin Hirtreiter, Lynn Luderer, Artur M.
Schweidtmann
- Abstract要約: 提案するデータ拡張により,人工知能に基づくプロセス設計モデルの性能が向上することを示す。
本研究では,フローシートデータの増大により,フローシート自動補完モデルの予測不確かさが14.7%向上した。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Artificial intelligence has great potential for accelerating the design and
engineering of chemical processes. Recently, we have shown that
transformer-based language models can learn to auto-complete chemical process
flowsheets using the SFILES 2.0 string notation. Also, we showed that language
translation models can be used to translate Process Flow Diagrams (PFDs) into
Process and Instrumentation Diagrams (P&IDs). However, artificial intelligence
methods require big data and flowsheet data is currently limited. To mitigate
this challenge of limited data, we propose a new data augmentation methodology
for flowsheet data that is represented in the SFILES 2.0 notation. We show that
the proposed data augmentation improves the performance of artificial
intelligence-based process design models. In our case study flowsheet data
augmentation improved the prediction uncertainty of the flowsheet
autocompletion model by 14.7%. In the future, our flowsheet data augmentation
can be used for other machine learning algorithms on chemical process
flowsheets that are based on SFILES notation.
- Abstract(参考訳): 人工知能は化学プロセスの設計と工学を加速する大きな可能性を秘めている。
近年,transformer ベースの言語モデルが sfiles 2.0 文字列表記法を用いて化学プロセスフローシートの自動補完を学習できることが示されている。
また,プロセスフロー図(pfds)をプロセス・アンド・インスツルメンテーション図(p&ids)に変換するために,言語翻訳モデルが利用できることを示した。
しかし、人工知能の手法はビッグデータを必要とし、現在フローシートのデータは限られている。
制限データによるこの課題を軽減するため,SFILES 2.0表記法で表されるフローシートデータに対する新たなデータ拡張手法を提案する。
提案したデータ拡張により,人工知能に基づくプロセス設計モデルの性能が向上することを示す。
本研究では,フローシートデータの増大により,フローシート自動補完モデルの予測不確かさが14.7%向上した。
将来、我々のフローシートデータ拡張は、SFILES表記に基づく化学プロセスフローシート上の他の機械学習アルゴリズムに利用できる。
関連論文リスト
- The Graph's Apprentice: Teaching an LLM Low Level Knowledge for Circuit Quality Estimation [34.37154877681809]
We introduced VeriDistill, the first end-to-end machine learning model that direct process raw Verilog code to predict circuit quality-of-result metrics。
本モデルでは,LLMに基づく低レベル回路インサイトを予測器に転送する,新しい知識蒸留法を採用している。
実験では、VeriDistillは大規模なVerilogデータセット上で最先端のベースラインを上回っている。
論文 参考訳(メタデータ) (2024-10-30T04:20:10Z) - Recent Advances on Machine Learning for Computational Fluid Dynamics: A Survey [51.87875066383221]
本稿では、基本概念、従来の手法、ベンチマークデータセットを紹介し、CFDを改善する上で機械学習が果たす様々な役割について検討する。
我々は,空気力学,燃焼,大気・海洋科学,生物流体,プラズマ,記号回帰,秩序の低減など,CFDにおけるMLの現実的な応用を強調した。
シミュレーションの精度を向上し、計算時間を短縮し、流体力学のより複雑な解析を可能にすることにより、MLはCFD研究を大きく変革する可能性があるという結論を導いた。
論文 参考訳(メタデータ) (2024-08-22T07:33:11Z) - An Autonomous Large Language Model Agent for Chemical Literature Data
Mining [60.85177362167166]
本稿では,幅広い化学文献から高忠実度抽出が可能なエンドツーエンドAIエージェントフレームワークを提案する。
本フレームワークの有効性は,反応条件データの精度,リコール,F1スコアを用いて評価する。
論文 参考訳(メタデータ) (2024-02-20T13:21:46Z) - Toward autocorrection of chemical process flowsheets using large
language models [0.0]
本稿では,フローシート内のエラーを識別し,ユーザに対して修正を提案する,新しい生成AI手法を提案する。
モデルへの入力は、潜在的に誤ったフローシートであり、モデルの出力は修正されたフローシートの提案である。
このモデルは、合成されたフローシートの独立したテストデータセット上で、トップ1の精度80%、トップ5の精度84%を達成する。
論文 参考訳(メタデータ) (2023-12-05T16:39:41Z) - The Devil is in the Errors: Leveraging Large Language Models for
Fine-grained Machine Translation Evaluation [93.01964988474755]
AutoMQMは,大規模な言語モデルに対して,翻訳におけるエラーの識別と分類を求めるプロンプト技術である。
テキスト内学習と微調整によるラベル付きデータの影響について検討する。
次に, PaLM-2モデルを用いてAutoMQMを評価し, スコアのプロンプトよりも性能が向上することがわかった。
論文 参考訳(メタデータ) (2023-08-14T17:17:21Z) - Automatic Data Augmentation via Invariance-Constrained Learning [94.27081585149836]
下位のデータ構造は、しばしば学習タスクのソリューションを改善するために利用される。
データ拡張は、入力データに複数の変換を適用することで、トレーニング中にこれらの対称性を誘導する。
この作業は、学習タスクを解決しながらデータ拡張を自動的に適応することで、これらの問題に対処する。
論文 参考訳(メタデータ) (2022-09-29T18:11:01Z) - Advancing Reacting Flow Simulations with Data-Driven Models [50.9598607067535]
マルチ物理問題における機械学習ツールの効果的な利用の鍵は、それらを物理モデルとコンピュータモデルに結合することである。
本章では, 燃焼システムにおけるデータ駆動型低次モデリングの適用可能性について概説する。
論文 参考訳(メタデータ) (2022-09-05T16:48:34Z) - Learning from flowsheets: A generative transformer model for
autocompletion of flowsheets [0.0]
テキストベースのSFILES 2.0表記を用いて,フローシートを文字列として表現する。
変換器に基づく言語モデルを用いて,フローシートにおけるSFILES 2.0言語の文法構造と共通パターンを学習する。
論文 参考訳(メタデータ) (2022-08-01T13:43:58Z) - Surrogate Modelling for Injection Molding Processes using Machine
Learning [0.23090185577016442]
射出成形は、複雑なプラスチックオブジェクトをモデル化するための最も一般的な製造方法の1つである。
モルドフローシミュレーションプロジェクトからのデータの抽出を含むデータ処理パイプラインのベースラインを提案する。
我々は,時間と偏向分布予測のための機械学習モデルを評価し,MSEおよびRMSEメトリクスのベースライン値を提供する。
論文 参考訳(メタデータ) (2021-07-30T12:13:52Z) - Automated Machine Learning Techniques for Data Streams [91.3755431537592]
本稿では、最先端のオープンソースAutoMLツールを調査し、ストリームから収集したデータに適用し、時間とともにパフォーマンスがどのように変化するかを測定する。
この結果から,既製のAutoMLツールで十分な結果が得られることが示されたが,概念ドリフトや検出,適応といった手法が適用されれば,予測精度を時間とともに維持することが可能になる。
論文 参考訳(メタデータ) (2021-06-14T11:42:46Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。