論文の概要: Toward autocorrection of chemical process flowsheets using large
language models
- arxiv url: http://arxiv.org/abs/2312.02873v1
- Date: Tue, 5 Dec 2023 16:39:41 GMT
- ステータス: 処理完了
- システム内更新日: 2023-12-06 15:11:22.992547
- Title: Toward autocorrection of chemical process flowsheets using large
language models
- Title(参考訳): 大規模言語モデルを用いた化学プロセスフローシートの自動補正に向けて
- Authors: Lukas Schulze Balhorn and Marc Caballero and Artur M. Schweidtmann
- Abstract要約: 本稿では,フローシート内のエラーを識別し,ユーザに対して修正を提案する,新しい生成AI手法を提案する。
モデルへの入力は、潜在的に誤ったフローシートであり、モデルの出力は修正されたフローシートの提案である。
このモデルは、合成されたフローシートの独立したテストデータセット上で、トップ1の精度80%、トップ5の精度84%を達成する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The process engineering domain widely uses Process Flow Diagrams (PFDs) and
Process and Instrumentation Diagrams (P&IDs) to represent process flows and
equipment configurations. However, the P&IDs and PFDs, hereafter called
flowsheets, can contain errors causing safety hazards, inefficient operation,
and unnecessary expenses. Correcting and verifying flowsheets is a tedious,
manual process. We propose a novel generative AI methodology for automatically
identifying errors in flowsheets and suggesting corrections to the user, i.e.,
autocorrecting flowsheets. Inspired by the breakthrough of Large Language
Models (LLMs) for grammatical autocorrection of human language, we investigate
LLMs for the autocorrection of flowsheets. The input to the model is a
potentially erroneous flowsheet and the output of the model are suggestions for
a corrected flowsheet. We train our autocorrection model on a synthetic dataset
in a supervised manner. The model achieves a top-1 accuracy of 80% and a top-5
accuracy of 84% on an independent test dataset of synthetically generated
flowsheets. The results suggest that the model can learn to autocorrect the
synthetic flowsheets. We envision that flowsheet autocorrection will become a
useful tool for chemical engineers.
- Abstract(参考訳): プロセス工学領域ではプロセスフロー図(pfds)とプロセス・アンド・インスツルメンテーション図(p&ids)を用いてプロセスフローと機器構成を表現する。
しかし、p&idsとpfdsは、後にflowsheetsと呼ばれ、安全上の障害、非効率な操作、不要な費用の原因となるエラーを含むことができる。
フローシートの修正と検証は面倒で手作業のプロセスです。
本稿では,フローシートの誤りを自動的に識別し,ユーザへの修正,すなわちフローシートの自動修正を提案する新しい生成型ai手法を提案する。
人間の言語を文法的に自動補正するLarge Language Models (LLMs) のブレークスルーに触発され,フローシートの自動補正のためのLLMについて検討した。
モデルへの入力は潜在的に誤ったフローシートであり、モデルの出力は修正されたフローシートの提案である。
教師付きで合成データセット上で自動修正モデルをトレーニングします。
このモデルは、合成生成フローシートの独立したテストデータセット上で、top-1の精度80%とtop-5の精度84%を達成する。
その結果,モデルが合成フローシートの自動修正を学習できることが示唆された。
フローシートの自動修正が化学技術者にとって有用なツールになることを想定している。
関連論文リスト
- Training Language Models to Self-Correct via Reinforcement Learning [98.35197671595343]
自己補正は、現代の大規模言語モデル(LLM)では、ほとんど効果がないことが判明した。
完全自己生成データを用いたLLMの自己補正能力を大幅に向上させるマルチターンオンライン強化学習手法であるSCoReを開発した。
SCoReは最先端の自己補正性能を実現し,MATHとHumanEvalでそれぞれ15.6%,9.1%向上した。
論文 参考訳(メタデータ) (2024-09-19T17:16:21Z) - Small Language Models Need Strong Verifiers to Self-Correct Reasoning [69.94251699982388]
大規模言語モデル(LLM)の推論性能を高めるための有望なソリューションとして自己補正が登場した。
この研究は、小さい(=13B)言語モデル(LM)が、より強いLMから最小の入力で推論タスクを自己補正できるかどうかを考察する。
論文 参考訳(メタデータ) (2024-04-26T03:41:28Z) - LM-Combiner: A Contextual Rewriting Model for Chinese Grammatical Error Correction [49.0746090186582]
過剰補正は中国の文法的誤り訂正(CGEC)タスクにおいて重要な問題である。
モデルアンサンブル法による最近の研究は、過剰補正を効果的に軽減し、ECCシステムの精度を向上させることができる。
本稿では,GECシステム出力の過度補正をモデルアンサンブルなしで直接修正できる書き換えモデルLM-Combinerを提案する。
論文 参考訳(メタデータ) (2024-03-26T06:12:21Z) - Learning to Check: Unleashing Potentials for Self-Correction in Large Language Models [5.463333911506443]
我々は,タスクチェックのためのトレーニングデータを構築することで,大規模言語モデル(LLM)の自己チェック能力を向上させることを目指している。
ステップCoTチェック(Step CoT Check)と呼ばれる特殊なチェックフォーマットを提案する。
実験により、"Step CoT Check"フォーマットによる微調整により、LCMの自己チェックと自己補正能力が大幅に向上することが示された。
論文 参考訳(メタデータ) (2024-02-20T14:23:23Z) - Parameter-tuning-free data entry error unlearning with adaptive
selective synaptic dampening [51.34904967046097]
本稿では,パラメータチューニングの必要性を排除した選択的シナプス減衰アンラーニング法の拡張を提案する。
本稿では,ResNet18とVision Transformerの未学習タスクにおける適応選択的シナプス減衰(ASSD)の性能を示す。
このアプローチの適用は、サプライチェーン管理などの産業環境において特に魅力的である。
論文 参考訳(メタデータ) (2024-02-06T14:04:31Z) - The Devil is in the Errors: Leveraging Large Language Models for
Fine-grained Machine Translation Evaluation [93.01964988474755]
AutoMQMは,大規模な言語モデルに対して,翻訳におけるエラーの識別と分類を求めるプロンプト技術である。
テキスト内学習と微調整によるラベル付きデータの影響について検討する。
次に, PaLM-2モデルを用いてAutoMQMを評価し, スコアのプロンプトよりも性能が向上することがわかった。
論文 参考訳(メタデータ) (2023-08-14T17:17:21Z) - Data augmentation for machine learning of chemical process flowsheets [0.0]
提案するデータ拡張により,人工知能に基づくプロセス設計モデルの性能が向上することを示す。
本研究では,フローシートデータの増大により,フローシート自動補完モデルの予測不確かさが14.7%向上した。
論文 参考訳(メタデータ) (2023-02-07T10:35:24Z) - Learning from flowsheets: A generative transformer model for
autocompletion of flowsheets [0.0]
テキストベースのSFILES 2.0表記を用いて,フローシートを文字列として表現する。
変換器に基づく言語モデルを用いて,フローシートにおけるSFILES 2.0言語の文法構造と共通パターンを学習する。
論文 参考訳(メタデータ) (2022-08-01T13:43:58Z) - AutoFlow: Learning a Better Training Set for Optical Flow [62.40293188964933]
AutoFlowは、光学フローのトレーニングデータをレンダリングする手法である。
AutoFlowはPWC-NetとRAFTの両方の事前トレーニングにおいて最先端の精度を実現する。
論文 参考訳(メタデータ) (2021-04-29T17:55:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。