論文の概要: Beyond Major Product Prediction: Reproducing Reaction Mechanisms with
Machine Learning Models Trained on a Large-Scale Mechanistic Dataset
- arxiv url: http://arxiv.org/abs/2403.04580v1
- Date: Thu, 7 Mar 2024 15:26:23 GMT
- ステータス: 処理完了
- システム内更新日: 2024-03-08 13:32:47.042269
- Title: Beyond Major Product Prediction: Reproducing Reaction Mechanisms with
Machine Learning Models Trained on a Large-Scale Mechanistic Dataset
- Title(参考訳): 主要製品予測を超えて:大規模機械力学データセットで訓練された機械学習モデルによる反応メカニズムの再現
- Authors: Joonyoung F. Joung, Mun Hong Fong, Jihye Roh, Zhengkai Tu, John
Bradshaw, Connor W. Coley
- Abstract要約: 有機反応の機械的理解は、反応の発生、不純物予測、そして原則として反応発見を促進する。
いくつかの機械学習モデルは、反応生成物を予測するタスクに対処しようとしているが、反応機構を予測するための拡張は、対応する力学データセットの欠如によって妨げられている。
実験によって報告された反応物質と生成物の中間体を専門家の反応テンプレートを用いて入力し、その結果の5,184,184個の基本ステップに基づいて機械学習モデルを訓練することにより、そのようなデータセットを構築する。
- 参考スコア(独自算出の注目度): 10.968137261042715
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Mechanistic understanding of organic reactions can facilitate reaction
development, impurity prediction, and in principle, reaction discovery. While
several machine learning models have sought to address the task of predicting
reaction products, their extension to predicting reaction mechanisms has been
impeded by the lack of a corresponding mechanistic dataset. In this study, we
construct such a dataset by imputing intermediates between experimentally
reported reactants and products using expert reaction templates and train
several machine learning models on the resulting dataset of 5,184,184
elementary steps. We explore the performance and capabilities of these models,
focusing on their ability to predict reaction pathways and recapitulate the
roles of catalysts and reagents. Additionally, we demonstrate the potential of
mechanistic models in predicting impurities, often overlooked by conventional
models. We conclude by evaluating the generalizability of mechanistic models to
new reaction types, revealing challenges related to dataset diversity,
consecutive predictions, and violations of atom conservation.
- Abstract(参考訳): 有機反応の機械的理解は、反応の発生、不純物予測、そして原則として反応発見を促進する。
いくつかの機械学習モデルは、反応生成物を予測するタスクに対処しようとしているが、反応機構を予測するための拡張は、対応する力学データセットの欠如によって妨げられている。
本研究では,実験によって報告された反応物質と生成物の中間体を専門家反応テンプレートを用いて入力し,その結果の5,184,184個の基本ステップに基づいて機械学習モデルを訓練することにより,そのようなデータセットを構築する。
反応経路を予測し, 触媒や試薬の役割を再認識する能力に着目し, これらのモデルの性能と能力について検討した。
さらに, 従来のモデルでは見過ごされることが多い不純物予測における機械モデルの可能性を示す。
我々は,新しい反応型に対する力学モデルの一般化可能性を評価し,データセットの多様性,連続予測,原子保存違反に関連する課題を明らかにする。
関連論文リスト
- Learning Chemical Reaction Representation with Reactant-Product Alignment [50.28123475356234]
本稿では,様々な有機反応関連タスクに適した新しい化学反応表現学習モデルであるモデルネームを紹介する。
反応物質と生成物との原子対応を統合することにより、反応中に生じる分子変換を識別し、反応機構の理解を深める。
反応条件を化学反応表現に組み込むアダプタ構造を設計し、様々な反応条件を処理し、様々なデータセットや下流タスク、例えば反応性能予測に適応できるようにした。
論文 参考訳(メタデータ) (2024-11-26T17:41:44Z) - ReactAIvate: A Deep Learning Approach to Predicting Reaction Mechanisms and Unmasking Reactivity Hotspots [4.362338454684645]
我々は,反応ステップ分類の精度を96%とほぼ均一に達成した,解釈可能な注意に基づくGNNを開発した。
我々のモデルは、配布外クラスからでも、キー原子を十分に識別します。
この一般性は、モジュラーな方法で新しい反応型を包含することができるため、新しい分子の反応性を理解するための専門家にとって価値がある。
論文 参考訳(メタデータ) (2024-07-14T05:53:18Z) - Retrosynthesis prediction enhanced by in-silico reaction data
augmentation [66.5643280109899]
RetroWISEは,実データから推定されるベースモデルを用いて,シリコン内反応の生成と増大を行うフレームワークである。
3つのベンチマークデータセットで、RetroWISEは最先端モデルに対して最高の全体的なパフォーマンスを達成する。
論文 参考訳(メタデータ) (2024-01-31T07:40:37Z) - Holistic chemical evaluation reveals pitfalls in reaction prediction
models [0.3065062372337749]
本稿では, より総合的な評価をめざして, 現状のアプローチに基づく新たな評価手法を提案する。
ChoRISOは、化学的に関連するシナリオを再現するために、複数の調整された分割と共に、キュレートされたデータセットである。
私たちの研究は、最終的に化学発見を加速できる堅牢な予測モデルへの道を開いた。
論文 参考訳(メタデータ) (2023-12-14T14:54:28Z) - Beyond the Typical: Modeling Rare Plausible Patterns in Chemical Reactions by Leveraging Sequential Mixture-of-Experts [42.9784548283531]
TransformerやVAEのような生成モデルは一般的に反応生成物を予測するために使用される。
反応物と電子再分配パターンのマッピング空間を分割・分散的に整理することを提案する。
論文 参考訳(メタデータ) (2023-10-07T03:18:26Z) - Improving Molecular Representation Learning with Metric
Learning-enhanced Optimal Transport [49.237577649802034]
分子レグレッション問題に対する一般化能力を高めるために,MROTと呼ばれる新しい最適輸送ベースアルゴリズムを開発した。
MROTは最先端のモデルよりも優れており、新しい物質の発見を加速する有望な可能性を示している。
論文 参考訳(メタデータ) (2022-02-13T04:56:18Z) - Data Driven Reaction Mechanism Estimation via Transient Kinetics and
Machine Learning [0.0]
この研究は、一過性率/集中依存と機械学習を組み合わせて、アクティブなサイト数を測定する方法論を詳述する。
反応を駆動するLangmuir-Hinshelwood機構を明らかにするためにCO酸化データを解析した。
論文 参考訳(メタデータ) (2020-11-17T18:14:10Z) - RetroXpert: Decompose Retrosynthesis Prediction like a Chemist [60.463900712314754]
そこで我々は, テンプレートフリーな自動逆合成拡張アルゴリズムを考案した。
我々の方法はレトロシンセシスを2段階に分解する。
最先端のベースラインよりも優れている一方で、我々のモデルは化学的に合理的な解釈も提供する。
論文 参考訳(メタデータ) (2020-11-04T04:35:34Z) - Graph Neural Networks for the Prediction of Substrate-Specific Organic
Reaction Conditions [79.45090959869124]
有機化学反応をモデル化するために,グラフニューラルネットワーク(GNN)を用いた系統的研究を行った。
実験試薬と条件の識別に関わる分類タスクに対して、7つの異なるGNNアーキテクチャを評価した。
論文 参考訳(メタデータ) (2020-07-08T17:21:00Z) - Predictive modeling approaches in laser-based material processing [59.04160452043105]
本研究の目的は,レーザー加工が材料構造に及ぼす影響を自動予測することである。
その焦点は、統計的および機械学習の代表的なアルゴリズムのパフォーマンスに焦点を当てている。
結果は、材料設計、テスト、生産コストを削減するための体系的な方法論の基礎を設定することができる。
論文 参考訳(メタデータ) (2020-06-13T17:28:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。