論文の概要: Beyond Major Product Prediction: Reproducing Reaction Mechanisms with
Machine Learning Models Trained on a Large-Scale Mechanistic Dataset
- arxiv url: http://arxiv.org/abs/2403.04580v1
- Date: Thu, 7 Mar 2024 15:26:23 GMT
- ステータス: 処理完了
- システム内更新日: 2024-03-08 13:32:47.042269
- Title: Beyond Major Product Prediction: Reproducing Reaction Mechanisms with
Machine Learning Models Trained on a Large-Scale Mechanistic Dataset
- Title(参考訳): 主要製品予測を超えて:大規模機械力学データセットで訓練された機械学習モデルによる反応メカニズムの再現
- Authors: Joonyoung F. Joung, Mun Hong Fong, Jihye Roh, Zhengkai Tu, John
Bradshaw, Connor W. Coley
- Abstract要約: 有機反応の機械的理解は、反応の発生、不純物予測、そして原則として反応発見を促進する。
いくつかの機械学習モデルは、反応生成物を予測するタスクに対処しようとしているが、反応機構を予測するための拡張は、対応する力学データセットの欠如によって妨げられている。
実験によって報告された反応物質と生成物の中間体を専門家の反応テンプレートを用いて入力し、その結果の5,184,184個の基本ステップに基づいて機械学習モデルを訓練することにより、そのようなデータセットを構築する。
- 参考スコア(独自算出の注目度): 10.968137261042715
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Mechanistic understanding of organic reactions can facilitate reaction
development, impurity prediction, and in principle, reaction discovery. While
several machine learning models have sought to address the task of predicting
reaction products, their extension to predicting reaction mechanisms has been
impeded by the lack of a corresponding mechanistic dataset. In this study, we
construct such a dataset by imputing intermediates between experimentally
reported reactants and products using expert reaction templates and train
several machine learning models on the resulting dataset of 5,184,184
elementary steps. We explore the performance and capabilities of these models,
focusing on their ability to predict reaction pathways and recapitulate the
roles of catalysts and reagents. Additionally, we demonstrate the potential of
mechanistic models in predicting impurities, often overlooked by conventional
models. We conclude by evaluating the generalizability of mechanistic models to
new reaction types, revealing challenges related to dataset diversity,
consecutive predictions, and violations of atom conservation.
- Abstract(参考訳): 有機反応の機械的理解は、反応の発生、不純物予測、そして原則として反応発見を促進する。
いくつかの機械学習モデルは、反応生成物を予測するタスクに対処しようとしているが、反応機構を予測するための拡張は、対応する力学データセットの欠如によって妨げられている。
本研究では,実験によって報告された反応物質と生成物の中間体を専門家反応テンプレートを用いて入力し,その結果の5,184,184個の基本ステップに基づいて機械学習モデルを訓練することにより,そのようなデータセットを構築する。
反応経路を予測し, 触媒や試薬の役割を再認識する能力に着目し, これらのモデルの性能と能力について検討した。
さらに, 従来のモデルでは見過ごされることが多い不純物予測における機械モデルの可能性を示す。
我々は,新しい反応型に対する力学モデルの一般化可能性を評価し,データセットの多様性,連続予測,原子保存違反に関連する課題を明らかにする。
関連論文リスト
- Electron flow matching for generative reaction mechanism prediction obeying conservation laws [8.136277960071032]
この研究は、現代のフローマッチングの深層生成フレームワークを用いて、電子再分配の問題として反応予測の問題を再考する。
我々のモデルであるFlowERは、正確な質量保存を強制することで制限を克服し、幻覚障害モードを解消する。
FlowERはまた、熱力学または動力学的実現可能性の推定を可能にし、反応予測タスクにおける化学直観の程度を示す。
論文 参考訳(メタデータ) (2025-02-18T16:01:17Z) - Challenging reaction prediction models to generalize to novel chemistry [12.33727805025678]
本稿では,SMILESに基づく深層学習モデルの一連の評価について報告する。
まず、ランダムにサンプリングされたデータセットのパフォーマンスが、新しい特許や新しい著者に一般化する際のパフォーマンスと比べて、過度に楽観的であることを示す。
第二に、トレーニングセットの何年にもわたってテストされたモデルがどのように機能するかを評価する時間分割を実施し、実際のデプロイメントを模倣します。
論文 参考訳(メタデータ) (2025-01-11T23:49:14Z) - Chimera: Accurate retrosynthesis prediction by ensembling models with diverse inductive biases [3.885174353072695]
化学合成の計画と実行は、機能的な小さな分子の発見において大きなボトルネックとなっている。
化学者が反応モデルを構築するためのフレームワークであるChimeraを提案する。
論文 参考訳(メタデータ) (2024-12-06T18:55:19Z) - Learning Chemical Reaction Representation with Reactant-Product Alignment [50.28123475356234]
RAlignは、様々な有機反応関連タスクのための新しい化学反応表現学習モデルである。
反応物質と生成物との原子対応を統合することにより、反応中に起こる分子変換を識別する。
モデルが重要な機能群に集中できるように,反応中心認識型アテンション機構を導入する。
論文 参考訳(メタデータ) (2024-11-26T17:41:44Z) - ReactAIvate: A Deep Learning Approach to Predicting Reaction Mechanisms and Unmasking Reactivity Hotspots [4.362338454684645]
我々は,反応ステップ分類の精度を96%とほぼ均一に達成した,解釈可能な注意に基づくGNNを開発した。
我々のモデルは、配布外クラスからでも、キー原子を十分に識別します。
この一般性は、モジュラーな方法で新しい反応型を包含することができるため、新しい分子の反応性を理解するための専門家にとって価値がある。
論文 参考訳(メタデータ) (2024-07-14T05:53:18Z) - Retrosynthesis prediction enhanced by in-silico reaction data
augmentation [66.5643280109899]
RetroWISEは,実データから推定されるベースモデルを用いて,シリコン内反応の生成と増大を行うフレームワークである。
3つのベンチマークデータセットで、RetroWISEは最先端モデルに対して最高の全体的なパフォーマンスを達成する。
論文 参考訳(メタデータ) (2024-01-31T07:40:37Z) - Improving Molecular Representation Learning with Metric
Learning-enhanced Optimal Transport [49.237577649802034]
分子レグレッション問題に対する一般化能力を高めるために,MROTと呼ばれる新しい最適輸送ベースアルゴリズムを開発した。
MROTは最先端のモデルよりも優れており、新しい物質の発見を加速する有望な可能性を示している。
論文 参考訳(メタデータ) (2022-02-13T04:56:18Z) - RetroXpert: Decompose Retrosynthesis Prediction like a Chemist [60.463900712314754]
そこで我々は, テンプレートフリーな自動逆合成拡張アルゴリズムを考案した。
我々の方法はレトロシンセシスを2段階に分解する。
最先端のベースラインよりも優れている一方で、我々のモデルは化学的に合理的な解釈も提供する。
論文 参考訳(メタデータ) (2020-11-04T04:35:34Z) - Graph Neural Networks for the Prediction of Substrate-Specific Organic
Reaction Conditions [79.45090959869124]
有機化学反応をモデル化するために,グラフニューラルネットワーク(GNN)を用いた系統的研究を行った。
実験試薬と条件の識別に関わる分類タスクに対して、7つの異なるGNNアーキテクチャを評価した。
論文 参考訳(メタデータ) (2020-07-08T17:21:00Z) - Predictive modeling approaches in laser-based material processing [59.04160452043105]
本研究の目的は,レーザー加工が材料構造に及ぼす影響を自動予測することである。
その焦点は、統計的および機械学習の代表的なアルゴリズムのパフォーマンスに焦点を当てている。
結果は、材料設計、テスト、生産コストを削減するための体系的な方法論の基礎を設定することができる。
論文 参考訳(メタデータ) (2020-06-13T17:28:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。