論文の概要: A Transformer Model for Predicting Chemical Products from Generic SMARTS Templates with Data Augmentation
- arxiv url: http://arxiv.org/abs/2503.05810v3
- Date: Wed, 24 Sep 2025 10:24:14 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-25 16:23:42.152194
- Title: A Transformer Model for Predicting Chemical Products from Generic SMARTS Templates with Data Augmentation
- Title(参考訳): データ拡張によるSMARTSテンプレートからの化学生成物予測用トランスフォーマモデル
- Authors: Derin Ozer, Sylvain Lamprier, Thomas Cauchy, Nicolas Gutowski, Benoit Da Mota,
- Abstract要約: この研究は、SMARTSで書かれた20の一般的な反応テンプレートを含む集合であるBroad Reaction Set (BRS)を提案する。
また、SMARTS反応テンプレートを直接処理および適用できるT5ベースのモデルであるProPreT5を紹介する。
- 参考スコア(独自算出の注目度): 9.031561779530126
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The accurate prediction of chemical reaction outcomes is a major challenge in computational chemistry. Current models rely heavily on either highly specific reaction templates or template-free methods, both of which present limitations. To address these, this work proposes the Broad Reaction Set (BRS), a set featuring 20 generic reaction templates written in SMARTS, a pattern-based notation designed to describe substructures and reactivity. Additionally, we introduce ProPreT5, a T5-based model specifically adapted for chemistry and, to the best of our knowledge, the first language model capable of directly handling and applying SMARTS reaction templates. To further improve generalization, we propose the first augmentation strategy for SMARTS, which injects structural diversity at the pattern level. Trained on augmented templates, ProPreT5 demonstrates strong predictive performance and generalization to unseen reactions. Together, these contributions provide a novel and practical alternative to current methods, advancing the field of template-based reaction prediction.
- Abstract(参考訳): 化学反応の結果の正確な予測は、計算化学における大きな課題である。
現在のモデルは、非常に特殊な反応テンプレートやテンプレートなしの手法に大きく依存しており、どちらも制限がある。
SMARTSで書かれた20のジェネリックな反応テンプレートを備えた集合であるBroad Reaction Set (BRS)を提案し、サブ構造と反応性を記述するために設計されたパターンベースの表記法を提案する。
さらに,化学に特化して適合するT5ベースのモデルであるProPreT5を紹介し,SMARTS反応テンプレートを直接処理および適用できる最初の言語モデルである。
一般化をさらに向上するために,パターンレベルで構造的多様性を注入するSMARTSの最初の拡張戦略を提案する。
拡張テンプレートに基づいてトレーニングされたProPreT5は、強い予測性能と、目に見えない反応への一般化を示す。
これらの貢献は、テンプレートベースの反応予測の分野を前進させ、現在の方法に代わる、新しく実用的な代替手段を提供する。
関連論文リスト
- Learning Chemical Reaction Representation with Reactant-Product Alignment [50.28123475356234]
RAlignは、様々な有機反応関連タスクのための新しい化学反応表現学習モデルである。
反応物質と生成物との原子対応を統合することにより、反応中に起こる分子変換を識別する。
モデルが重要な機能群に集中できるように,反応中心認識型アテンション機構を導入する。
論文 参考訳(メタデータ) (2024-11-26T17:41:44Z) - BatGPT-Chem: A Foundation Large Model For Retrosynthesis Prediction [65.93303145891628]
BatGPT-Chemは150億のパラメータを持つ大規模な言語モデルであり、再合成予測の強化に最適化されている。
我々のモデルは幅広い化学知識を捉え、反応条件の正確な予測を可能にする。
この開発により、化学者は新しい化合物を十分に扱うことができ、医薬品製造と材料科学の革新サイクルを早める可能性がある。
論文 参考訳(メタデータ) (2024-08-19T05:17:40Z) - UAlign: Pushing the Limit of Template-free Retrosynthesis Prediction with Unsupervised SMILES Alignment [51.49238426241974]
本稿では,テンプレートのないグラフ・ツー・シーケンスパイプラインであるUAlignを紹介した。
グラフニューラルネットワークとトランスフォーマーを組み合わせることで、分子固有のグラフ構造をより効果的に活用することができる。
論文 参考訳(メタデータ) (2024-03-25T03:23:03Z) - Assessing the Extrapolation Capability of Template-Free Retrosynthesis
Models [0.7770029179741429]
本研究では, 最先端のテンプレートフリーモデルの外挿能力を実験的に評価し, 広範囲なオフ・オブ・ディストリビューション(OOD)反応を巧みに組み立てた。
その結果, テンプレートフリーモデルでは新しい規則による合成を予測できるが, OOD反応におけるトップ10の精度は著しく低調であることがわかった。
論文 参考訳(メタデータ) (2024-02-29T00:48:17Z) - ReactionT5: a large-scale pre-trained model towards application of
limited reaction data [4.206175795966693]
トランスフォーマーベースのディープニューラルネットワークは、分子を記号配列として扱うことによって、分子関連予測タスクの分野に革命をもたらした。
本稿では,オープン・リアクション・データベース(ORD)の事前学習を利用する新しいモデルであるReactionT5を提案する。
我々はさらに、収量予測と製品予測タスクのためにこのモデルを微調整し、限られた微調整データでもその印象的な性能を実証する。
論文 参考訳(メタデータ) (2023-11-12T02:25:00Z) - Molecule-Edit Templates for Efficient and Accurate Retrosynthesis
Prediction [0.16070833439280313]
最小限のテンプレートを用いて反応を予測する機械学習モデルMETROを紹介する。
標準ベンチマークで最先端の結果を得る。
論文 参考訳(メタデータ) (2023-10-11T09:00:02Z) - RetroComposer: Discovering Novel Reactions by Composing Templates for
Retrosynthesis Prediction [63.14937611038264]
本稿では,テンプレート以外の新しいテンプレートを構築可能な,革新的な再合成予測フレームワークを提案する。
実験結果から,USPTO-50Kデータセットにおいて,328個のテスト反応のためのテンプレートを新たに作成できることが示唆された。
論文 参考訳(メタデータ) (2021-12-20T05:57:07Z) - Non-Autoregressive Electron Redistribution Modeling for Reaction
Prediction [26.007965383304864]
反応を1ショットで予測する非自己回帰学習パラダイムを考案する。
任意の電子フローとして反応を定式化し、新しいマルチポインター復号ネットワークで予測する。
USPTO-MITデータセットの実験により、我々の手法は最先端のトップ1の精度を確立した。
論文 参考訳(メタデータ) (2021-06-08T16:39:08Z) - RetCL: A Selection-based Approach for Retrosynthesis via Contrastive
Learning [107.64562550844146]
レトロシンセシスは深層学習の新たな研究分野である。
本稿では, 市販分子の候補群から, 反応物質の選択問題へとレトロシンセシスを再構成する新しいアプローチを提案する。
スコア機能を学ぶために、ハードネガティブマイニングを備えた新しいコントラストトレーニングスキームも提案します。
論文 参考訳(メタデータ) (2021-05-03T12:47:57Z) - Learning Graph Models for Retrosynthesis Prediction [90.15523831087269]
再合成予測は有機合成の基本的な問題である。
本稿では,前駆体分子のグラフトポロジーが化学反応中にほとんど変化しないという考え方を生かしたグラフベースのアプローチを提案する。
提案モデルでは,テンプレートフリーおよび半テンプレートベースの手法よりも高い5,3.7%の精度でトップ1の精度を実現している。
論文 参考訳(メタデータ) (2020-06-12T09:40:42Z) - Retrosynthesis Prediction with Conditional Graph Logic Network [118.70437805407728]
コンピュータ支援のレトロシンセシスは、化学と計算機科学の双方から新たな関心を集めている。
本稿では,グラフニューラルネットワーク上に構築された条件付きグラフィカルモデルであるConditional Graph Logic Networkを用いて,この課題に対する新しいアプローチを提案する。
論文 参考訳(メタデータ) (2020-01-06T05:36:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。