論文の概要: G-MATT: Single-step Retrosynthesis Prediction using Molecular Grammar
Tree Transformer
- arxiv url: http://arxiv.org/abs/2305.03153v1
- Date: Thu, 4 May 2023 21:04:19 GMT
- ステータス: 処理完了
- システム内更新日: 2023-05-08 16:05:32.470762
- Title: G-MATT: Single-step Retrosynthesis Prediction using Molecular Grammar
Tree Transformer
- Title(参考訳): G-MATT:分子文法木変換器を用いた単段階再合成予測
- Authors: Kevin Zhang, Vipul Mann, Venkat Venkatasubramanian
- Abstract要約: 本稿では,強力なデータ駆動モデルと化学知識を組み合わせた化学認識逆合成予測フレームワークを提案する。
提案フレームワークは, ベースライン再合成モデルと比較して, 大幅な性能向上を実現している。
- 参考スコア(独自算出の注目度): 0.3867363075280543
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: In recent years, several reaction templates-based and template-free
approaches have been reported for single-step retrosynthesis prediction. Even
though many of these approaches perform well from traditional data-driven
metrics standpoint, there is a disconnect between model architectures used and
underlying chemistry principles governing retrosynthesis. Here, we propose a
novel chemistry-aware retrosynthesis prediction framework that combines
powerful data-driven models with chemistry knowledge. We report a
tree-to-sequence transformer architecture based on hierarchical SMILES grammar
trees as input containing underlying chemistry information that is otherwise
ignored by models based on purely SMILES-based representations. The proposed
framework, grammar-based molecular attention tree transformer (G-MATT),
achieves significant performance improvements compared to baseline
retrosynthesis models. G-MATT achieves a top-1 accuracy of 51% (top-10 accuracy
of 79.1%), invalid rate of 1.5%, and bioactive similarity rate of 74.8%.
Further analyses based on attention maps demonstrate G-MATT's ability to
preserve chemistry knowledge without having to use extremely complex model
architectures.
- Abstract(参考訳): 近年, 反応テンプレートとテンプレートフリーアプローチが, 単段階再合成予測のために報告されている。
これらのアプローチの多くは、従来のデータ駆動メトリクスの観点からうまく機能するが、使用されるモデルアーキテクチャと、レトロシンセシスを規定する基礎となる化学原理との間には断絶がある。
本稿では,強力なデータ駆動モデルと化学知識を組み合わせた,新しい化学対応レトロシンセシス予測フレームワークを提案する。
本稿では,階層型SMILES文法木に基づくツリー・ツー・シーケンス・トランスフォーマアーキテクチャを,純粋にSMILESに基づく表現に基づくモデルで無視される基礎となる化学情報を含む入力として報告する。
提案するフレームワークであるG-MATT(G-MATT)は,ベースライン再合成モデルと比較して大幅な性能向上を実現している。
G-MATTは51%(トップ10は79.1%)、無効率は1.5%、生物活性類似率は74.8%である。
注意図に基づくさらなる分析は、非常に複雑なモデルアーキテクチャを使わずに、G-MATTの化学知識の保存能力を示す。
関連論文リスト
- BatGPT-Chem: A Foundation Large Model For Retrosynthesis Prediction [65.93303145891628]
BatGPT-Chemは150億のパラメータを持つ大規模な言語モデルであり、再合成予測の強化に最適化されている。
我々のモデルは幅広い化学知識を捉え、反応条件の正確な予測を可能にする。
この開発により、化学者は新しい化合物を十分に扱うことができ、医薬品製造と材料科学の革新サイクルを早める可能性がある。
論文 参考訳(メタデータ) (2024-08-19T05:17:40Z) - UAlign: Pushing the Limit of Template-free Retrosynthesis Prediction with Unsupervised SMILES Alignment [51.49238426241974]
本稿では,テンプレートのないグラフ・ツー・シーケンスパイプラインであるUAlignを紹介した。
グラフニューラルネットワークとトランスフォーマーを組み合わせることで、分子固有のグラフ構造をより効果的に活用することができる。
論文 参考訳(メタデータ) (2024-03-25T03:23:03Z) - Retrosynthesis prediction enhanced by in-silico reaction data
augmentation [66.5643280109899]
RetroWISEは,実データから推定されるベースモデルを用いて,シリコン内反応の生成と増大を行うフレームワークである。
3つのベンチマークデータセットで、RetroWISEは最先端モデルに対して最高の全体的なパフォーマンスを達成する。
論文 参考訳(メタデータ) (2024-01-31T07:40:37Z) - Retrosynthesis Prediction with Local Template Retrieval [112.23386062396622]
特定の標的分子の反応を予測する再合成は、薬物発見に必須の課題である。
本稿では,局所的な反応テンプレート検索手法であるRetroKNNを紹介する。
我々は、広く使われている2つのベンチマーク、USPTO-50KとUSPTO-MITで包括的な実験を行う。
論文 参考訳(メタデータ) (2023-06-07T03:38:03Z) - G2GT: Retrosynthesis Prediction with Graph to Graph Attention Neural
Network and Self-Training [0.0]
再合成予測は有機化学および関連分野における基本的な課題の1つである。
本稿では,グラフエンコーダとグラフデコーダを標準トランス構造上に構築した新しいグラフ-グラフ変換モデルG2GTを提案する。
本稿では,データ拡張手法である自己学習が,モデルの性能を著しく向上させることを示す。
論文 参考訳(メタデータ) (2022-04-19T01:55:52Z) - Permutation invariant graph-to-sequence model for template-free
retrosynthesis and reaction prediction [2.5655440962401617]
本稿では,テキスト生成のためのトランスフォーマーモデルのパワーと,分子グラフエンコーダの置換不変性を組み合わせた新しいGraph2SMILESモデルについて述べる。
エンドツーエンドアーキテクチャとして、Graph2SMILESは、分子から分子への変換を含むあらゆるタスクにおいて、Transformerのドロップイン置換として使用できる。
論文 参考訳(メタデータ) (2021-10-19T01:23:15Z) - Machine learning with persistent homology and chemical word embeddings
improves prediction accuracy and interpretability in metal-organic frameworks [0.07874708385247352]
材料の構造と化学の複雑な表現をキャプチャする記述子を自動的に生成するエンド・ツー・エンドの機械学習モデルを提案する。
物質系から直接、幾何学的および化学的情報をカプセル化する。
提案手法は, 対象物間での精度, 転送可能性の両面において, 一般的に用いられている手作業による特徴量から構築したモデルに比べ, かなり改善されている。
論文 参考訳(メタデータ) (2020-10-01T16:31:46Z) - Energy-based View of Retrosynthesis [70.66156081030766]
エネルギーモデルとしてシーケンスおよびグラフベースの手法を統一するフレームワークを提案する。
本稿では,ベイズ前方および後方予測に対して一貫した訓練を行うフレームワーク内での新しい二重変種を提案する。
このモデルは、反応型が不明なテンプレートフリーアプローチに対して、最先端の性能を9.6%向上させる。
論文 参考訳(メタデータ) (2020-07-14T18:51:06Z) - State-of-the-Art Augmented NLP Transformer models for direct and
single-step retrosynthesis [0.0]
化学物質の逆合成予測に異なる訓練シナリオが及ぼす影響について検討した。
データ拡張は、画像処理で使用される強力な方法であり、ニューラルネットワークによるデータ記憶の効果を排除した。
論文 参考訳(メタデータ) (2020-03-05T18:11:11Z) - Retrosynthesis Prediction with Conditional Graph Logic Network [118.70437805407728]
コンピュータ支援のレトロシンセシスは、化学と計算機科学の双方から新たな関心を集めている。
本稿では,グラフニューラルネットワーク上に構築された条件付きグラフィカルモデルであるConditional Graph Logic Networkを用いて,この課題に対する新しいアプローチを提案する。
論文 参考訳(メタデータ) (2020-01-06T05:36:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。