論文の概要: Root-aligned SMILES for Molecular Retrosynthesis Prediction
- arxiv url: http://arxiv.org/abs/2203.11444v1
- Date: Tue, 22 Mar 2022 03:50:04 GMT
- ステータス: 処理完了
- システム内更新日: 2022-03-24 05:57:05.654419
- Title: Root-aligned SMILES for Molecular Retrosynthesis Prediction
- Title(参考訳): 分子再合成予測のためのルートアライメントスマイル
- Authors: Zipeng Zhong, Jie Song, Zunlei Feng, Tiantao Liu, Lingxiang Jia,
Shaolun Liu, Min Wu, Tingjun Hou and Mingli Song
- Abstract要約: 再合成予測は有機合成の基本的な問題であり、標的分子の合成に使用できる前駆体分子を発見することが目的である。
既存の計算逆合成手法の一般的なパラダイムは、列から列への変換問題として再合成予測を定式化する。
本稿では,製品と反応するSMILES間の一対一マッピングを厳密に整列するルート整列SMILES(R-SMILES)を提案する。
- 参考スコア(独自算出の注目度): 31.818364437526885
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Retrosynthesis prediction is a fundamental problem in organic synthesis,
where the task is to discover precursor molecules that can be used to
synthesize a target molecule. A popular paradigm of existing computational
retrosynthesis methods formulate retrosynthesis prediction as a
sequence-to-sequence translation problem, where the typical SMILES
representations are adopted for both reactants and products. However, the
general-purpose SMILES neglects the characteristics of retrosynthesis that 1)
the search space of the reactants is quite huge, and 2) the molecular graph
topology is largely unaltered from products to reactants, resulting in the
suboptimal performance of SMILES if straightforwardly applied. In this article,
we propose the root-aligned SMILES~(R-SMILES), which specifies a tightly
aligned one-to-one mapping between the product and the reactant SMILES, to
narrow the string representation discrepancy for more efficient retrosynthesis.
As the minimum edit distance between the input and the output is significantly
decreased with the proposed R-SMILES, the computational model is largely
relieved from learning the complex syntax and dedicated to learning the
chemical knowledge for retrosynthesis. We compare the proposed R-SMILES with
various state-of-the-art baselines on different benchmarks and show that it
significantly outperforms them all, demonstrating the superiority of the
proposed method.
- Abstract(参考訳): 再合成予測は有機合成の基本的な問題であり、標的分子の合成に使用できる前駆体分子を発見することが目的である。
既存の計算逆合成法の一般的なパラダイムは、レトロ合成予測をシーケンスからシーケンスへの変換問題として定式化し、典型的なSMILES表現を反応剤と生成物の両方に採用する。
しかし、汎用SMILESはレトロ合成の特徴を無視している。
1)反応物の探索空間は非常に巨大で,
2) 分子グラフトポロジーは生成物から反応物までほとんど変化せず, 直接適用すればSMILESの準最適性能が得られる。
本稿では,より効率的なレトロシンセシスのための文字列表現の不一致を狭めるために,製品と反応対象のスマイルの間の1対1の密結合を規定するルートアライメントスマイル~(r-スマイル)を提案する。
提案したR-SMILESでは,入力と出力の最小編集距離が大幅に減少するので,計算モデルは複雑な構文の学習から解放され,逆合成のための化学知識の学習に専念する。
提案するr-smilesを様々なベンチマークにおける最先端のベースラインと比較し,提案手法の優れていることを示す。
関連論文リスト
- BatGPT-Chem: A Foundation Large Model For Retrosynthesis Prediction [65.93303145891628]
BatGPT-Chemは150億のパラメータを持つ大規模な言語モデルであり、再合成予測の強化に最適化されている。
我々のモデルは幅広い化学知識を捉え、反応条件の正確な予測を可能にする。
この開発により、化学者は新しい化合物を十分に扱うことができ、医薬品製造と材料科学の革新サイクルを早める可能性がある。
論文 参考訳(メタデータ) (2024-08-19T05:17:40Z) - Retrosynthesis prediction enhanced by in-silico reaction data
augmentation [66.5643280109899]
RetroWISEは,実データから推定されるベースモデルを用いて,シリコン内反応の生成と増大を行うフレームワークである。
3つのベンチマークデータセットで、RetroWISEは最先端モデルに対して最高の全体的なパフォーマンスを達成する。
論文 参考訳(メタデータ) (2024-01-31T07:40:37Z) - MARS: A Motif-based Autoregressive Model for Retrosynthesis Prediction [54.75583184356392]
本稿では,レトロシンセシス予測のための新しいエンドツーエンドグラフ生成モデルを提案する。
反応中心を逐次同定し、合成子を生成し、合成子にモチーフを加えて反応子を生成する。
ベンチマークデータセットの実験では、提案されたモデルが従来の最先端のアルゴリズムを大幅に上回っていることが示されている。
論文 参考訳(メタデータ) (2022-09-27T06:29:35Z) - Modeling Diverse Chemical Reactions for Single-step Retrosynthesis via
Discrete Latent Variables [43.900173434781905]
単段階の逆合成の目標は、1回の反応で標的生成物の合成に繋がる可能性のある反応物質を同定することである。
既存の配列に基づくレトロ合成法は、生成物から反応物へのレトロ合成を配列から配列への翻訳問題として扱う。
本稿では,条件付き変分オートエンコーダを1ステップの逆合成に組み込んだRetroDVCAEを提案する。
論文 参考訳(メタデータ) (2022-08-10T14:50:32Z) - Retroformer: Pushing the Limits of Interpretable End-to-end
Retrosynthesis Transformer [15.722719721123054]
再合成予測は有機合成の基本的な課題の1つである。
本稿では,レトロシンセシス予測のためのトランスフォーマーに基づく新しいアーキテクチャであるRetroformerを提案する。
Retroformerは、エンドツーエンドのテンプレートフリーレトロシンセシスのための新しい最先端の精度に達する。
論文 参考訳(メタデータ) (2022-01-29T02:03:55Z) - Permutation invariant graph-to-sequence model for template-free
retrosynthesis and reaction prediction [2.5655440962401617]
本稿では,テキスト生成のためのトランスフォーマーモデルのパワーと,分子グラフエンコーダの置換不変性を組み合わせた新しいGraph2SMILESモデルについて述べる。
エンドツーエンドアーキテクチャとして、Graph2SMILESは、分子から分子への変換を含むあらゆるタスクにおいて、Transformerのドロップイン置換として使用できる。
論文 参考訳(メタデータ) (2021-10-19T01:23:15Z) - RetCL: A Selection-based Approach for Retrosynthesis via Contrastive
Learning [107.64562550844146]
レトロシンセシスは深層学習の新たな研究分野である。
本稿では, 市販分子の候補群から, 反応物質の選択問題へとレトロシンセシスを再構成する新しいアプローチを提案する。
スコア機能を学ぶために、ハードネガティブマイニングを備えた新しいコントラストトレーニングスキームも提案します。
論文 参考訳(メタデータ) (2021-05-03T12:47:57Z) - RetroXpert: Decompose Retrosynthesis Prediction like a Chemist [60.463900712314754]
そこで我々は, テンプレートフリーな自動逆合成拡張アルゴリズムを考案した。
我々の方法はレトロシンセシスを2段階に分解する。
最先端のベースラインよりも優れている一方で、我々のモデルは化学的に合理的な解釈も提供する。
論文 参考訳(メタデータ) (2020-11-04T04:35:34Z) - Retrosynthesis Prediction with Conditional Graph Logic Network [118.70437805407728]
コンピュータ支援のレトロシンセシスは、化学と計算機科学の双方から新たな関心を集めている。
本稿では,グラフニューラルネットワーク上に構築された条件付きグラフィカルモデルであるConditional Graph Logic Networkを用いて,この課題に対する新しいアプローチを提案する。
論文 参考訳(メタデータ) (2020-01-06T05:36:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。