論文の概要: Retrosynthesis Prediction with Local Template Retrieval
- arxiv url: http://arxiv.org/abs/2306.04123v1
- Date: Wed, 7 Jun 2023 03:38:03 GMT
- ステータス: 処理完了
- システム内更新日: 2023-06-08 16:16:13.337409
- Title: Retrosynthesis Prediction with Local Template Retrieval
- Title(参考訳): 局所テンプレート検索による再合成予測
- Authors: Shufang Xie, Rui Yan, Junliang Guo, Yingce Xia, Lijun Wu, Tao Qin
- Abstract要約: 特定の標的分子の反応を予測する再合成は、薬物発見に必須の課題である。
本稿では,局所的な反応テンプレート検索手法であるRetroKNNを紹介する。
我々は、広く使われている2つのベンチマーク、USPTO-50KとUSPTO-MITで包括的な実験を行う。
- 参考スコア(独自算出の注目度): 112.23386062396622
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Retrosynthesis, which predicts the reactants of a given target molecule, is
an essential task for drug discovery. In recent years, the machine learing
based retrosynthesis methods have achieved promising results. In this work, we
introduce RetroKNN, a local reaction template retrieval method to further boost
the performance of template-based systems with non-parametric retrieval. We
first build an atom-template store and a bond-template store that contain the
local templates in the training data, then retrieve from these templates with a
k-nearest-neighbor (KNN) search during inference. The retrieved templates are
combined with neural network predictions as the final output. Furthermore, we
propose a lightweight adapter to adjust the weights when combing neural network
and KNN predictions conditioned on the hidden representation and the retrieved
templates. We conduct comprehensive experiments on two widely used benchmarks,
the USPTO-50K and USPTO-MIT. Especially for the top-1 accuracy, we improved
7.1% on the USPTO-50K dataset and 12.0% on the USPTO-MIT dataset. These results
demonstrate the effectiveness of our method.
- Abstract(参考訳): 特定の標的分子の反応物質を予測するレトロシンセシスは、薬物の発見に必須の課題である。
近年,機械リースによるレトロシンセシス法は有望な成果を上げている。
本研究では,非パラメトリック検索によるテンプレートベースシステムの性能向上を目的とした局所的反応テンプレート検索手法RetroKNNを紹介する。
まず、トレーニングデータにローカルテンプレートを含むatom-templateストアとボンドテンプレートストアを構築し、推論中にk-nearest-neighbor(knn)検索でこれらのテンプレートから取得します。
検索されたテンプレートは、最終的な出力としてニューラルネットワーク予測と組み合わせられる。
さらに、隠れ表現と検索テンプレートに条件付きニューラルネットワークとKNN予測を併用する際の重みを調整するための軽量アダプタを提案する。
我々は、広く使われている2つのベンチマーク、USPTO-50KとUSPTO-MITで包括的な実験を行う。
特にトップ1の精度では、USPTO-50Kデータセットで7.1%、USPTO-MITデータセットで12.0%改善しました。
これらの結果は,本手法の有効性を示すものである。
関連論文リスト
- UAlign: Pushing the Limit of Template-free Retrosynthesis Prediction with Unsupervised SMILES Alignment [51.49238426241974]
本稿では,テンプレートのないグラフ・ツー・シーケンスパイプラインであるUAlignを紹介した。
グラフニューラルネットワークとトランスフォーマーを組み合わせることで、分子固有のグラフ構造をより効果的に活用することができる。
論文 参考訳(メタデータ) (2024-03-25T03:23:03Z) - Retrosynthesis prediction enhanced by in-silico reaction data
augmentation [66.5643280109899]
RetroWISEは,実データから推定されるベースモデルを用いて,シリコン内反応の生成と増大を行うフレームワークである。
3つのベンチマークデータセットで、RetroWISEは最先端モデルに対して最高の全体的なパフォーマンスを達成する。
論文 参考訳(メタデータ) (2024-01-31T07:40:37Z) - G-MATT: Single-step Retrosynthesis Prediction using Molecular Grammar
Tree Transformer [0.0]
本稿では、強力なデータ駆動モデルと事前のドメイン知識を組み合わせた化学対応の逆合成予測フレームワークを提案する。
提案するフレームワークであるG-MATT(G-MATT)は,ベースラインレトロシンセシスモデルと比較して,大幅な性能向上を実現している。
論文 参考訳(メタデータ) (2023-05-04T21:04:19Z) - SemiRetro: Semi-template framework boosts deep retrosynthesis prediction [38.42917984016527]
テンプレートベース (TB) およびテンプレートフリー (TF) 分子グラフ学習法は, 再合成に有望な結果を示した。
フルテンプレートをいくつかの半テンプレートに分割し、2段階のTFフレームワークに組み込むことを提案する。
実験の結果,SemiRetroは既存のTB法とTF法の両方で有意に優れていた。
論文 参考訳(メタデータ) (2022-02-12T00:38:11Z) - RetroComposer: Discovering Novel Reactions by Composing Templates for
Retrosynthesis Prediction [63.14937611038264]
本稿では,テンプレート以外の新しいテンプレートを構築可能な,革新的な再合成予測フレームワークを提案する。
実験結果から,USPTO-50Kデータセットにおいて,328個のテスト反応のためのテンプレートを新たに作成できることが示唆された。
論文 参考訳(メタデータ) (2021-12-20T05:57:07Z) - Permutation invariant graph-to-sequence model for template-free
retrosynthesis and reaction prediction [2.5655440962401617]
本稿では,テキスト生成のためのトランスフォーマーモデルのパワーと,分子グラフエンコーダの置換不変性を組み合わせた新しいGraph2SMILESモデルについて述べる。
エンドツーエンドアーキテクチャとして、Graph2SMILESは、分子から分子への変換を含むあらゆるタスクにおいて、Transformerのドロップイン置換として使用できる。
論文 参考訳(メタデータ) (2021-10-19T01:23:15Z) - RetCL: A Selection-based Approach for Retrosynthesis via Contrastive
Learning [107.64562550844146]
レトロシンセシスは深層学習の新たな研究分野である。
本稿では, 市販分子の候補群から, 反応物質の選択問題へとレトロシンセシスを再構成する新しいアプローチを提案する。
スコア機能を学ぶために、ハードネガティブマイニングを備えた新しいコントラストトレーニングスキームも提案します。
論文 参考訳(メタデータ) (2021-05-03T12:47:57Z) - State-of-the-Art Augmented NLP Transformer models for direct and
single-step retrosynthesis [0.0]
化学物質の逆合成予測に異なる訓練シナリオが及ぼす影響について検討した。
データ拡張は、画像処理で使用される強力な方法であり、ニューラルネットワークによるデータ記憶の効果を排除した。
論文 参考訳(メタデータ) (2020-03-05T18:11:11Z) - Assessing Graph-based Deep Learning Models for Predicting Flash Point [52.931492216239995]
グラフベースのディープラーニング(GBDL)モデルは初めてフラッシュポイントを予測するために実装された。
MPNNの平均R2と平均絶対誤差(MAE)は、それぞれ2.3%低、2.0K高である。
論文 参考訳(メタデータ) (2020-02-26T06:10:12Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。