論文の概要: RETROSPECT: RETROsynthesis via Sequential Prediction, and Chemically Transformed-ranking
- arxiv url: http://arxiv.org/abs/2606.07181v1
- Date: Fri, 05 Jun 2026 11:45:36 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-08 14:33:29.718979
- Title: RETROSPECT: RETROsynthesis via Sequential Prediction, and Chemically Transformed-ranking
- Title(参考訳): RETROSPECT: 逐次予測と化学変換によるRETRO合成
- Authors: Raja Sekhar Pappala, Shreyas Vinaya Sathyanarayana, Ronit Kumar Choudhary, Arjun Verma, Deepak Warrier,
- Abstract要約: シングルステップのレトロシンセシスには、正確なファーストランクの提案と、下流の選択に十分な候補リストの両方が必要である。
私たちのシステムであるRETROSPECTは、ChemAlign Transformerと呼ばれる単一のTransformer提案モデルとLambdaリランカを組み合わせたものです。
この発電機は、ハイブリッドなルートアライメントとランダムなSMILES増強、Pre-LayerNorm、ボンド埋め込み、指数的な移動平均重量、異なる原子バランスの補助損失で訓練されている。
- 参考スコア(独自算出の注目度): 0.004129405224409433
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Single-step retrosynthesis needs both accurate first-ranked suggestions and candidate lists that are rich enough for downstream selection. We study this as a proposal-selection decomposition. Our system, RETROSPECT, combines a single Transformer proposal model, which we call the ChemAlign Transformer, with a LambdaMART reranker over structural, reaction-template, upstream-score, and optional DFT-derived descriptors. The generator is trained with hybrid root-aligned and random SMILES augmentation, Pre-LayerNorm, tied embeddings, exponential moving average weights, and a differentiable atom-balance auxiliary loss. On the full USPTO-50K test set of 5,007 reactions, the generator reaches 55.00% top-1 and 86.18% top-10 exact-match accuracy with 99.86% top-1 validity. On the merged candidate-pool benchmark used for reranking, which contains 5,007 test products and about 111 candidates per product, a LambdaMART model trained on the structural feature set reaches 59.4% top-1 with 0.7171 mean reciprocal rank. Feature ablations show that upstream proposal score and template-frequency statistics provide most of the reranking signal, while DFT and reaction-center DFT features provide smaller and less consistent gains. These results support a modular view of retrosynthesis: stronger single-model proposal and learned candidate selection are complementary, and the proposal model can serve as a drop-in component for ensemble systems such as RetroChimera (Maziarz et al., 2024)
- Abstract(参考訳): シングルステップのレトロシンセシスには、正確なファーストランクの提案と、下流の選択に十分な候補リストの両方が必要である。
我々はこれを提案選択分解として研究する。
我々のシステムであるRETROSPECTは、ChemAlign Transformerと呼ばれる単一のTransformer提案モデルと、構造、リアクションテンプレート、アップストリームスコア、オプションDFT由来のディスクリプタ上のLambdaMARTリランカを組み合わせたものです。
この発電機は、ハイブリッドなルートアライメントとランダムなSMILES増強、Pre-LayerNorm、ボンド埋め込み、指数的な移動平均重量、異なる原子バランスの補助損失で訓練されている。
5,007反応の完全なUSPTO-50Kテストセットでは、ジェネレータは55.00%のトップ-1と86.18%のトップ10の精度に達し、99.86%のトップ-1が有効である。
5,007個のテスト製品と1製品当たり111個の候補を含む、再ランクに使用される統合候補プールベンチマークでは、構造的特徴セットに基づいてトレーニングされたLambdaMARTモデルは、平均相反ランク0.7171の59.4%のトップ-1に達する。
DFTとリアクション中心DFTは、より小さく、一貫性の低いゲインを提供する。
これらの結果は, より強力な単一モデルの提案と学習された候補選択が相補的であり, 提案モデルはRetroChimera(Maziarz et al , 2024)のようなアンサンブルシステムのドロップインコンポーネントとして機能する。
関連論文リスト
- Closed-Form Spectral Regularization for Multi-Task Model Merging [96.82449201305234]
モデルマージは、個別に調整された複数の専門家をトレーニングデータなしで単一のマルチタスクモデルに結合する。
State-of-the-art merging method formulate merging as a layer-wise interference problem。
本稿では,逐次降下の勾配-流路に一致するソフト指数フィルタを組み合わせた閉形式手法SWUDIを提案する。
論文 参考訳(メタデータ) (2026-06-05T14:00:47Z) - ConRetroBert: EMA Stabilized Dual Encoders for Template-Based Single-Step Retrosynthesis [2.152036255395242]
単一段階の逆合成は、明示的な反応テンプレートを選択して適用することによって反応物を予測する。
ConRetroBertは、テンプレートベースのレトロシンセシスを高密度な製品テンプレート検索として再編成するデュアルエンコーダフレームワークである。
論文 参考訳(メタデータ) (2026-05-12T20:40:22Z) - Order Matters in Retrosynthesis: Structure-aware Generation via Reaction-Center-Guided Discrete Flow Matching [18.649082246599267]
本稿では, 化学反応の2段階の性質を位置誘導バイアスとしてエンコードする構造認識型テンプレートフリーフレームワークを提案する。
提案手法は,USPTO-50k (61.2% Top-1) と大規模USPTO-Full (51.3% top-1) の双方において,反応中心を予測して最先端の性能を実現する。
論文 参考訳(メタデータ) (2026-02-13T17:39:21Z) - RETRO SYNFLOW: Discrete Flow Matching for Accurate and Diverse Single-Step Retrosynthesis [23.422202032748924]
単段階逆合成計画をモデル化し、離散フローマッチングフレームワークRETRO SynFLOW(RSF)を導入する。
我々は、シークエンシャルモンテカルロをベースとしたFeynman-Kacステアリングを用いて、推論時に有望な世代をステアリングする。
論文 参考訳(メタデータ) (2025-06-04T20:46:05Z) - Retrosynthesis Prediction with Local Template Retrieval [112.23386062396622]
特定の標的分子の反応を予測する再合成は、薬物発見に必須の課題である。
本稿では,局所的な反応テンプレート検索手法であるRetroKNNを紹介する。
我々は、広く使われている2つのベンチマーク、USPTO-50KとUSPTO-MITで包括的な実験を行う。
論文 参考訳(メタデータ) (2023-06-07T03:38:03Z) - Retrosynthetic Planning with Dual Value Networks [107.97218669277913]
我々は、PDVN(Planning with Dual Value Networks)と呼ばれる新しいオンライントレーニングアルゴリズムを提案する。
PDVNは計画段階と更新段階を交互に行い、分子の合成性とコストを予測する。
広く使われているUSPTOデータセットでは、PDVNアルゴリズムが既存のマルチステッププランナの探索成功率を改善する。
論文 参考訳(メタデータ) (2023-01-31T16:43:53Z) - RetCL: A Selection-based Approach for Retrosynthesis via Contrastive
Learning [107.64562550844146]
レトロシンセシスは深層学習の新たな研究分野である。
本稿では, 市販分子の候補群から, 反応物質の選択問題へとレトロシンセシスを再構成する新しいアプローチを提案する。
スコア機能を学ぶために、ハードネガティブマイニングを備えた新しいコントラストトレーニングスキームも提案します。
論文 参考訳(メタデータ) (2021-05-03T12:47:57Z) - State-of-the-Art Augmented NLP Transformer models for direct and
single-step retrosynthesis [0.0]
化学物質の逆合成予測に異なる訓練シナリオが及ぼす影響について検討した。
データ拡張は、画像処理で使用される強力な方法であり、ニューラルネットワークによるデータ記憶の効果を排除した。
論文 参考訳(メタデータ) (2020-03-05T18:11:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。