論文の概要: DirectMultiStep: Direct Route Generation for Multistep Retrosynthesis
- arxiv url: http://arxiv.org/abs/2405.13983v3
- Date: Thu, 20 Mar 2025 01:58:12 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-03-21 16:32:26.434017
- Title: DirectMultiStep: Direct Route Generation for Multistep Retrosynthesis
- Title(参考訳): DirectMultiStep:多段階再合成のための直接経路生成
- Authors: Yu Shee, Anton Morgunov, Haote Li, Victor S. Batista,
- Abstract要約: 本稿では,多段階合成経路を単一文字列として直接生成するために,専門家のアプローチを併用したトランスフォーマーモデルを提案する。
DMSエクスプローラーXLモデルは、PaRoutesデータセットの最先端メソッドよりも1.9倍、Top-1精度が3.1倍向上した。
我々のモデルは、トレーニングデータに含まれていないFDA承認薬物のルートを予測し、強力な一般化能力を示す。
- 参考スコア(独自算出の注目度): 0.0
- License:
- Abstract: Traditional computer-aided synthesis planning (CASP) methods rely on iterative single-step predictions, leading to exponential search space growth that limits efficiency and scalability. We introduce a series of transformer-based models, that leverage a mixture of experts approach to directly generate multistep synthetic routes as a single string, conditionally predicting each transformation based on all preceding ones. Our DMS Explorer XL model, which requires only target compounds as input, outperforms state-of-the-art methods on the PaRoutes dataset with 1.9x and 3.1x improvements in Top-1 accuracy on the n$_1$ and n$_5$ test sets, respectively. Providing additional information, such as the desired number of steps and starting materials, enables both a reduction in model size and an increase in accuracy, highlighting the benefits of incorporating more constraints into the prediction process. The top-performing DMS-Flex (Duo) model scores 25-50% higher on Top-1 and Top-10 accuracies for both n$_1$ and n$_5$ sets. Additionally, our models successfully predict routes for FDA-approved drugs not included in the training data, demonstrating strong generalization capabilities. While the limited diversity of the training set may affect performance on less common reaction types, our multistep-first approach presents a promising direction towards fully automated retrosynthetic planning.
- Abstract(参考訳): 従来のコンピュータ支援合成計画法(CASP)は反復的な単一ステップ予測に依存しており、効率と拡張性を制限する指数関数的な検索空間が成長する。
本モデルでは, 先行する各変換を条件付きで予測し, 多段階合成経路を直接単一文字列として生成するために, 専門家のアプローチを併用した一連のトランスフォーマーモデルを提案する。
我々のDMSエクスプローラーXLモデルは、入力としてターゲット化合物のみを必要とするが、PaRoutesデータセットでは、n$_1$とn$_5$のテストセットにおいて、それぞれ1.9倍と3.1倍の精度で、最先端の手法より優れている。
所望のステップ数や開始材料などの追加情報を提供することで、モデルのサイズの削減と精度の向上の両方が可能になり、予測プロセスにより多くの制約を組み込むことのメリットが強調される。
最高パフォーマンスのDMS-Flex(Duo)モデルは、n$_1$とn$_5$セットのTop-1とTop-10のアキュラシーで25-50%高いスコアを得る。
さらに、当社のモデルは、トレーニングデータに含まれていないFDA承認薬物のルートを予測し、強力な一般化能力を示した。
トレーニングセットの限られた多様性は、あまり一般的でない反応タイプのパフォーマンスに影響を与えるかもしれないが、我々のマルチステップファーストアプローチは、完全に自動化された再合成計画に向けた有望な方向性を示す。
関連論文リスト
- Aligning Few-Step Diffusion Models with Dense Reward Difference Learning [81.85515625591884]
Stepwise Diffusion Policy Optimization (SDPO) は、数ステップの拡散モデルに適したアライメント手法である。
SDPOは、すべての中間ステップに密集した報酬フィードバックを組み込んで、すべてのデノナイジングステップを一貫したアライメントを確保する。
SDPOは、様々なステップ構成にまたがる報酬ベースのアライメントにおいて、従来手法よりも一貫して優れています。
論文 参考訳(メタデータ) (2024-11-18T16:57:41Z) - Preference Optimization for Molecule Synthesis with Conditional Residual Energy-based Models [35.314442982529904]
現在のデータ駆動戦略では、トップボトム方式で合成経路を予測するために、ワンステップのレトロモデルと検索アルゴリズムを採用している。
既存の戦略では、材料コスト、収量、ステップ数といった可能な基準に基づいて合成経路の生成を制御できない。
本稿では, コンディショナル残エネルギーモデル(EBM)を用いて, 合成経路全体の品質に焦点をあてた, 汎用的, 原則的枠組みを提案する。
論文 参考訳(メタデータ) (2024-06-04T07:49:30Z) - Align Your Steps: Optimizing Sampling Schedules in Diffusion Models [63.927438959502226]
拡散モデル(DM)は、視覚領域以降における最先端の生成モデリングアプローチとして確立されている。
DMの重大な欠点は、サンプリング速度の遅いことであり、大規模なニューラルネットワークによる多くのシーケンシャルな関数評価に依存している。
本稿では,DMのサンプリングスケジュールを高品質な出力に最適化する汎用的,原理的な手法を提案する。
論文 参考訳(メタデータ) (2024-04-22T18:18:41Z) - When Parameter-efficient Tuning Meets General-purpose Vision-language
Models [65.19127815275307]
PETALは、一意のモード近似技術によって達成される全パラメータの0.5%しか必要とせず、トレーニングプロセスに革命をもたらす。
実験の結果,PETALは現状の手法をほとんどのシナリオで上回るだけでなく,完全な微調整モデルよりも優れていることがわかった。
論文 参考訳(メタデータ) (2023-12-16T17:13:08Z) - Context-aware Pedestrian Trajectory Prediction with Multimodal
Transformer [16.457778420360537]
歩行者の将来の軌跡を予測するための新しい手法を提案する。
本手法では,歩行者位置と自走車速の両方を入力とするマルチモーダルエンコーダデコーダトランスアーキテクチャを用いる。
我々は、PIEとJAADという2つの一般的なデータセット上で詳細な実験を行い、その方法を評価する。
論文 参考訳(メタデータ) (2023-07-07T18:21:05Z) - Retrosynthetic Planning with Dual Value Networks [107.97218669277913]
我々は、PDVN(Planning with Dual Value Networks)と呼ばれる新しいオンライントレーニングアルゴリズムを提案する。
PDVNは計画段階と更新段階を交互に行い、分子の合成性とコストを予測する。
広く使われているUSPTOデータセットでは、PDVNアルゴリズムが既存のマルチステッププランナの探索成功率を改善する。
論文 参考訳(メタデータ) (2023-01-31T16:43:53Z) - Mind the Retrosynthesis Gap: Bridging the divide between Single-step and
Multi-step Retrosynthesis Prediction [0.9134244356393664]
多段階のアプローチは、単段階の逆合成モデルに格納された化学情報を繰り返し適用する。
複数のステップに拡張された1段階の逆合成のためのモデルが、現在のマルチステップ手法の経路探索能力に大きな影響を及ぼすことを示す。
論文 参考訳(メタデータ) (2022-12-12T18:06:24Z) - SMART: Simultaneous Multi-Agent Recurrent Trajectory Prediction [72.37440317774556]
本稿では,将来の軌道予測における2つの重要な課題に対処する手法を提案する。
エージェントの数に関係なく、トレーニングデータと予測と一定時間の推測の両方において、マルチモーダリティ。
論文 参考訳(メタデータ) (2020-07-26T08:17:10Z) - Fast, Accurate, and Simple Models for Tabular Data via Augmented
Distillation [97.42894942391575]
本研究では、FAST-DADを用いて、任意の複雑なアンサンブル予測を、高木、無作為林、深層ネットワークなどの個々のモデルに抽出する。
我々の個々の蒸留モデルは、H2O/AutoSklearnのようなAutoMLツールが生成するアンサンブル予測よりも10倍高速で精度が高い。
論文 参考訳(メタデータ) (2020-06-25T09:57:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。