論文の概要: DirectMultiStep: Direct Route Generation for Multi-Step Retrosynthesis
- arxiv url: http://arxiv.org/abs/2405.13983v2
- Date: Tue, 21 Jan 2025 17:37:07 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-01-23 16:52:34.918696
- Title: DirectMultiStep: Direct Route Generation for Multi-Step Retrosynthesis
- Title(参考訳): DirectMultiStep:マルチステップ再合成のための直接経路生成
- Authors: Yu Shee, Haote Li, Anton Morgunov, Victor Batista,
- Abstract要約: 本稿では,多段階合成経路を単一文字列として直接生成する,エキスパートアプローチの混合を利用したトランスフォーマーモデルを提案する。
我々のモデルは、所望のステップ数や出発材料など、特定の条件を満たすことができる。
DMS-Flex(Duo)がPaRoutesデータセットの最先端メソッドを上回り、Top-1の精度が2.5倍向上した。
- 参考スコア(独自算出の注目度): 0.0
- License:
- Abstract: Traditional computer-aided synthesis planning (CASP) methods rely on iterative single-step predictions, leading to exponential search space growth that limits efficiency and scalability. We introduce a series of transformer-based models, utilizing mixture of experts approach, that directly generate multistep synthetic routes as a single string by conditionally predicting each molecule based on all preceding ones. Our models can accommodate specific conditions such as the desired number of steps and starting materials, with the top-performing DMS-Flex (Duo) surpassing state-of-the-art methods on the PaRoutes dataset with a 2.5x improvement in Top-1 accuracy on the n$_1$ test set and a 3.9x improvement on the n$_5$ test set. It also successfully predicts routes for FDA-approved drugs not included in the training data, showcasing its generalization capabilities. While the current suboptimal diversity of the training set may impact performance on less common reaction types, our multistep-first approach presents a promising direction towards fully automated retrosynthetic planning.
- Abstract(参考訳): 従来のコンピュータ支援合成計画法(CASP)は反復的な単一ステップ予測に依存しており、効率と拡張性を制限する指数関数的な検索空間が成長する。
本稿では, 先行する全ての分子を条件付きで予測することにより, 多段階合成経路を直接単一文字列として生成する, 専門家アプローチの混合を利用した変圧器モデルを提案する。
DMS-Flex(Duo)がPaRoutesデータセットの最先端メソッドを上回り、n$_1$テストセットのTop-1精度が2.5倍、n$_5$テストセットの3.9倍向上した。
また、FDAが承認した薬物がトレーニングデータに含まれていないルートの予測も成功し、その一般化能力を示している。
現在のトレーニングセットの最適部分の多様性は、あまり一般的でない反応タイプのパフォーマンスに影響を及ぼすかもしれないが、我々のマルチステップファーストアプローチは、完全に自動化された再合成計画に向けて有望な方向を示す。
関連論文リスト
- Aligning Few-Step Diffusion Models with Dense Reward Difference Learning [81.85515625591884]
Stepwise Diffusion Policy Optimization (SDPO) は、数ステップの拡散モデルに適したアライメント手法である。
SDPOは、すべての中間ステップに密集した報酬フィードバックを組み込んで、すべてのデノナイジングステップを一貫したアライメントを確保する。
SDPOは、様々なステップ構成にまたがる報酬ベースのアライメントにおいて、従来手法よりも一貫して優れています。
論文 参考訳(メタデータ) (2024-11-18T16:57:41Z) - AI methods for approximate compiling of unitaries [0.0]
本稿では、ユニタリの近似コンパイルのための人工知能(AI)手法について検討する。
超伝導ハードウェアに典型的な固定二量子ゲートと任意の単量子回転の利用に焦点をあてる。
提案手法は,ターゲットのユニタリを近似した初期テンプレートを同定し,初期パラメータを予測し,回路の忠実度を最大化する。
論文 参考訳(メタデータ) (2024-07-30T22:30:15Z) - Preference Optimization for Molecule Synthesis with Conditional Residual Energy-based Models [35.314442982529904]
現在のデータ駆動戦略では、トップボトム方式で合成経路を予測するために、ワンステップのレトロモデルと検索アルゴリズムを採用している。
既存の戦略では、材料コスト、収量、ステップ数といった可能な基準に基づいて合成経路の生成を制御できない。
本稿では, コンディショナル残エネルギーモデル(EBM)を用いて, 合成経路全体の品質に焦点をあてた, 汎用的, 原則的枠組みを提案する。
論文 参考訳(メタデータ) (2024-06-04T07:49:30Z) - Align Your Steps: Optimizing Sampling Schedules in Diffusion Models [63.927438959502226]
拡散モデル(DM)は、視覚領域以降における最先端の生成モデリングアプローチとして確立されている。
DMの重大な欠点は、サンプリング速度の遅いことであり、大規模なニューラルネットワークによる多くのシーケンシャルな関数評価に依存している。
本稿では,DMのサンプリングスケジュールを高品質な出力に最適化する汎用的,原理的な手法を提案する。
論文 参考訳(メタデータ) (2024-04-22T18:18:41Z) - When Parameter-efficient Tuning Meets General-purpose Vision-language
Models [65.19127815275307]
PETALは、一意のモード近似技術によって達成される全パラメータの0.5%しか必要とせず、トレーニングプロセスに革命をもたらす。
実験の結果,PETALは現状の手法をほとんどのシナリオで上回るだけでなく,完全な微調整モデルよりも優れていることがわかった。
論文 参考訳(メタデータ) (2023-12-16T17:13:08Z) - Context-aware Pedestrian Trajectory Prediction with Multimodal
Transformer [16.457778420360537]
歩行者の将来の軌跡を予測するための新しい手法を提案する。
本手法では,歩行者位置と自走車速の両方を入力とするマルチモーダルエンコーダデコーダトランスアーキテクチャを用いる。
我々は、PIEとJAADという2つの一般的なデータセット上で詳細な実験を行い、その方法を評価する。
論文 参考訳(メタデータ) (2023-07-07T18:21:05Z) - Retrosynthetic Planning with Dual Value Networks [107.97218669277913]
我々は、PDVN(Planning with Dual Value Networks)と呼ばれる新しいオンライントレーニングアルゴリズムを提案する。
PDVNは計画段階と更新段階を交互に行い、分子の合成性とコストを予測する。
広く使われているUSPTOデータセットでは、PDVNアルゴリズムが既存のマルチステッププランナの探索成功率を改善する。
論文 参考訳(メタデータ) (2023-01-31T16:43:53Z) - One-Pass Learning via Bridging Orthogonal Gradient Descent and Recursive
Least-Squares [8.443742714362521]
我々は,従来のデータポイントの予測にほとんど変化しない方向にパラメータを変更しながら,すべての新しいデータポイントに完全に適合するワンパス学習アルゴリズムを開発した。
我々のアルゴリズムは、インクリメンタル・プリンシパル・コンポーネント分析(IPCA)を用いてストリーミングデータの構造を利用して、メモリを効率的に利用する。
本実験では,提案手法の有効性をベースラインと比較した。
論文 参考訳(メタデータ) (2022-07-28T02:01:31Z) - Back to MLP: A Simple Baseline for Human Motion Prediction [59.18776744541904]
本稿では、歴史的に観察されたシーケンスから将来の身体のポーズを予測することによる、人間の動作予測の課題に取り組む。
これらの手法の性能は、0.14Mパラメータしか持たない軽量で純粋にアーキテクチャアーキテクチャによって超えることができることを示す。
Human3.6M, AMASS, 3DPWデータセットの徹底的な評価は, siMLPeをダブした我々の手法が, 他のアプローチよりも一貫して優れていることを示している。
論文 参考訳(メタデータ) (2022-07-04T16:35:58Z) - On the Role of Bidirectionality in Language Model Pre-Training [85.14614350372004]
本研究では,次のトークン予測,テキスト入力,ゼロショットプライミング,微調整における双方向性の役割について検討する。
最大6.7Bのパラメータを持つモデルをトレーニングし、スケールで一貫性のある相違点を見つけます。
論文 参考訳(メタデータ) (2022-05-24T02:25:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。