Fugu-MT 論文翻訳(概要): DirectMultiStep: Direct Route Generation for Multistep Retrosynthesis

論文の概要: DirectMultiStep: Direct Route Generation for Multistep Retrosynthesis

arxiv url: http://arxiv.org/abs/2405.13983v3
Date: Thu, 20 Mar 2025 01:58:12 GMT
ステータス: 翻訳完了
システム内更新日: 2025-03-21 15:30:51.680763
Title: DirectMultiStep: Direct Route Generation for Multistep Retrosynthesis
Title（参考訳）: DirectMultiStep:多段階再合成のための直接経路生成
Authors: Yu Shee, Anton Morgunov, Haote Li, Victor S. Batista,
Abstract要約: 本稿では,多段階合成経路を単一文字列として直接生成するために,専門家のアプローチを併用したトランスフォーマーモデルを提案する。 DMSエクスプローラーXLモデルは、PaRoutesデータセットの最先端メソッドよりも1.9倍、Top-1精度が3.1倍向上した。我々のモデルは、トレーニングデータに含まれていないFDA承認薬物のルートを予測し、強力な一般化能力を示す。
参考スコア（独自算出の注目度）: 0.0
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Traditional computer-aided synthesis planning (CASP) methods rely on iterative single-step predictions, leading to exponential search space growth that limits efficiency and scalability. We introduce a series of transformer-based models, that leverage a mixture of experts approach to directly generate multistep synthetic routes as a single string, conditionally predicting each transformation based on all preceding ones. Our DMS Explorer XL model, which requires only target compounds as input, outperforms state-of-the-art methods on the PaRoutes dataset with 1.9x and 3.1x improvements in Top-1 accuracy on the n$_1$ and n$_5$ test sets, respectively. Providing additional information, such as the desired number of steps and starting materials, enables both a reduction in model size and an increase in accuracy, highlighting the benefits of incorporating more constraints into the prediction process. The top-performing DMS-Flex (Duo) model scores 25-50% higher on Top-1 and Top-10 accuracies for both n$_1$ and n$_5$ sets. Additionally, our models successfully predict routes for FDA-approved drugs not included in the training data, demonstrating strong generalization capabilities. While the limited diversity of the training set may affect performance on less common reaction types, our multistep-first approach presents a promising direction towards fully automated retrosynthetic planning.
Abstract（参考訳）: 従来のコンピュータ支援合成計画法(CASP)は反復的な単一ステップ予測に依存しており、効率と拡張性を制限する指数関数的な検索空間が成長する。本モデルでは, 先行する各変換を条件付きで予測し, 多段階合成経路を直接単一文字列として生成するために, 専門家のアプローチを併用した一連のトランスフォーマーモデルを提案する。我々のDMSエクスプローラーXLモデルは、入力としてターゲット化合物のみを必要とするが、PaRoutesデータセットでは、n$_1$とn$_5$のテストセットにおいて、それぞれ1.9倍と3.1倍の精度で、最先端の手法より優れている。所望のステップ数や開始材料などの追加情報を提供することで、モデルのサイズの削減と精度の向上の両方が可能になり、予測プロセスにより多くの制約を組み込むことのメリットが強調される。最高パフォーマンスのDMS-Flex(Duo)モデルは、n$_1$とn$_5$セットのTop-1とTop-10のアキュラシーで25-50%高いスコアを得る。さらに、当社のモデルは、トレーニングデータに含まれていないFDA承認薬物のルートを予測し、強力な一般化能力を示した。トレーニングセットの限られた多様性は、あまり一般的でない反応タイプのパフォーマンスに影響を与えるかもしれないが、我々のマルチステップファーストアプローチは、完全に自動化された再合成計画に向けた有望な方向性を示す。

関連論文リスト

Scalable Data Synthesis for Computer Use Agents with Step-Level Filtering [11.375577889547351]
我々は、ノイズの多いロールアウトを人間のアノテーションなしで信頼性の高い監視に変換するスケーラブルなデータ合成パイプラインを導入する。ステップレベルのフィルタリング(Step-level filtering)は、アクションを個別に評価し、正しいステップのみを保持する。その結果,拡張性のあるCUAトレーニングの鍵となるステップレベルのフィルタリングを確立し,新しい2つのデータセットを構築した。
論文参考訳（メタデータ） (2025-11-22T23:12:56Z)
Data Mixture Optimization: A Multi-fidelity Multi-scale Bayesian Framework [10.317740844867913]
我々は,SlimPajamaデータセットから,さまざまなデータ構成を用いて,472言語モデルによる事前学習実行をベースとしたシミュレータを構築した。単純な取得関数でさえ、20Mから1Bまでのトレーニングモデル間で、原則化されたトレーニング決定を可能にすることを観察する。
論文参考訳（メタデータ） (2025-03-26T22:19:47Z)
Predictable Scale: Part I, Step Law -- Optimal Hyperparameter Scaling Law in Large Language Model Pretraining [59.369484219304866]
本研究では,100兆のトークンをスクラッチから3,700以上の大規模言語モデル(LLM)に対する前例のない実証的研究を行った。我々は、固定モデルサイズ(N$)とデータセットサイズ(D$)で、ハイパーパラメータのランドスケープは広い最適度で凸性を示すことを実証的に観察した。この洞察に基づいて、我々はステップ法を正式に定義し、実証的に検証する: 最適な学習レートは、$N$と$D$との関係に従うが、最適なバッチサイズは、主に$D$の影響を受け、主に$N$に不変である。
論文参考訳（メタデータ） (2025-03-06T18:58:29Z)
SMPLest-X: Ultimate Scaling for Expressive Human Pose and Shape Estimation [81.36747103102459]
表現的人間のポーズと形状推定(EHPS)は、身体、手、顔の動きを多数の応用で統合する。現在の最先端の手法は、限定されたデータセット上で革新的なアーキテクチャ設計を訓練することに焦点を当てている。本稿では,EHPSのスケールアップが一般基盤モデルのファミリに与える影響について検討する。
論文参考訳（メタデータ） (2025-01-16T18:59:46Z)
AI-Accelerated Flow Simulation: A Robust Auto-Regressive Framework for Long-Term CFD Forecasting [2.3964255330849356]
本稿では,データ駆動AR予測に適した2段階微分Adams-Bashforth法の最初の実装について紹介する。我々は、異なる将来のステップの重要性を動的に調整する3つの新しい適応重み付け戦略を開発した。本フレームワークは,平均二乗誤差を0.125から0.002に削減する350のステップを正確に予測する。
論文参考訳（メタデータ） (2024-12-07T14:02:57Z)
Aligning Few-Step Diffusion Models with Dense Reward Difference Learning [81.85515625591884]
Stepwise Diffusion Policy Optimization (SDPO) は、数ステップの拡散モデルに適したアライメント手法である。 SDPOは、すべての中間ステップに密集した報酬フィードバックを組み込んで、すべてのデノナイジングステップを一貫したアライメントを確保する。 SDPOは、様々なステップ構成にまたがる報酬ベースのアライメントにおいて、従来手法よりも一貫して優れています。
論文参考訳（メタデータ） (2024-11-18T16:57:41Z)
AI methods for approximate compiling of unitaries [0.0]
本稿では、ユニタリの近似コンパイルのための人工知能(AI)手法について検討する。超伝導ハードウェアに典型的な固定二量子ゲートと任意の単量子回転の利用に焦点をあてる。提案手法は,ターゲットのユニタリを近似した初期テンプレートを同定し,初期パラメータを予測し,回路の忠実度を最大化する。
論文参考訳（メタデータ） (2024-07-30T22:30:15Z)
Step-DPO: Step-wise Preference Optimization for Long-chain Reasoning of LLMs [54.05511925104712]
本稿では,Step-DPOと呼ばれるシンプルで効果的でデータ効率のよい手法を提案する。 Step-DPOは、個々の推論ステップを、論理的に回答を評価するのではなく、優先最適化の単位として扱う。以上の結果から,70B パラメータ以上のモデルでは,10K の選好データペアと500 Step-DPO トレーニングステップ以下では,MATH の精度が約3%向上する可能性が示唆された。
論文参考訳（メタデータ） (2024-06-26T17:43:06Z)
Preference Optimization for Molecule Synthesis with Conditional Residual Energy-based Models [35.314442982529904]
現在のデータ駆動戦略では、トップボトム方式で合成経路を予測するために、ワンステップのレトロモデルと検索アルゴリズムを採用している。既存の戦略では、材料コスト、収量、ステップ数といった可能な基準に基づいて合成経路の生成を制御できない。本稿では, コンディショナル残エネルギーモデル(EBM)を用いて, 合成経路全体の品質に焦点をあてた, 汎用的, 原則的枠組みを提案する。
論文参考訳（メタデータ） (2024-06-04T07:49:30Z)
Align Your Steps: Optimizing Sampling Schedules in Diffusion Models [63.927438959502226]
拡散モデル(DM)は、視覚領域以降における最先端の生成モデリングアプローチとして確立されている。 DMの重大な欠点は、サンプリング速度の遅いことであり、大規模なニューラルネットワークによる多くのシーケンシャルな関数評価に依存している。本稿では,DMのサンプリングスケジュールを高品質な出力に最適化する汎用的,原理的な手法を提案する。
論文参考訳（メタデータ） (2024-04-22T18:18:41Z)
When Parameter-efficient Tuning Meets General-purpose Vision-language Models [65.19127815275307]
PETALは、一意のモード近似技術によって達成される全パラメータの0.5%しか必要とせず、トレーニングプロセスに革命をもたらす。実験の結果,PETALは現状の手法をほとんどのシナリオで上回るだけでなく,完全な微調整モデルよりも優れていることがわかった。
論文参考訳（メタデータ） (2023-12-16T17:13:08Z)
Context-aware Pedestrian Trajectory Prediction with Multimodal Transformer [16.457778420360537]
歩行者の将来の軌跡を予測するための新しい手法を提案する。本手法では,歩行者位置と自走車速の両方を入力とするマルチモーダルエンコーダデコーダトランスアーキテクチャを用いる。我々は、PIEとJAADという2つの一般的なデータセット上で詳細な実験を行い、その方法を評価する。
論文参考訳（メタデータ） (2023-07-07T18:21:05Z)
Fine-Tuning Language Models with Just Forward Passes [92.04219196752007]
微調整言語モデル(LM)は、様々な下流タスクで成功したが、LMのサイズが大きくなるにつれて、バックプロパゲーションは大量のメモリを必要とする。本稿では,メモリ効率の高いゼロソーダ(MeZO)を提案する。
論文参考訳（メタデータ） (2023-05-27T02:28:10Z)
Retrosynthetic Planning with Dual Value Networks [107.97218669277913]
我々は、PDVN(Planning with Dual Value Networks)と呼ばれる新しいオンライントレーニングアルゴリズムを提案する。 PDVNは計画段階と更新段階を交互に行い、分子の合成性とコストを予測する。広く使われているUSPTOデータセットでは、PDVNアルゴリズムが既存のマルチステッププランナの探索成功率を改善する。
論文参考訳（メタデータ） (2023-01-31T16:43:53Z)
One-Pass Learning via Bridging Orthogonal Gradient Descent and Recursive Least-Squares [8.443742714362521]
我々は,従来のデータポイントの予測にほとんど変化しない方向にパラメータを変更しながら,すべての新しいデータポイントに完全に適合するワンパス学習アルゴリズムを開発した。我々のアルゴリズムは、インクリメンタル・プリンシパル・コンポーネント分析(IPCA)を用いてストリーミングデータの構造を利用して、メモリを効率的に利用する。本実験では,提案手法の有効性をベースラインと比較した。
論文参考訳（メタデータ） (2022-07-28T02:01:31Z)
Back to MLP: A Simple Baseline for Human Motion Prediction [59.18776744541904]
本稿では、歴史的に観察されたシーケンスから将来の身体のポーズを予測することによる、人間の動作予測の課題に取り組む。これらの手法の性能は、0.14Mパラメータしか持たない軽量で純粋にアーキテクチャアーキテクチャによって超えることができることを示す。 Human3.6M, AMASS, 3DPWデータセットの徹底的な評価は, siMLPeをダブした我々の手法が, 他のアプローチよりも一貫して優れていることを示している。
論文参考訳（メタデータ） (2022-07-04T16:35:58Z)
On the Role of Bidirectionality in Language Model Pre-Training [85.14614350372004]
本研究では,次のトークン予測,テキスト入力,ゼロショットプライミング,微調整における双方向性の役割について検討する。最大6.7Bのパラメータを持つモデルをトレーニングし、スケールで一貫性のある相違点を見つけます。
論文参考訳（メタデータ） (2022-05-24T02:25:05Z)
Fast, Accurate, and Simple Models for Tabular Data via Augmented Distillation [97.42894942391575]
本研究では、FAST-DADを用いて、任意の複雑なアンサンブル予測を、高木、無作為林、深層ネットワークなどの個々のモデルに抽出する。我々の個々の蒸留モデルは、H2O/AutoSklearnのようなAutoMLツールが生成するアンサンブル予測よりも10倍高速で精度が高い。
論文参考訳（メタデータ） (2020-06-25T09:57:47Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。