論文の概要: Order Matters in Retrosynthesis: Structure-aware Generation via Reaction-Center-Guided Discrete Flow Matching
- arxiv url: http://arxiv.org/abs/2602.13136v1
- Date: Fri, 13 Feb 2026 17:39:21 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-16 23:37:54.059175
- Title: Order Matters in Retrosynthesis: Structure-aware Generation via Reaction-Center-Guided Discrete Flow Matching
- Title(参考訳): 再合成の順序:反応中心型離散フローマッチングによる構造認識生成
- Authors: Chenguang Wang, Zihan Zhou, Lei Bai, Tianshu Yu,
- Abstract要約: 本稿では, 化学反応の2段階の性質を位置誘導バイアスとしてエンコードする構造認識型テンプレートフリーフレームワークを提案する。
提案手法は,USPTO-50k (61.2% Top-1) と大規模USPTO-Full (51.3% top-1) の双方において,反応中心を予測して最先端の性能を実現する。
- 参考スコア(独自算出の注目度): 18.649082246599267
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Template-free retrosynthesis methods treat the task as black-box sequence generation, limiting learning efficiency, while semi-template approaches rely on rigid reaction libraries that constrain generalization. We address this gap with a key insight: atom ordering in neural representations matters. Building on this insight, we propose a structure-aware template-free framework that encodes the two-stage nature of chemical reactions as a positional inductive bias. By placing reaction center atoms at the sequence head, our method transforms implicit chemical knowledge into explicit positional patterns that the model can readily capture. The proposed RetroDiT backbone, a graph transformer with rotary position embeddings, exploits this ordering to prioritize chemically critical regions. Combined with discrete flow matching, our approach decouples training from sampling and enables generation in 20--50 steps versus 500 for prior diffusion methods. Our method achieves state-of-the-art performance on both USPTO-50k (61.2% top-1) and the large-scale USPTO-Full (51.3% top-1) with predicted reaction centers. With oracle centers, performance reaches 71.1% and 63.4% respectively, surpassing foundation models trained on 10 billion reactions while using orders of magnitude less data. Ablation studies further reveal that structural priors outperform brute-force scaling: a 280K-parameter model with proper ordering matches a 65M-parameter model without it.
- Abstract(参考訳): テンプレートなし逆合成法は、タスクをブラックボックスシーケンス生成として扱い、学習効率を制限し、半テンプレートアプローチは一般化を制限する厳密な反応ライブラリに依存する。
我々はこのギャップを、重要な洞察で解決する: 神経表現における原子の秩序は重要である。
この知見に基づいて, 化学反応の2段階の性質を位置誘導バイアスとしてエンコードする構造認識型テンプレートフリーフレームワークを提案する。
反応中心原子をシーケンスヘッドに配置することで、暗黙の化学知識をモデルが容易に捉えることのできる明確な位置パターンに変換する。
回転位置埋め込みを持つグラフ変換器であるRetroDiTのバックボーンは、この順序を利用して化学的に重要な領域を優先順位付けする。
個別のフローマッチングと組み合わせることで,サンプリングからトレーニングを分離し,事前拡散法では20~50ステップで,500ステップで生成することが可能となる。
提案手法は,USPTO-50k (61.2% Top-1) と大規模USPTO-Full (51.3% top-1) の双方において,反応中心を予測して最先端の性能を実現する。
オラクルセンターでは、パフォーマンスは71.1%と63.4%に達し、100億回の反応で訓練された基礎モデルを超え、データ量は桁違いに少ない。
さらにアブレーション研究により、構造的先行はブルート力スケーリングよりも優れており、適切に順序付けされた280Kパラメーターモデルは65Mパラメーターモデルと一致していることが明らかとなった。
関連論文リスト
- DeepMech: A Machine Learning Framework for Chemical Reaction Mechanism Prediction [2.15242029196761]
本稿では,化学反応機構を生成するための解釈可能なグラフベースディープラーニングフレームワークであるDeepMechを提案する。
DeepMechは、初歩予測において98.98 +/-0.12%の精度と完全なCRMタスクにおいて95.94 +/-0.21%の精度を達成する。
論文 参考訳(メタデータ) (2025-09-19T11:14:46Z) - Interpretable Deep Learning for Polar Mechanistic Reaction Prediction [43.95903801494905]
PMechRP(Polar Mechanistic Reaction Predictor)は,PMechDBデータセット上で機械学習モデルをトレーニングするシステムである。
私たちは、トランスフォーマーベース、グラフベース、および2段階のシアムアーキテクチャを含む、さまざまな機械学習モデルの比較をトレーニングします。
私たちの最高のパフォーマンスのアプローチはハイブリッドモデルで、5アンサンブルのChemformerモデルと2ステップのSiameseフレームワークを組み合わせたものです。
論文 参考訳(メタデータ) (2025-04-22T02:31:23Z) - CLEAR: Conv-Like Linearization Revs Pre-Trained Diffusion Transformers Up [64.38715211969516]
CLEARと呼ばれる畳み込み型ローカルアテンション戦略を導入し,各クエリトークンの周囲のローカルウィンドウに特徴的インタラクションを限定する。
実験により,10K反復で10Kの自己生成サンプルに注意層を微調整することにより,事前学習したDiTから線形複雑度のある学生モデルへの知識伝達を効果的に行うことができた。
論文 参考訳(メタデータ) (2024-12-20T17:57:09Z) - Equivariant Denoisers Cannot Copy Graphs: Align Your Graph Diffusion Models [24.912841472542322]
グラフ生成モデリングにおいて支配的なグラフ拡散モデルは、グラフからグラフへの変換タスクにおいて未探索のままである。
本研究では,アライメントが離散拡散モデルの性能を5%から54.7%まで劇的に向上させることを示す。
論文 参考訳(メタデータ) (2024-05-27T20:57:19Z) - UAlign: Pushing the Limit of Template-free Retrosynthesis Prediction with Unsupervised SMILES Alignment [51.49238426241974]
本稿では,テンプレートのないグラフ・ツー・シーケンスパイプラインであるUAlignを紹介した。
グラフニューラルネットワークとトランスフォーマーを組み合わせることで、分子固有のグラフ構造をより効果的に活用することができる。
論文 参考訳(メタデータ) (2024-03-25T03:23:03Z) - Retrosynthesis Prediction with Local Template Retrieval [112.23386062396622]
特定の標的分子の反応を予測する再合成は、薬物発見に必須の課題である。
本稿では,局所的な反応テンプレート検索手法であるRetroKNNを紹介する。
我々は、広く使われている2つのベンチマーク、USPTO-50KとUSPTO-MITで包括的な実験を行う。
論文 参考訳(メタデータ) (2023-06-07T03:38:03Z) - Retrosynthetic Planning with Dual Value Networks [107.97218669277913]
我々は、PDVN(Planning with Dual Value Networks)と呼ばれる新しいオンライントレーニングアルゴリズムを提案する。
PDVNは計画段階と更新段階を交互に行い、分子の合成性とコストを予測する。
広く使われているUSPTOデータセットでは、PDVNアルゴリズムが既存のマルチステッププランナの探索成功率を改善する。
論文 参考訳(メタデータ) (2023-01-31T16:43:53Z) - RetCL: A Selection-based Approach for Retrosynthesis via Contrastive
Learning [107.64562550844146]
レトロシンセシスは深層学習の新たな研究分野である。
本稿では, 市販分子の候補群から, 反応物質の選択問題へとレトロシンセシスを再構成する新しいアプローチを提案する。
スコア機能を学ぶために、ハードネガティブマイニングを備えた新しいコントラストトレーニングスキームも提案します。
論文 参考訳(メタデータ) (2021-05-03T12:47:57Z) - State-of-the-Art Augmented NLP Transformer models for direct and
single-step retrosynthesis [0.0]
化学物質の逆合成予測に異なる訓練シナリオが及ぼす影響について検討した。
データ拡張は、画像処理で使用される強力な方法であり、ニューラルネットワークによるデータ記憶の効果を排除した。
論文 参考訳(メタデータ) (2020-03-05T18:11:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。