論文の概要: Rethinking Molecule Synthesizability with Chain-of-Reaction
- arxiv url: http://arxiv.org/abs/2509.16084v1
- Date: Fri, 19 Sep 2025 15:29:57 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-22 18:18:11.225503
- Title: Rethinking Molecule Synthesizability with Chain-of-Reaction
- Title(参考訳): 反応の連鎖による分子合成性の再考
- Authors: Seul Lee, Karsten Kreis, Srimukh Prasad Veccham, Meng Liu, Danny Reidenbach, Saee Paliwal, Weili Nie, Arash Vahdat,
- Abstract要約: 合成可能な投影のための生成フレームワークであるReaSynを紹介する。
大規模言語モデル(LLM)における推論経路に類似した合成経路を考慮した新しい視点を提案する。
CoR表記により、ReaSynは化学反応規則を明示的に学習する全ての反応ステップにおいて、密集した監督を受けることができる。
- 参考スコア(独自算出の注目度): 47.744071119775676
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: A well-known pitfall of molecular generative models is that they are not guaranteed to generate synthesizable molecules. There have been considerable attempts to address this problem, but given the exponentially large combinatorial space of synthesizable molecules, existing methods have shown limited coverage of the space and poor molecular optimization performance. To tackle these problems, we introduce ReaSyn, a generative framework for synthesizable projection where the model explores the neighborhood of given molecules in the synthesizable space by generating pathways that result in synthesizable analogs. To fully utilize the chemical knowledge contained in the synthetic pathways, we propose a novel perspective that views synthetic pathways akin to reasoning paths in large language models (LLMs). Specifically, inspired by chain-of-thought (CoT) reasoning in LLMs, we introduce the chain-of-reaction (CoR) notation that explicitly states reactants, reaction types, and intermediate products for each step in a pathway. With the CoR notation, ReaSyn can get dense supervision in every reaction step to explicitly learn chemical reaction rules during supervised training and perform step-by-step reasoning. In addition, to further enhance the reasoning capability of ReaSyn, we propose reinforcement learning (RL)-based finetuning and goal-directed test-time compute scaling tailored for synthesizable projection. ReaSyn achieves the highest reconstruction rate and pathway diversity in synthesizable molecule reconstruction and the highest optimization performance in synthesizable goal-directed molecular optimization, and significantly outperforms previous synthesizable projection methods in synthesizable hit expansion. These results highlight ReaSyn's superior ability to navigate combinatorially-large synthesizable chemical space.
- Abstract(参考訳): 分子生成モデルのよく知られた落とし穴は、合成可能な分子を生成することが保証されていないことである。
この問題にはかなりの試みがあったが、合成可能な分子の指数的に大きな組合せ空間を考えると、既存の手法では空間のカバーが限られており、分子最適化性能は劣っている。
これらの問題に対処するため、合成可能なアナログを生成する経路を生成することにより、モデルが合成可能な空間内の与えられた分子の近傍を探索する合成可能な射影のための生成フレームワークReaSynを紹介した。
本研究では, 合成経路に含まれる化学知識を十分に活用するために, 大規模言語モデル(LLM)の推論経路と類似した合成経路の視点を提案する。
具体的には、LLMにおけるチェーン・オブ・シント(CoT)推論にインスパイアされ、経路の各ステップごとに反応物、反応タイプ、中間生成物を明示的に記述する連鎖・オブ・反応(CoR)記法を導入する。
CoR表記を用いることで、ReaSynは反応のすべてのステップで密集した監視を受け、監督されたトレーニング中に化学反応規則を明示的に学習し、ステップバイステップの推論を行うことができる。
さらに、ReaSynの推論能力をさらに向上するため、合成可能な投影に適した強化学習(RL)に基づく微調整と目標指向テスト時間計算スケーリングを提案する。
ReaSynは、合成可能な分子再構成において、最も高い再構成率と経路多様性を達成し、合成可能なゴール指向分子最適化において最も高い最適化性能を達成し、合成可能なヒット展開において、従来の合成可能な投影方法よりも著しく優れている。
これらの結果から、ReaSynの合成可能な化学空間をナビゲートする優れた能力が浮かび上がった。
関連論文リスト
- Synthesizable by Design: A Retrosynthesis-Guided Framework for Molecular Analog Generation [0.5852077003870417]
新規なレトロシンセシス誘導分子アナログ設計フレームワークであるSynTwinsを紹介する。
比較評価において、SynTwinsは合成可能なアナログを生成する上で優れた性能を示す。
多様な分子データセットのベンチマークにより、SynTwinsは計算設計と実験合成のギャップを効果的に埋めることを示した。
論文 参考訳(メタデータ) (2025-07-03T16:14:57Z) - BatGPT-Chem: A Foundation Large Model For Retrosynthesis Prediction [65.93303145891628]
BatGPT-Chemは150億のパラメータを持つ大規模な言語モデルであり、再合成予測の強化に最適化されている。
我々のモデルは幅広い化学知識を捉え、反応条件の正確な予測を可能にする。
この開発により、化学者は新しい化合物を十分に扱うことができ、医薬品製造と材料科学の革新サイクルを早める可能性がある。
論文 参考訳(メタデータ) (2024-08-19T05:17:40Z) - SynFlowNet: Design of Diverse and Novel Molecules with Synthesis Constraints [16.21161274235011]
反応空間が化学反応と精製可能な反応物質を用いて新しい分子を逐次生成するGFlowNetモデルであるSynFlowNetを紹介する。
生成機構の明示的な制約としてフォワード合成を取り入れることで、シリコン分子生成と実世界の合成能力のギャップを埋めることを目指す。
論文 参考訳(メタデータ) (2024-05-02T10:15:59Z) - FusionRetro: Molecule Representation Fusion via In-Context Learning for
Retrosynthetic Planning [58.47265392465442]
再合成計画(Retrosynthetic Planning)は、開始物質から標的分子への完全な多段階合成経路を考案することを目的としている。
現在の戦略では、単一ステップの逆合成モデルと探索アルゴリズムの分離されたアプローチを採用している。
本稿では,文脈情報を利用した新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2022-09-30T08:44:58Z) - Root-aligned SMILES for Molecular Retrosynthesis Prediction [31.818364437526885]
再合成予測は有機合成の基本的な問題であり、標的分子の合成に使用できる前駆体分子を発見することが目的である。
既存の計算逆合成手法の一般的なパラダイムは、列から列への変換問題として再合成予測を定式化する。
本稿では,製品と反応するSMILES間の一対一マッピングを厳密に整列するルート整列SMILES(R-SMILES)を提案する。
論文 参考訳(メタデータ) (2022-03-22T03:50:04Z) - Self-Improved Retrosynthetic Planning [66.5397931294144]
再合成計画(Retrosynthetic Planning)は、標的分子を合成する反応の経路を見つけるための化学の基本的な問題である。
最近の検索アルゴリズムは、ディープニューラルネットワーク(DNN)を用いてこの問題を解決するための有望な結果を示している。
そこで本研究では,DNNを直接訓練し,望ましい特性を持つ反応経路を生成するためのエンドツーエンドフレームワークを提案する。
論文 参考訳(メタデータ) (2021-06-09T08:03:57Z) - RetroXpert: Decompose Retrosynthesis Prediction like a Chemist [60.463900712314754]
そこで我々は, テンプレートフリーな自動逆合成拡張アルゴリズムを考案した。
我々の方法はレトロシンセシスを2段階に分解する。
最先端のベースラインよりも優れている一方で、我々のモデルは化学的に合理的な解釈も提供する。
論文 参考訳(メタデータ) (2020-11-04T04:35:34Z) - Learning To Navigate The Synthetically Accessible Chemical Space Using
Reinforcement Learning [75.95376096628135]
ド・ノボ薬物設計のための強化学習(RL)を利用した新しい前方合成フレームワークを提案する。
このセットアップでは、エージェントは巨大な合成可能な化学空間をナビゲートする。
本研究は,合成可能な化学空間を根本的に拡張する上で,エンド・ツー・エンド・トレーニングが重要なパラダイムであることを示す。
論文 参考訳(メタデータ) (2020-04-26T21:40:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。