論文の概要: FragmentFlow: Scalable Transition State Generation for Large Molecules
- arxiv url: http://arxiv.org/abs/2602.02310v1
- Date: Mon, 02 Feb 2026 16:42:27 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-03 19:28:34.301577
- Title: FragmentFlow: Scalable Transition State Generation for Large Molecules
- Title(参考訳): FragmentFlow: 大規模分子のためのスケーラブルな遷移状態生成
- Authors: Ron Shprints, Peter Holderrieth, Juno Nam, Rafael Gómez-Bombarelli, Tommi Jaakkola,
- Abstract要約: 遷移状態(TS)は化学反応性と反応機構の理解と定量的な予測の中心である。
最近の生成モデリング手法は、比較的小さな分子に対して化学的に意味のあるTS予測を可能にしている。
FragmentFlowは、反応コア原子のTS測地を予測するために生成モデルを訓練する分断・対数法である。
- 参考スコア(独自算出の注目度): 7.730033348957774
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Transition states (TSs) are central to understanding and quantitatively predicting chemical reactivity and reaction mechanisms. Although traditional TS generation methods are computationally expensive, recent generative modeling approaches have enabled chemically meaningful TS prediction for relatively small molecules. However, these methods fail to generalize to practically relevant reaction substrates because of distribution shifts induced by increasing molecular sizes. Furthermore, TS geometries for larger molecules are not available at scale, making it infeasible to train generative models from scratch on such molecules. To address these challenges, we introduce FragmentFlow: a divide-and-conquer approach that trains a generative model to predict TS geometries for the reactive core atoms, which define the reaction mechanism. The full TS structure is then reconstructed by re-attaching substituent fragments to the predicted core. By operating on reactive cores, whose size and composition remain relatively invariant across molecular contexts, FragmentFlow mitigates distribution shifts in generative modeling. Evaluated on a new curated dataset of reactions involving reactants with up to 33 heavy atoms, FragmentFlow correctly identifies 90% of TSs while requiring 30% fewer saddle-point optimization steps than classical initialization schemes. These results point toward scalable TS generation for high-throughput reactivity studies.
- Abstract(参考訳): 遷移状態(TS)は化学反応性と反応機構の理解と定量的な予測の中心である。
従来のTS生成法は計算コストが高いが、最近の生成モデリング手法は比較的小さな分子に対して化学的に意味のあるTS予測を可能にしている。
しかし、これらの手法は分子サイズの増加によって誘導される分布シフトのため、実際に関係する反応基質に一般化することができない。
さらに、大きな分子のTSジオメトリは大規模には利用できないため、そのような分子のスクラッチから生成モデルを訓練することは不可能である。
これらの課題に対処するために、FragmentFlow: 反応機構を定義する反応性コア原子のTS測度を予測するために、生成モデルを訓練する分割・対数アプローチを紹介します。
完全なTS構造は、予測されたコアに置換基の断片を再付加することで再構成される。
FragmentFlowは、分子コンテキストにまたがるサイズと構成が比較的不変なリアクティブコアを操作することで、生成モデリングにおける分散シフトを緩和する。
FragmentFlowは、最大33個の重原子を含む反応物を含む新しい硬化したデータセットに基づいて評価され、古典的な初期化法よりも30%少ないサドルポイント最適化ステップを要求されながら、TSの90%を正しく識別する。
これらの結果は、高スループットの反応性研究のためのスケーラブルTS生成に向けられている。
関連論文リスト
- Generating transition states of chemical reactions via distance-geometry-based flow matching [45.432950944168205]
反応物および生成物からの遷移状態を予測するフローマッチングフレームワークTS-DFMを提案する。
ベンチマークデータセットTransition1Xでは、TS-DFMが従来の最先端メソッドであるReact-OTを30%上回っている。
論文 参考訳(メタデータ) (2025-11-21T13:15:25Z) - Flow matching for reaction pathway generation [1.8420084274819617]
モルゲンは、ガウス前駆体を標的とする化学分布を輸送する最適な輸送経路を学習する条件付きフローマッチングフレームワークである。
TSDiffとOA-ReactDiffが使用しているベンチマークでは、MolGENはTSの幾何精度とバリアハイト予測を超越し、サンプリングを秒未満に削減している。
MolGENはまた、競合するトップkの精度でオープンな製品生成をサポートし、シーケンスモデルに共通する質量/電子バランス違反を避ける。
論文 参考訳(メタデータ) (2025-07-14T17:54:47Z) - Pre-trained Molecular Language Models with Random Functional Group Masking [54.900360309677794]
SMILESをベースとしたアンダーリネム分子アンダーリネム言語アンダーリネムモデルを提案し,特定の分子原子に対応するSMILESサブシーケンスをランダムにマスキングする。
この技術は、モデルに分子構造や特性をよりよく推測させ、予測能力を高めることを目的としている。
論文 参考訳(メタデータ) (2024-11-03T01:56:15Z) - RGFN: Synthesizable Molecular Generation Using GFlowNets [51.33672611338754]
本稿では,化学反応の空間内で直接動作するGFlowNetフレームワークの拡張であるReaction-GFlowNetを提案する。
RGFNは、生成した候補の同等の品質を維持しながら、アウト・オブ・ボックスの合成を可能にする。
提案手法の有効性を,事前訓練されたプロキシモデルやGPUアクセラレーションドッキングなど,さまざまなオラクルモデルに適用した。
論文 参考訳(メタデータ) (2024-06-01T13:11:11Z) - React-OT: Optimal Transport for Generating Transition State in Chemical Reactions [45.99250641377074]
反応物や生成物から一意な遷移状態構造を生成するための最適な輸送手法であるReact-OTを開発した。
Re React-OTは、0.053AAの中央構造根平均平方偏差(RMSD)と1.06 kcal/molの中央障壁誤差を持つ高度精度の高いTS構造を生成する。
論文 参考訳(メタデータ) (2024-04-20T17:31:45Z) - MARS: A Motif-based Autoregressive Model for Retrosynthesis Prediction [54.75583184356392]
本稿では,レトロシンセシス予測のための新しいエンドツーエンドグラフ生成モデルを提案する。
反応中心を逐次同定し、合成子を生成し、合成子にモチーフを加えて反応子を生成する。
ベンチマークデータセットの実験では、提案されたモデルが従来の最先端のアルゴリズムを大幅に上回っていることが示されている。
論文 参考訳(メタデータ) (2022-09-27T06:29:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。