論文の概要: SynCraft: Guiding Large Language Models to Predict Edit Sequences for Molecular Synthesizability Optimization
- arxiv url: http://arxiv.org/abs/2512.20333v1
- Date: Tue, 23 Dec 2025 13:07:22 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-24 19:17:49.879959
- Title: SynCraft: Guiding Large Language Models to Predict Edit Sequences for Molecular Synthesizability Optimization
- Title(参考訳): SynCraft: 大規模言語モデルによる分子合成可能性最適化のための編集シーケンス予測
- Authors: Junren Li, Luhua Lai,
- Abstract要約: ポストホックフィルターやプロジェクションベースの方法のような現在のソリューションは、しばしば構造上の新規性を損なうか、キー薬局を妨害する。
SynCraftは、シーケンス変換タスクではなく、正確な構造編集問題として合成可能性最適化を再設計する、推論ベースのフレームワークである。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Generative artificial intelligence has revolutionized the exploration of chemical space, yet a critical bottleneck remains that a substantial fraction of generated molecules is synthetically inaccessible. Current solutions, such as post-hoc filtering or projection-based methods, often compromise structural novelty or disrupt key pharmacophores by forcing molecules into pre-defined synthetic templates. Herein, we introduce SynCraft, a reasoning-based framework that reframes synthesizability optimization not as a sequence translation task, but as a precise structural editing problem. Leveraging the emergent reasoning capabilities of Large Language Models, SynCraft navigates the "synthesis cliff" where minimal structural modifications yield significant gains in synthetic feasibility. By predicting executable sequences of atom-level edits rather than generating SMILES strings directly, SynCraft circumvents the syntactic fragility of LLMs while harnessing their chemical intuition. Extensive benchmarks demonstrate that SynCraft outperforms state-of-the-art baselines in generating synthesizable analogs with high structural fidelity. Furthermore, through interaction-aware prompting, SynCraft successfully replicates expert medicinal chemistry intuition in editing PLK1 inhibitors and rescuing high-scoring but previously discarded RIPK1 candidates in previous molecular generation literatures.
- Abstract(参考訳): 生成的人工知能は化学空間の探索に革命をもたらしたが、生成した分子のかなりの部分が合成的に到達できないという重大なボトルネックが残っている。
ポストホックフィルターやプロジェクションベースの方法のような現在のソリューションは、しばしば構造上の新規性を損なうか、分子を予め定義された合成テンプレートに強制することによってキー薬局を妨害する。
本稿では,シーケンス変換タスクではなく,正確な構造編集問題として,合成可能性最適化を再構成する推論ベースのフレームワークであるSynCraftを紹介する。
大規模言語モデルの創発的推論能力を活用して、SynCraftは、最小限の構造的な変更が合成可能性に大きな利益をもたらす「合成崖」をナビゲートする。
SMILES文字列を直接生成するのではなく、実行可能な原子レベルの編集のシーケンスを予測することで、SynCraftは化学直感を利用してLSMの構文的脆弱性を回避する。
大規模なベンチマークでは、SynCraftは、高い構造的忠実度を持つ合成可能なアナログを生成する際に、最先端のベースラインよりも優れていることが示されている。
さらに、相互作用を意識することで、SynCraftはPLK1インヒビターの編集や、以前の分子世代文献で捨てられたRIPK1候補の回収において、専門家の薬理学的な直感を再現することに成功した。
関連論文リスト
- Lost in Tokenization: Context as the Key to Unlocking Biomolecular Understanding in Scientific LLMs [78.18336140706471]
Sci-LLMは、生物発見を加速するための有望なフロンティアとして登場した。
現在の戦略では生の生体分子配列を処理する際にSci-LLMの推論能力を制限する。
より効果的な戦略は、Sci-LLMに高レベルな構造化コンテキストを提供することである。
論文 参考訳(メタデータ) (2025-10-27T09:03:21Z) - Rethinking Molecule Synthesizability with Chain-of-Reaction [47.744071119775676]
合成可能な投影のための生成フレームワークであるReaSynを紹介する。
大規模言語モデル(LLM)における推論経路に類似した合成経路を考慮した新しい視点を提案する。
CoR表記により、ReaSynは化学反応規則を明示的に学習する全ての反応ステップにおいて、密集した監督を受けることができる。
論文 参考訳(メタデータ) (2025-09-19T15:29:57Z) - SynLlama: Generating Synthesizable Molecules and Their Analogs with Large Language Models [3.750173223006525]
我々はSynLlamaを作成するために,MetaのLlama3 Large Language Modelsを微調整した新しいアプローチを提案する。
SynLlamaは、一般的にアクセス可能なビルディングブロックと堅牢な有機反応テンプレートからなる完全な合成経路を生成する。
外部のビルディングブロックをトレーニングしなくても、SynLlamaが効果的に一般化され、見つからず、購入可能なビルディングブロックとなることが分かりました。
論文 参考訳(メタデータ) (2025-03-16T18:30:56Z) - BatGPT-Chem: A Foundation Large Model For Retrosynthesis Prediction [65.93303145891628]
BatGPT-Chemは150億のパラメータを持つ大規模な言語モデルであり、再合成予測の強化に最適化されている。
我々のモデルは幅広い化学知識を捉え、反応条件の正確な予測を可能にする。
この開発により、化学者は新しい化合物を十分に扱うことができ、医薬品製造と材料科学の革新サイクルを早める可能性がある。
論文 参考訳(メタデータ) (2024-08-19T05:17:40Z) - SynthesizRR: Generating Diverse Datasets with Retrieval Augmentation [55.2480439325792]
トピック分類,感情分析,トーン検出,ユーモアの6つのデータセットの合成について検討した。
その結果,SynthesizRRは語彙や意味の多様性,人文との類似性,蒸留性能を大幅に向上させることがわかった。
論文 参考訳(メタデータ) (2024-05-16T12:22:41Z) - RetroXpert: Decompose Retrosynthesis Prediction like a Chemist [60.463900712314754]
そこで我々は, テンプレートフリーな自動逆合成拡張アルゴリズムを考案した。
我々の方法はレトロシンセシスを2段階に分解する。
最先端のベースラインよりも優れている一方で、我々のモデルは化学的に合理的な解釈も提供する。
論文 参考訳(メタデータ) (2020-11-04T04:35:34Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。