論文の概要: Efficient and Programmable Exploration of Synthesizable Chemical Space
- arxiv url: http://arxiv.org/abs/2512.00384v1
- Date: Sat, 29 Nov 2025 08:21:21 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-02 19:46:34.21155
- Title: Efficient and Programmable Exploration of Synthesizable Chemical Space
- Title(参考訳): 合成可能な化学空間の効率的かつプログラム可能な探索
- Authors: Shitong Luo, Connor W. Coley,
- Abstract要約: 合成可能な化学空間内での分子発見のための効率的でプログラム可能なモデルであるPrexSynを提案する。
PrexSynは、分子特性と組み合わされた合成可能な経路の数十億規模のデータストリームで訓練されたデコーダのみのトランスフォーマーに基づいている。
このプロパティベースのクエリ機能を利用することで、PrexSynはブラックボックスのオラクル関数に対して分子を効率的に最適化することができる。
- 参考スコア(独自算出の注目度): 19.94593615043411
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The constrained nature of synthesizable chemical space poses a significant challenge for sampling molecules that are both synthetically accessible and possess desired properties. In this work, we present PrexSyn, an efficient and programmable model for molecular discovery within synthesizable chemical space. PrexSyn is based on a decoder-only transformer trained on a billion-scale datastream of synthesizable pathways paired with molecular properties, enabled by a real-time, high-throughput C++-based data generation engine. The large-scale training data allows PrexSyn to reconstruct the synthesizable chemical space nearly perfectly at a high inference speed and learn the association between properties and synthesizable molecules. Based on its learned property-pathway mappings, PrexSyn can generate synthesizable molecules that satisfy not only single-property conditions but also composite property queries joined by logical operators, thereby allowing users to ``program'' generation objectives. Moreover, by exploiting this property-based querying capability, PrexSyn can efficiently optimize molecules against black-box oracle functions via iterative query refinement, achieving higher sampling efficiency than even synthesis-agnostic baselines, making PrexSyn a powerful general-purpose molecular optimization tool. Overall, PrexSyn pushes the frontier of synthesizable molecular design by setting a new state of the art in synthesizable chemical space coverage, molecular sampling efficiency, and inference speed.
- Abstract(参考訳): 合成可能な化学空間の制約された性質は、合成可能かつ望ましい性質を持つ分子をサンプリングする上で重要な課題となる。
本研究では、合成可能な化学空間内での分子発見のための効率的でプログラム可能なモデルであるPrexSynを提案する。
PrexSynは、分子特性と組み合わせた10億規模の合成可能な経路のデータストリームに基づいてトレーニングされたデコーダのみのトランスフォーマーに基づいており、リアルタイムで高速なC++ベースのデータ生成エンジンによって実現されている。
大規模なトレーニングデータにより、PrexSynは合成可能な化学空間をほぼ完全に推論速度で再構築し、性質と合成可能な分子の関係を学習することができる。
PrexSynは、学習したプロパティ-パスウェイマッピングに基づいて、単一プロパティ条件だけでなく、論理演算子によって結合された複合プロパティクエリを満たす合成可能な分子を生成する。
さらに、このプロパティベースのクエリ機能を活用することで、PrexSynは反復的なクエリ改善によってブラックボックスのオラクル関数に対して効率よく分子を最適化することができ、合成に依存しないベースラインよりもサンプリング効率が高くなり、PrexSynは強力な汎用的な分子最適化ツールとなる。
全体として、PrexSynは合成可能な分子設計のフロンティアを、合成可能な化学空間のカバレッジ、分子サンプリング効率、推論速度の新たな最先端に設定することで推進している。
関連論文リスト
- Rethinking Molecule Synthesizability with Chain-of-Reaction [47.744071119775676]
合成可能な投影のための生成フレームワークであるReaSynを紹介する。
大規模言語モデル(LLM)における推論経路に類似した合成経路を考慮した新しい視点を提案する。
CoR表記により、ReaSynは化学反応規則を明示的に学習する全ての反応ステップにおいて、密集した監督を受けることができる。
論文 参考訳(メタデータ) (2025-09-19T15:29:57Z) - Synthesizable by Design: A Retrosynthesis-Guided Framework for Molecular Analog Generation [0.5852077003870417]
新規なレトロシンセシス誘導分子アナログ設計フレームワークであるSynTwinsを紹介する。
比較評価において、SynTwinsは合成可能なアナログを生成する上で優れた性能を示す。
多様な分子データセットのベンチマークにより、SynTwinsは計算設計と実験合成のギャップを効果的に埋めることを示した。
論文 参考訳(メタデータ) (2025-07-03T16:14:57Z) - ChemActor: Enhancing Automated Extraction of Chemical Synthesis Actions with LLM-Generated Data [53.78763789036172]
ケミカルエグゼキュータとして完全微調整された大規模言語モデル(LLM)であるChemActorを紹介し,非構造化実験手順と構造化動作シーケンスを変換する。
このフレームワークは、分散分散に基づくデータ選択モジュールと汎用LLMを統合し、単一の分子入力からマシン実行可能なアクションを生成する。
反応記述(R2D)と記述記述処理(D2A)のタスクの実験により、ChemActorは最先端のパフォーマンスを達成し、ベースラインモデルよりも10%高い性能を示した。
論文 参考訳(メタデータ) (2025-06-30T05:11:19Z) - SynLlama: Generating Synthesizable Molecules and Their Analogs with Large Language Models [3.750173223006525]
我々はSynLlamaを作成するために,MetaのLlama3 Large Language Modelsを微調整した新しいアプローチを提案する。
SynLlamaは、一般的にアクセス可能なビルディングブロックと堅牢な有機反応テンプレートからなる完全な合成経路を生成する。
外部のビルディングブロックをトレーニングしなくても、SynLlamaが効果的に一般化され、見つからず、購入可能なビルディングブロックとなることが分かりました。
論文 参考訳(メタデータ) (2025-03-16T18:30:56Z) - Text-Guided Multi-Property Molecular Optimization with a Diffusion Language Model [20.250683535089617]
変換器を用いた拡散言語モデル(TransDLM)を用いたテキスト誘導多目的分子最適化手法を提案する。
物理的、化学的に詳細なセマンティクスを特異的な分子表現と融合することにより、TransDLMは様々な情報ソースを効果的に統合し、正確な最適化を導く。
論文 参考訳(メタデータ) (2024-10-17T14:30:27Z) - Generative Artificial Intelligence for Navigating Synthesizable Chemical Space [25.65907958071386]
合成可能な化学空間を効率的に探索・ナビゲートするための生成モデリングフレームワークであるSynFormerを紹介する。
拡張性のあるトランスフォーマーアーキテクチャとブロック選択のための拡散モジュールを組み込むことで、SynFormerは合成可能な分子設計において既存のモデルを超えている。
論文 参考訳(メタデータ) (2024-10-04T15:09:05Z) - SynthFormer: Equivariant Pharmacophore-based Generation of Synthesizable Molecules for Ligand-Based Drug Design [19.578382119811238]
本稿では,合成木として構築された完全合成可能な分子を生成する機械学習モデルであるSynthFormerについて紹介する。
これは第一種アプローチであり、薬理泳動に基づく活性分子を設計する能力を提供する可能性がある。
論文 参考訳(メタデータ) (2024-10-03T17:38:46Z) - BatGPT-Chem: A Foundation Large Model For Retrosynthesis Prediction [65.93303145891628]
BatGPT-Chemは150億のパラメータを持つ大規模な言語モデルであり、再合成予測の強化に最適化されている。
我々のモデルは幅広い化学知識を捉え、反応条件の正確な予測を可能にする。
この開発により、化学者は新しい化合物を十分に扱うことができ、医薬品製造と材料科学の革新サイクルを早める可能性がある。
論文 参考訳(メタデータ) (2024-08-19T05:17:40Z) - Learning To Navigate The Synthetically Accessible Chemical Space Using
Reinforcement Learning [75.95376096628135]
ド・ノボ薬物設計のための強化学習(RL)を利用した新しい前方合成フレームワークを提案する。
このセットアップでは、エージェントは巨大な合成可能な化学空間をナビゲートする。
本研究は,合成可能な化学空間を根本的に拡張する上で,エンド・ツー・エンド・トレーニングが重要なパラダイムであることを示す。
論文 参考訳(メタデータ) (2020-04-26T21:40:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。