論文の概要: SynLlama: Generating Synthesizable Molecules and Their Analogs with Large Language Models
- arxiv url: http://arxiv.org/abs/2503.12602v1
- Date: Sun, 16 Mar 2025 18:30:56 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-03-18 12:28:02.052772
- Title: SynLlama: Generating Synthesizable Molecules and Their Analogs with Large Language Models
- Title(参考訳): SynLlama: 大規模言語モデルによる合成可能な分子とそのアナログの生成
- Authors: Kunyang Sun, Dorian Bagni, Joseph M. Cavanagh, Yingze Wang, Jacob M. Sawyer, Andrew Gritsevskiy, Teresa Head-Gordon,
- Abstract要約: 我々はSynLlamaを作成するために,MetaのLlama3大言語モデルを微調整した新しいアプローチを提案する。
SynLlamaは、一般的にアクセス可能なエナミンビルディングブロックと堅牢な有機反応テンプレートからなる完全な合成経路を生成する。
我々はSynLlamaを効果的に一般化して、目に見えないが購入不可能なビルディングブロックを構築できることを発見し、その再構築能力はより広い合成可能な化学空間にまで拡張できることを示した。
- 参考スコア(独自算出の注目度): 2.5159482339113084
- License:
- Abstract: Generative machine learning models for small molecule drug discovery have shown immense promise, but many molecules generated by this approach are too difficult to synthesize to be worth further investigation or further development. We present a novel approach by fine-tuning Meta's Llama3 large language models (LLMs) to create SynLlama, which generates full synthetic pathways made of commonly accessible Enamine building blocks and robust organic reaction templates. SynLlama explores a large synthesizable space using significantly less data compared to other state-of-the-art methods, and offers strong performance in bottom-up synthesis, synthesizable analog generation, and hit expansion, offering medicinal chemists a valuable tool for drug discovery developments. We find that SynLlama can effectively generalize to unseen yet purchasable building blocks, meaning that its reconstruction capabilities extend to a broader synthesizable chemical space than the training data.
- Abstract(参考訳): 小さな分子の薬物発見のための生成機械学習モデルは、非常に有望であることを示しているが、このアプローチによって生成される多くの分子は、さらなる研究やさらなる開発を行うには、合成が困難である。
本稿では,メタのLlama3大言語モデル(LLM)を微調整し,一般的にアクセス可能なEnamineビルディングブロックと堅牢な有機反応テンプレートからなる完全な合成経路を生成するSynLlamaを創出する手法を提案する。
SynLlamaは、他の最先端の方法に比べてはるかに少ないデータを使用し、大規模な合成可能空間を探索し、ボトムアップ合成、合成可能なアナログ生成、ヒット展開において強力なパフォーマンスを提供し、医薬品発見のための貴重なツールとして薬用化学物質を提供する。
我々はSynLlamaを効果的に一般化して、目に見えないが購入不可能なビルディングブロックを構築できることを発見し、その再構築能力は、トレーニングデータよりも広い合成可能な化学空間にまで拡張できることを示した。
関連論文リスト
- SDDBench: A Benchmark for Synthesizable Drug Design [31.739548311094843]
分子合成性を評価するための新しいデータ駆動計量を提案する。
提案したラウンドトリップスコアを用いて,分子の合成経路の実現可能性を直接評価する。
提案手法の有効性を示すため, 分子生成モデルを用いて, 探索成功率とともに, ラウンドトリップスコアの総合評価を行う。
論文 参考訳(メタデータ) (2024-11-13T03:08:33Z) - Generative Artificial Intelligence for Navigating Synthesizable Chemical Space [25.65907958071386]
合成可能な化学空間を効率的に探索・ナビゲートするための生成モデリングフレームワークであるSynFormerを紹介する。
拡張性のあるトランスフォーマーアーキテクチャとブロック選択のための拡散モジュールを組み込むことで、SynFormerは合成可能な分子設計において既存のモデルを超えている。
論文 参考訳(メタデータ) (2024-10-04T15:09:05Z) - SynthFormer: Equivariant Pharmacophore-based Generation of Synthesizable Molecules for Ligand-Based Drug Design [19.578382119811238]
本稿では,合成木として構築された完全合成可能な分子を生成する機械学習モデルであるSynthFormerについて紹介する。
これは第一種アプローチであり、薬理泳動に基づく活性分子を設計する能力を提供する可能性がある。
論文 参考訳(メタデータ) (2024-10-03T17:38:46Z) - BatGPT-Chem: A Foundation Large Model For Retrosynthesis Prediction [65.93303145891628]
BatGPT-Chemは150億のパラメータを持つ大規模な言語モデルであり、再合成予測の強化に最適化されている。
我々のモデルは幅広い化学知識を捉え、反応条件の正確な予測を可能にする。
この開発により、化学者は新しい化合物を十分に扱うことができ、医薬品製造と材料科学の革新サイクルを早める可能性がある。
論文 参考訳(メタデータ) (2024-08-19T05:17:40Z) - RGFN: Synthesizable Molecular Generation Using GFlowNets [51.33672611338754]
本稿では,化学反応の空間内で直接動作するGFlowNetフレームワークの拡張であるReaction-GFlowNetを提案する。
RGFNは、生成した候補の同等の品質を維持しながら、アウト・オブ・ボックスの合成を可能にする。
提案手法の有効性を,事前訓練されたプロキシモデルやGPUアクセラレーションドッキングなど,さまざまなオラクルモデルに適用した。
論文 参考訳(メタデータ) (2024-06-01T13:11:11Z) - SynFlowNet: Design of Diverse and Novel Molecules with Synthesis Constraints [16.21161274235011]
反応空間が化学反応と購入可能な反応剤を用いて新しい分子を逐次構築するGFlowNetモデルであるSynFlowNetを紹介する。
生成機構の明示的な制約としてフォワード合成を取り入れることで、シリコン分子生成と実世界の合成能力のギャップを埋めることを目指す。
論文 参考訳(メタデータ) (2024-05-02T10:15:59Z) - Let's Synthesize Step by Step: Iterative Dataset Synthesis with Large
Language Models by Extrapolating Errors from Small Models [69.76066070227452]
※データ合成*はラベル付きデータの少ない小さなモデルをトレーニングするための有望な方法です。
本稿では,この分散ギャップを縮めるデータ合成フレームワークであるStep* (**S3**) による合成ステップを提案する。
提案手法は,合成データセットと実データとのギャップを小さくすることで,小型モデルの性能を向上させる。
論文 参考訳(メタデータ) (2023-10-20T17:14:25Z) - Retrieval-based Controllable Molecule Generation [63.44583084888342]
制御可能な分子生成のための検索に基づく新しいフレームワークを提案する。
我々は、与えられた設計基準を満たす分子の合成に向けて、事前学習された生成モデルを操るために、分子の小さなセットを使用します。
提案手法は生成モデルの選択に非依存であり,タスク固有の微調整は不要である。
論文 参考訳(メタデータ) (2022-08-23T17:01:16Z) - RetroXpert: Decompose Retrosynthesis Prediction like a Chemist [60.463900712314754]
そこで我々は, テンプレートフリーな自動逆合成拡張アルゴリズムを考案した。
我々の方法はレトロシンセシスを2段階に分解する。
最先端のベースラインよりも優れている一方で、我々のモデルは化学的に合理的な解釈も提供する。
論文 参考訳(メタデータ) (2020-11-04T04:35:34Z) - Learning To Navigate The Synthetically Accessible Chemical Space Using
Reinforcement Learning [75.95376096628135]
ド・ノボ薬物設計のための強化学習(RL)を利用した新しい前方合成フレームワークを提案する。
このセットアップでは、エージェントは巨大な合成可能な化学空間をナビゲートする。
本研究は,合成可能な化学空間を根本的に拡張する上で,エンド・ツー・エンド・トレーニングが重要なパラダイムであることを示す。
論文 参考訳(メタデータ) (2020-04-26T21:40:03Z) - The Synthesizability of Molecules Proposed by Generative Models [3.032184156362992]
機能性分子の発見は高価で時間を要するプロセスである。
初期の薬物発見への関心が高まる技術のひとつに、デ・ノボの分子生成と最適化がある。
これらの手法は、多目的関数の最大化を目的とした新しい分子構造を示唆することができる。
しかし、これらのアプローチの実用性は、合成可能性の無知によって汚される。
論文 参考訳(メタデータ) (2020-02-17T15:41:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。