論文の概要: GenMol: A Drug Discovery Generalist with Discrete Diffusion
- arxiv url: http://arxiv.org/abs/2501.06158v2
- Date: Mon, 26 May 2025 23:51:15 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-28 14:37:19.118742
- Title: GenMol: A Drug Discovery Generalist with Discrete Diffusion
- Title(参考訳): GenMol: 離散拡散のドラッグ発見ジェネリスト
- Authors: Seul Lee, Karsten Kreis, Srimukh Prasad Veccham, Meng Liu, Danny Reidenbach, Yuxing Peng, Saee Paliwal, Weili Nie, Arash Vahdat,
- Abstract要約: Generalist Molecular Generative Model (GenMol) は、多種多様な薬物発見シナリオを扱うために単一の離散拡散モデルのみを使用する汎用的なフレームワークである。
GenMolは、非自己回帰的双方向並列デコードにより、シーケンスアタッチメントベースのフラグメント埋め込みシーケンスを生成する。
- 参考スコア(独自算出の注目度): 43.29814519270451
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Drug discovery is a complex process that involves multiple stages and tasks. However, existing molecular generative models can only tackle some of these tasks. We present Generalist Molecular generative model (GenMol), a versatile framework that uses only a single discrete diffusion model to handle diverse drug discovery scenarios. GenMol generates Sequential Attachment-based Fragment Embedding (SAFE) sequences through non-autoregressive bidirectional parallel decoding, thereby allowing the utilization of a molecular context that does not rely on the specific token ordering while having better sampling efficiency. GenMol uses fragments as basic building blocks for molecules and introduces fragment remasking, a strategy that optimizes molecules by regenerating masked fragments, enabling effective exploration of chemical space. We further propose molecular context guidance (MCG), a guidance method tailored for masked discrete diffusion of GenMol. GenMol significantly outperforms the previous GPT-based model in de novo generation and fragment-constrained generation, and achieves state-of-the-art performance in goal-directed hit generation and lead optimization. These results demonstrate that GenMol can tackle a wide range of drug discovery tasks, providing a unified and versatile approach for molecular design.
- Abstract(参考訳): 薬物発見は、複数の段階とタスクを含む複雑なプロセスである。
しかし、既存の分子生成モデルはこれらの課題のいくつかにしか対応できない。
汎用分子生成モデル(GenMol: Generalist Molecular Generative Model)について述べる。
GenMolは、非自己回帰的双方向並列デコーディングを通じて、シークエンシャルアタッチメントベースのフラグメント埋め込み(SAFE)シーケンスを生成し、サンプリング効率を向上しつつ、特定のトークン順序に依存しない分子コンテキストの利用を可能にする。
GenMolは、分子の基本的な構成要素としてフラグメントを使用し、マスクされたフラグメントを再生することで分子を最適化し、化学空間を効果的に探索する戦略であるフラグメントリマッシングを導入している。
我々はさらに、GenMolのマスク付き離散拡散に適した誘導法である分子コンテキストガイダンス(MCG)を提案する。
GenMolは、デノボ生成とフラグメント制約生成において従来のGPTベースモデルよりも大幅に優れ、ゴール指向ヒット生成とリード最適化において最先端のパフォーマンスを達成する。
これらの結果は、GenMolが幅広い薬物発見タスクに対応できることを示し、分子設計に統一的で汎用的なアプローチを提供する。
関連論文リスト
- MetaMolGen: A Neural Graph Motif Generation Model for De Novo Molecular Design [11.614346021222017]
本稿では,メタ学習に基づく分子生成システムMetaMolGenを提案する。
グラフモチーフの分布を正規化された潜在空間にマッピングすることで標準化し、軽量な自己回帰シーケンスモデルを用いてSMILESシーケンスを生成する。
生成プロセスに統合された学習可能なプロパティプロジェクターを通じて、ターゲット特性を持つ分子の条件付き生成をサポートする。
論文 参考訳(メタデータ) (2025-04-22T05:04:33Z) - MolMiner: Transformer architecture for fragment-based autoregressive generation of molecular stories [7.366789601705544]
生成過程の化学的妥当性、解釈可能性、可変分子サイズへの柔軟性は、計算材料設計における生成モデルに残る課題の1つである。
本稿では,分子生成を離散的かつ解釈可能なステップの列に分解する自己回帰的手法を提案する。
この結果から,本モデルでは,提案した多目的目標目標に応じて,生成分布を効果的にバイアスすることができることがわかった。
論文 参考訳(メタデータ) (2024-11-10T22:00:55Z) - GFlowNet Pretraining with Inexpensive Rewards [2.924067540644439]
A-GFN(Atomic GFlowNets)は、個々の原子をビルディングブロックとして活用し、薬物のような化学空間をより包括的に探索する基礎的な生成モデルである。
オフラインな薬物様分子データセットを用いた教師なし事前学習手法を提案する。
我々は、目標条件付き微調整プロセスを実装し、A-GFNを適応させて特定の目標特性に最適化する手法をさらに強化する。
論文 参考訳(メタデータ) (2024-09-15T11:42:17Z) - TAGMol: Target-Aware Gradient-guided Molecule Generation [19.977071499171903]
3次元生成モデルは、構造ベースドラッグデザイン(SBDD)において大きな可能性を秘めている。
問題を分子生成と特性予測に分離する。
後者は相乗的に拡散サンプリング過程を導出し、誘導拡散を促進し、所望の性質を持つ有意義な分子を創出する。
この誘導分子生成過程をTAGMolと呼ぶ。
論文 参考訳(メタデータ) (2024-06-03T14:43:54Z) - DecompOpt: Controllable and Decomposed Diffusion Models for Structure-based Molecular Optimization [49.85944390503957]
DecompOptは、制御可能・拡散モデルに基づく構造に基づく分子最適化手法である。
DecompOptは強いde novoベースラインよりも優れた特性を持つ分子を効率よく生成できることを示す。
論文 参考訳(メタデータ) (2024-03-07T02:53:40Z) - Improving Molecular Properties Prediction Through Latent Space Fusion [9.912768918657354]
本稿では,最先端の化学モデルから導出した潜在空間を組み合わせた多視点手法を提案する。
分子構造をグラフとして表現するMHG-GNNの埋め込みと、化学言語に根ざしたMoLFormerの埋め込みである。
本稿では,既存の最先端手法と比較して,提案手法の優れた性能を示す。
論文 参考訳(メタデータ) (2023-10-20T20:29:32Z) - Retrieval-based Controllable Molecule Generation [63.44583084888342]
制御可能な分子生成のための検索に基づく新しいフレームワークを提案する。
我々は、与えられた設計基準を満たす分子の合成に向けて、事前学習された生成モデルを操るために、分子の小さなセットを使用します。
提案手法は生成モデルの選択に非依存であり,タスク固有の微調整は不要である。
論文 参考訳(メタデータ) (2022-08-23T17:01:16Z) - Exploring Chemical Space with Score-based Out-of-distribution Generation [57.15855198512551]
生成微分方程式(SDE)にアウト・オブ・ディストリビューション制御を組み込んだスコアベース拡散方式を提案する。
いくつかの新しい分子は現実世界の薬物の基本的な要件を満たしていないため、MOODは特性予測器からの勾配を利用して条件付き生成を行う。
我々はMOODがトレーニング分布を超えて化学空間を探索できることを実験的に検証し、既存の方法で見いだされた分子、そして元のトレーニングプールの上位0.01%までも生成できることを実証した。
論文 参考訳(メタデータ) (2022-06-06T06:17:11Z) - Molecular Attributes Transfer from Non-Parallel Data [57.010952598634944]
分子最適化をスタイル伝達問題として定式化し、非並列データの2つのグループ間の内部差を自動的に学習できる新しい生成モデルを提案する。
毒性修飾と合成性向上という2つの分子最適化タスクの実験により,本モデルがいくつかの最先端手法を著しく上回ることを示した。
論文 参考訳(メタデータ) (2021-11-30T06:10:22Z) - MIMOSA: Multi-constraint Molecule Sampling for Molecule Optimization [51.00815310242277]
生成モデルと強化学習アプローチは、最初の成功をおさめたが、複数の薬物特性を同時に最適化する上で、依然として困難に直面している。
本稿では,MultI-Constraint MOlecule SAmpling (MIMOSA)アプローチ,初期推定として入力分子を用いるサンプリングフレームワーク,ターゲット分布からのサンプル分子を提案する。
論文 参考訳(メタデータ) (2020-10-05T20:18:42Z) - Scaffold-constrained molecular generation [0.0]
SMILESをベースとしたリカレントニューラルネットワーク(Recurrent Neural Network, RNN)生成モデルを構築し, 足場制約付き生成を実現するため, サンプリング手法を改良した。
本稿では,様々なタスクにおいて足場制約付き生成を行う手法について紹介する。
論文 参考訳(メタデータ) (2020-09-15T15:41:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。