Fugu-MT 論文翻訳(概要): GenMol: A Drug Discovery Generalist with Discrete Diffusion

論文の概要: GenMol: A Drug Discovery Generalist with Discrete Diffusion

arxiv url: http://arxiv.org/abs/2501.06158v1
Date: Fri, 10 Jan 2025 18:30:05 GMT
ステータス: 翻訳完了
システム内更新日: 2025-01-13 18:34:15.332664
Title: GenMol: A Drug Discovery Generalist with Discrete Diffusion
Title（参考訳）: GenMol: 離散拡散のドラッグ発見ジェネリスト
Authors: Seul Lee, Karsten Kreis, Srimukh Prasad Veccham, Meng Liu, Danny Reidenbach, Yuxing Peng, Saee Paliwal, Weili Nie, Arash Vahdat,
Abstract要約: Generalist Molecular Generative Model (GenMol) は、薬物発見パイプラインの様々な側面に対処する汎用的なフレームワークである。離散拡散フレームワークでは、フラグメントをマスク付きトークンに置き換えることで分子を最適化するフラグメントリマッシングを導入する。 GenMolは、デノボ生成およびフラグメント制約生成においてSAFE表現に基づいてトレーニングされた以前のGPTベースのモデルよりも大幅に優れている。
参考スコア（独自算出の注目度）: 43.29814519270451
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Drug discovery is a complex process that involves multiple scenarios and stages, such as fragment-constrained molecule generation, hit generation and lead optimization. However, existing molecular generative models can only tackle one or two of these scenarios and lack the flexibility to address various aspects of the drug discovery pipeline. In this paper, we present Generalist Molecular generative model (GenMol), a versatile framework that addresses these limitations by applying discrete diffusion to the Sequential Attachment-based Fragment Embedding (SAFE) molecular representation. GenMol generates SAFE sequences through non-autoregressive bidirectional parallel decoding, thereby allowing utilization of a molecular context that does not rely on the specific token ordering and enhanced computational efficiency. Moreover, under the discrete diffusion framework, we introduce fragment remasking, a strategy that optimizes molecules by replacing fragments with masked tokens and regenerating them, enabling effective exploration of chemical space. GenMol significantly outperforms the previous GPT-based model trained on SAFE representations in de novo generation and fragment-constrained generation, and achieves state-of-the-art performance in goal-directed hit generation and lead optimization. These experimental results demonstrate that GenMol can tackle a wide range of drug discovery tasks, providing a unified and versatile approach for molecular design.
Abstract（参考訳）: 薬物発見は、フラグメント制約分子の生成、ヒット生成、リード最適化など、複数のシナリオとステージを含む複雑なプロセスである。しかし、既存の分子生成モデルはこれらのシナリオの1つか2つにしか対応できず、薬物発見パイプラインの様々な側面に対処する柔軟性に欠ける。本稿では, 逐次アタッチメントに基づくフラグメント埋め込み(SAFE)分子表現に離散拡散を適用することで, これらの制約に対処する汎用的フレームワークであるジェネリスト分子生成モデル(GenMol)を提案する。 GenMolは、非自己回帰的な双方向並列デコーディングを通じてSAFEシーケンスを生成し、特定のトークンの順序付けに依存しない分子コンテキストの利用と計算効率の向上を可能にする。さらに, 離散拡散フレームワークの下では, フラグメントをマスク付きトークンで置き換え, 再生することで分子を最適化し, 化学空間を効果的に探索する手法であるフラグメントリマッシングを導入する。 GenMolは、デノボ生成およびフラグメント制約生成においてSAFE表現に基づいてトレーニングされた以前のGPTベースモデルよりも大幅に優れ、ゴール指向ヒット生成およびリード最適化における最先端のパフォーマンスを達成する。これらの実験結果は、GenMolが幅広い薬物発見タスクに取り組み、分子設計に統一的で汎用的なアプローチを提供することを示した。

関連論文リスト

MetaMolGen: A Neural Graph Motif Generation Model for De Novo Molecular Design [11.614346021222017]
本稿では,メタ学習に基づく分子生成システムMetaMolGenを提案する。グラフモチーフの分布を正規化された潜在空間にマッピングすることで標準化し、軽量な自己回帰シーケンスモデルを用いてSMILESシーケンスを生成する。生成プロセスに統合された学習可能なプロパティプロジェクターを通じて、ターゲット特性を持つ分子の条件付き生成をサポートする。
論文参考訳（メタデータ） (2025-04-22T05:04:33Z)
FragFM: Hierarchical Framework for Efficient Molecule Generation via Fragment-Level Discrete Flow Matching [3.0684068038799728]
分子グラフ生成のためのフラグメントレベル離散フローマッチングによる新しい階層型フレームワークであるFragFMを紹介する。 FragFMはフラグメントレベルで分子を生成し、原子レベルで詳細を再構築するために粗いオートエンコーダを利用する。また,現代分子グラフ生成モデルの天然物様分子生成能力を評価するための天然物生成ベンチマークも提案する。
論文参考訳（メタデータ） (2025-02-19T07:01:00Z)
MolMiner: Transformer architecture for fragment-based autoregressive generation of molecular stories [7.366789601705544]
生成過程の化学的妥当性、解釈可能性、可変分子サイズへの柔軟性は、計算材料設計における生成モデルに残る課題の1つである。本稿では,分子生成を離散的かつ解釈可能なステップの列に分解する自己回帰的手法を提案する。この結果から,本モデルでは,提案した多目的目標目標に応じて,生成分布を効果的にバイアスすることができることがわかった。
論文参考訳（メタデータ） (2024-11-10T22:00:55Z)
GFlowNet Pretraining with Inexpensive Rewards [2.924067540644439]
A-GFN(Atomic GFlowNets)は、個々の原子をビルディングブロックとして活用し、薬物のような化学空間をより包括的に探索する基礎的な生成モデルである。オフラインな薬物様分子データセットを用いた教師なし事前学習手法を提案する。我々は、目標条件付き微調整プロセスを実装し、A-GFNを適応させて特定の目標特性に最適化する手法をさらに強化する。
論文参考訳（メタデータ） (2024-09-15T11:42:17Z)
TAGMol: Target-Aware Gradient-guided Molecule Generation [19.977071499171903]
3次元生成モデルは、構造ベースドラッグデザイン(SBDD)において大きな可能性を秘めている。問題を分子生成と特性予測に分離する。後者は相乗的に拡散サンプリング過程を導出し、誘導拡散を促進し、所望の性質を持つ有意義な分子を創出する。この誘導分子生成過程をTAGMolと呼ぶ。
論文参考訳（メタデータ） (2024-06-03T14:43:54Z)
LDMol: A Text-to-Molecule Diffusion Model with Structurally Informative Latent Space Surpasses AR Models [55.5427001668863]
テキスト条件付き分子生成のための遅延拡散モデル LDMol を提案する。実験の結果, LDMolはテキストから分子生成ベンチマークにおいて, 既存の自己回帰ベースラインよりも優れていた。我々は,LDMolを分子間検索やテキスト誘導分子編集などの下流タスクに適用できることを示す。
論文参考訳（メタデータ） (2024-05-28T04:59:13Z)
Data-Efficient Molecular Generation with Hierarchical Textual Inversion [48.816943690420224]
分子生成のための階層型テキスト変換法 (HI-Mol) を提案する。 HI-Molは分子分布を理解する上での階層的情報、例えば粗い特徴ときめ細かい特徴の重要性にインスパイアされている。単一レベルトークン埋め込みを用いた画像領域の従来のテキストインバージョン法と比較して, マルチレベルトークン埋め込みにより, 基礎となる低ショット分子分布を効果的に学習することができる。
論文参考訳（メタデータ） (2024-05-05T08:35:23Z)
DecompOpt: Controllable and Decomposed Diffusion Models for Structure-based Molecular Optimization [49.85944390503957]
DecompOptは、制御可能・拡散モデルに基づく構造に基づく分子最適化手法である。 DecompOptは強いde novoベースラインよりも優れた特性を持つ分子を効率よく生成できることを示す。
論文参考訳（メタデータ） (2024-03-07T02:53:40Z)
Improving Molecular Properties Prediction Through Latent Space Fusion [9.912768918657354]
本稿では,最先端の化学モデルから導出した潜在空間を組み合わせた多視点手法を提案する。分子構造をグラフとして表現するMHG-GNNの埋め込みと、化学言語に根ざしたMoLFormerの埋め込みである。本稿では,既存の最先端手法と比較して,提案手法の優れた性能を示す。
論文参考訳（メタデータ） (2023-10-20T20:29:32Z)
Retrieval-based Controllable Molecule Generation [63.44583084888342]
制御可能な分子生成のための検索に基づく新しいフレームワークを提案する。我々は、与えられた設計基準を満たす分子の合成に向けて、事前学習された生成モデルを操るために、分子の小さなセットを使用します。提案手法は生成モデルの選択に非依存であり,タスク固有の微調整は不要である。
論文参考訳（メタデータ） (2022-08-23T17:01:16Z)
LIMO: Latent Inceptionism for Targeted Molecule Generation [14.391216237573369]
本研究は,分子発生を極めて促進する分子発生機構であるLIMO(Latent Inceptionism on Molecules)について述べる。総合的な実験により、LIMOはベンチマークタスクで競争力を発揮することが示された。生成した薬物様化合物の1つが、ヒトエストロゲン受容体に対して6～14ドルのK_D$を予測している。
論文参考訳（メタデータ） (2022-06-17T21:05:58Z)
Exploring Chemical Space with Score-based Out-of-distribution Generation [57.15855198512551]
生成微分方程式(SDE)にアウト・オブ・ディストリビューション制御を組み込んだスコアベース拡散方式を提案する。いくつかの新しい分子は現実世界の薬物の基本的な要件を満たしていないため、MOODは特性予測器からの勾配を利用して条件付き生成を行う。我々はMOODがトレーニング分布を超えて化学空間を探索できることを実験的に検証し、既存の方法で見いだされた分子、そして元のトレーニングプールの上位0.01%までも生成できることを実証した。
論文参考訳（メタデータ） (2022-06-06T06:17:11Z)
Molecular Attributes Transfer from Non-Parallel Data [57.010952598634944]
分子最適化をスタイル伝達問題として定式化し、非並列データの2つのグループ間の内部差を自動的に学習できる新しい生成モデルを提案する。毒性修飾と合成性向上という2つの分子最適化タスクの実験により,本モデルがいくつかの最先端手法を著しく上回ることを示した。
論文参考訳（メタデータ） (2021-11-30T06:10:22Z)
MIMOSA: Multi-constraint Molecule Sampling for Molecule Optimization [51.00815310242277]
生成モデルと強化学習アプローチは、最初の成功をおさめたが、複数の薬物特性を同時に最適化する上で、依然として困難に直面している。本稿では,MultI-Constraint MOlecule SAmpling (MIMOSA)アプローチ,初期推定として入力分子を用いるサンプリングフレームワーク,ターゲット分布からのサンプル分子を提案する。
論文参考訳（メタデータ） (2020-10-05T20:18:42Z)
Scaffold-constrained molecular generation [0.0]
SMILESをベースとしたリカレントニューラルネットワーク(Recurrent Neural Network, RNN)生成モデルを構築し, 足場制約付き生成を実現するため, サンプリング手法を改良した。本稿では,様々なタスクにおいて足場制約付き生成を行う手法について紹介する。
論文参考訳（メタデータ） (2020-09-15T15:41:18Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。