論文の概要: Lingo3DMol: Generation of a Pocket-based 3D Molecule using a Language
Model
- arxiv url: http://arxiv.org/abs/2305.10133v2
- Date: Mon, 5 Jun 2023 05:32:25 GMT
- ステータス: 処理完了
- システム内更新日: 2023-06-07 01:20:16.215524
- Title: Lingo3DMol: Generation of a Pocket-based 3D Molecule using a Language
Model
- Title(参考訳): lingo3dmol:言語モデルを用いたポケット型3d分子の生成
- Authors: Lvwei Wang (1), Zaiyun Lin (1), Yanhao Zhu (1), Rong Bai (1), Wei Feng
(1), Huting Wang (1), Jielong Zhou (1), Wei Peng (2), Bo Huang (1), Wenbiao
Zhou (1) ((1) Beijing StoneWise Technology Co Ltd (2) Innovation Center for
Pathogen Research Guangzhou Laboratory)
- Abstract要約: 本稿では,3次元座標を生成可能な言語モデルを用いたポケットベースの3次元分子生成手法を提案する。
局所的および大域的な座標を持つフラグメントベースのSMILESも提示され、言語モデルが分子トポロジ構造と空間的位置情報を効果的に学習することを可能にする。
この手法は, 結合パターン, 薬物様特性, 合理的なコンフォーメーション, 推論速度など, ほぼすべての指標において, 最先端の性能を実現する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Structure-based drug design powered by deep generative models have attracted
increasing research interest in recent years. Language models have demonstrated
a robust capacity for generating valid molecules in 2D structures, while
methods based on geometric deep learning can directly produce molecules with
accurate 3D coordinates. Inspired by both methods, this article proposes a
pocket-based 3D molecule generation method that leverages the language model
with the ability to generate 3D coordinates. High quality protein-ligand
complex data are insufficient; hence, a perturbation and restoration
pre-training task is designed that can utilize vast amounts of small-molecule
data. A new molecular representation, a fragment-based SMILES with local and
global coordinates, is also presented, enabling the language model to learn
molecular topological structures and spatial position information effectively.
Ultimately, CrossDocked and DUD-E dataset is employed for evaluation and
additional metrics are introduced. This method achieves state-of-the-art
performance in nearly all metrics, notably in terms of binding patterns,
drug-like properties, rational conformations, and inference speed. Our model is
available as an online service to academic users via sw3dmg.stonewise.cn
- Abstract(参考訳): 近年, 深部生成モデルによる構造的薬物設計が研究の関心を集めている。
言語モデルは2次元構造において有効な分子を生成するための堅牢な能力を示し、幾何学的深層学習に基づく手法は正確な3次元座標を持つ分子を直接生成することができる。
本稿では,両手法に着想を得て,言語モデルを利用して3次元座標を生成可能なポケット型3次元分子生成法を提案する。
高品質なタンパク質リガンド複合体データは不十分であるため、大量の小分子データを活用できる摂動・修復事前訓練タスクが設計されている。
局所的および大域的な座標を持つフラグメントに基づく新しい分子表現も提示され、言語モデルが分子トポロジー構造と空間的位置情報を効果的に学習することができる。
最終的に、CrossDockedとDUD-Eデータセットが評価に使用され、追加のメトリクスが導入される。
この手法は, 結合パターン, 薬物様特性, 合理的なコンフォーメーション, 推論速度など, ほぼすべての指標において最先端のパフォーマンスを実現する。
我々のモデルは sw3dmg.stonewise.cn を通じて学術ユーザー向けのオンラインサービスとして利用可能である。
関連論文リスト
- Pre-trained Molecular Language Models with Random Functional Group Masking [54.900360309677794]
SMILESをベースとしたアンダーリネム分子アンダーリネム言語アンダーリネムモデルを提案し,特定の分子原子に対応するSMILESサブシーケンスをランダムにマスキングする。
この技術は、モデルに分子構造や特性をよりよく推測させ、予測能力を高めることを目的としている。
論文 参考訳(メタデータ) (2024-11-03T01:56:15Z) - Diffusion Models in $\textit{De Novo}$ Drug Design [0.0]
拡散モデルは、特に3次元分子構造の文脈において、分子生成の強力なツールとして登場した。
本稿では,3次元分子生成に適した拡散モデルの技術的実装について述べる。
論文 参考訳(メタデータ) (2024-06-07T06:34:13Z) - LDMol: Text-to-Molecule Diffusion Model with Structurally Informative Latent Space [55.5427001668863]
テキスト条件付き分子生成のための遅延拡散モデル LDMol を提案する。
LDMolは、学習可能で構造的に有意な特徴空間を生成する分子オートエンコーダを含む。
我々は,LDMolを分子間検索やテキスト誘導分子編集などの下流タスクに適用できることを示す。
論文 参考訳(メタデータ) (2024-05-28T04:59:13Z) - DecompDiff: Diffusion Models with Decomposed Priors for Structure-Based Drug Design [62.68420322996345]
既存の構造に基づく薬物設計法は、すべての配位子原子を等しく扱う。
腕と足場を分解した新しい拡散モデルDecompDiffを提案する。
提案手法は,高親和性分子の生成における最先端性能を実現する。
論文 参考訳(メタデータ) (2024-02-26T05:21:21Z) - Learning Over Molecular Conformer Ensembles: Datasets and Benchmarks [44.934084652800976]
コンフォーマーアンサンブルを用いた学習の可能性を徹底的に評価するための,最初のMoleculAR Conformer Ensemble Learningベンチマークを導入する。
その結果,コンバータ空間からの直接学習は,様々なタスクやモデルの性能を向上させることができることがわかった。
論文 参考訳(メタデータ) (2023-09-29T20:06:46Z) - Geometric Latent Diffusion Models for 3D Molecule Generation [172.15028281732737]
生成モデル、特に拡散モデル(DM)は、特徴豊富な測地を生成する上で有望な結果を得た。
我々はGeoLDM(Geometric Latent Diffusion Models)と呼ばれる新しい3次元分子生成法を提案する。
論文 参考訳(メタデータ) (2023-05-02T01:07:22Z) - MUDiff: Unified Diffusion for Complete Molecule Generation [104.7021929437504]
本稿では,原子の特徴,2次元離散分子構造,および3次元連続分子座標を含む分子の包括的表現を生成する新しいモデルを提案する。
拡散過程を認知するための新しいグラフトランスフォーマーアーキテクチャを提案する。
我々のモデルは、安定で多様な分子を設計するための有望なアプローチであり、分子モデリングの幅広いタスクに適用できる。
論文 参考訳(メタデータ) (2023-04-28T04:25:57Z) - An Equivariant Generative Framework for Molecular Graph-Structure
Co-Design [54.92529253182004]
分子グラフ構造アンダーラインCo設計のための機械学習ベースの生成フレームワークであるMollCodeを提案する。
MolCodeでは、3D幾何情報によって分子2Dグラフの生成が促進され、それによって分子3D構造の予測が導かれる。
分子設計における2次元トポロジーと3次元幾何は本質的に相補的な情報を含んでいることが明らかとなった。
論文 参考訳(メタデータ) (2023-04-12T13:34:22Z) - Augmenting Molecular Deep Generative Models with Topological Data
Analysis Representations [21.237758981760784]
分子のトポロジカルデータ解析(TDA)表現を付加したSMILES変分自動エンコーダ(VAE)を提案する。
実験の結果, このTDA拡張により, SMILES VAEは3次元幾何学と電子特性の複雑な関係を捉えることができることがわかった。
論文 参考訳(メタデータ) (2021-06-08T15:49:21Z) - Learning a Continuous Representation of 3D Molecular Structures with
Deep Generative Models [0.0]
生成モデルは、連続的な潜伏空間における分子の表現と最適化を学ぶ全く異なるアプローチである。
原子密度格子を用いた三次元分子構造の深部生成モデルについて述べる。
また、与えられた入力化合物に基づいて多様な分子の集合をサンプリングすることで、有効な薬物様分子の創出の可能性を高めることができる。
論文 参考訳(メタデータ) (2020-10-17T01:15:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。