論文の概要: De Novo Molecular Generation via Connection-aware Motif Mining
- arxiv url: http://arxiv.org/abs/2302.01129v1
- Date: Thu, 2 Feb 2023 14:40:47 GMT
- ステータス: 処理完了
- システム内更新日: 2023-02-03 13:45:13.881492
- Title: De Novo Molecular Generation via Connection-aware Motif Mining
- Title(参考訳): 接続認識モチーフマイニングによるde novo分子生成
- Authors: Zijie Geng, Shufang Xie, Yingce Xia, Lijun Wu, Tao Qin, Jie Wang,
Yongdong Zhang, Feng Wu and Tie-Yan Liu
- Abstract要約: 我々は、マイニングされた接続認識モチーフに基づいて分子を生成する新しい方法、MiCaMを提案する。
得られたモチーフ語彙は、分子モチーフ(頻繁な断片)だけでなく、それらの接続情報も含む。
マイニングされた接続対応モチーフに基づいて、MiCaMは接続対応ジェネレータを構築し、同時にモチーフをピックアップし、どのように接続されているかを決定する。
- 参考スコア(独自算出の注目度): 197.97528902698966
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: De novo molecular generation is an essential task for science discovery.
Recently, fragment-based deep generative models have attracted much research
attention due to their flexibility in generating novel molecules based on
existing molecule fragments. However, the motif vocabulary, i.e., the
collection of frequent fragments, is usually built upon heuristic rules, which
brings difficulties to capturing common substructures from large amounts of
molecules. In this work, we propose a new method, MiCaM, to generate molecules
based on mined connection-aware motifs. Specifically, it leverages a
data-driven algorithm to automatically discover motifs from a molecule library
by iteratively merging subgraphs based on their frequency. The obtained motif
vocabulary consists of not only molecular motifs (i.e., the frequent
fragments), but also their connection information, indicating how the motifs
are connected with each other. Based on the mined connection-aware motifs,
MiCaM builds a connection-aware generator, which simultaneously picks up motifs
and determines how they are connected. We test our method on
distribution-learning benchmarks (i.e., generating novel molecules to resemble
the distribution of a given training set) and goal-directed benchmarks (i.e.,
generating molecules with target properties), and achieve significant
improvements over previous fragment-based baselines. Furthermore, we
demonstrate that our method can effectively mine domain-specific motifs for
different tasks.
- Abstract(参考訳): de novo分子生成は、科学の発見に欠かせない課題である。
近年、フラグメントベースの深層生成モデルは、既存の分子断片に基づく新規分子の生成の柔軟性から、多くの研究の注目を集めている。
しかしながら、頻繁な断片の集まりであるモチーフ語彙は、通常ヒューリスティックな規則に基づいて構築され、大量の分子から共通部分構造を捉えるのが困難である。
本研究では,マイニングされた結合認識モチーフに基づいて分子を生成する新しい方法であるMiCaMを提案する。
具体的には、データ駆動アルゴリズムを利用して、分子ライブラリからのモチーフを自動的に発見する。
得られたモチーフ語彙は、分子モチーフ(頻繁な断片)だけでなく、それらの接続情報からなり、モチーフが相互にどのように接続されているかを示す。
マイニングされた接続アウェアモチーフに基づいて、micamは接続アウェアジェネレータを構築し、同時にモチーフをピックアップし、接続方法を決定する。
本手法は, 分散学習ベンチマーク(例えば, 与えられたトレーニングセットの分布に類似する新規分子の生成)と目標指向ベンチマーク(すなわち, 目標特性を持つ分子の生成)で検証し, 以前のフラグメントベースベースラインよりも大幅に改善した。
さらに,本手法は,タスクごとにドメイン固有のモチーフを効果的にマイニングできることを示す。
関連論文リスト
- Zero Shot Molecular Generation via Similarity Kernels [0.6597195879147557]
ゼロショット分子生成の新しい手法である類似性に基づく分子生成(SiMGen)を提案する。
SiMGenは時間依存の類似性カーネルと事前訓練された機械学習力場からの記述子を組み合わせて分子を生成する。
また、ユーザがSiMGenで構造をオンラインで生成できるインタラクティブなWebツールもリリースしました。
論文 参考訳(メタデータ) (2024-02-13T17:53:44Z) - Atom-Motif Contrastive Transformer for Molecular Property Prediction [68.85399466928976]
グラフトランス (GT) モデルは分子特性予測 (MPP) のタスクで広く利用されている。
本稿では,原子レベルの相互作用を探索し,モチーフレベルの相互作用を考慮した新しいAtom-Motif Contrastive Transformer(AMCT)を提案する。
提案したAMCTは,7つの一般的なベンチマークデータセットに対して広範囲に評価され,定量的および定性的な結果の両方が有効であることを示す。
論文 参考訳(メタデータ) (2023-10-11T10:03:10Z) - MAGNet: Motif-Agnostic Generation of Molecules from Shapes [16.188301768974]
MAGNetは、原子と結合の型を割り当てる前に抽象的な形状を生成するグラフベースのモデルである。
MAGNetの表現性の向上は、よりトポロジカルな構造を持つ分子に繋がることを示した。
論文 参考訳(メタデータ) (2023-05-30T15:29:34Z) - MolCPT: Molecule Continuous Prompt Tuning to Generalize Molecular
Representation Learning [77.31492888819935]
分子表現学習のための「プリトレイン,プロンプト,ファインチューン」という新しいパラダイム,分子連続プロンプトチューニング(MolCPT)を提案する。
MolCPTは、事前訓練されたモデルを使用して、スタンドアロンの入力を表現的なプロンプトに投影するモチーフプロンプト関数を定義する。
いくつかのベンチマークデータセットの実験により、MollCPTは分子特性予測のために学習済みのGNNを効率的に一般化することが示された。
論文 参考訳(メタデータ) (2022-12-20T19:32:30Z) - Equivariant 3D-Conditional Diffusion Models for Molecular Linker Design [82.23006955069229]
分子リンカ設計のためのE(3)等価な3次元拡散モデルDiffLinkerを提案する。
我々のモデルは、欠落した原子を中間に配置し、初期フラグメントを全て組み込んだ分子を設計する。
DiffLinkerは、より多種多様な合成可能な分子を生成する標準データセット上で、他の手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2022-10-11T09:13:37Z) - Retrieval-based Controllable Molecule Generation [63.44583084888342]
制御可能な分子生成のための検索に基づく新しいフレームワークを提案する。
我々は、与えられた設計基準を満たす分子の合成に向けて、事前学習された生成モデルを操るために、分子の小さなセットを使用します。
提案手法は生成モデルの選択に非依存であり,タスク固有の微調整は不要である。
論文 参考訳(メタデータ) (2022-08-23T17:01:16Z) - Fragment-based Sequential Translation for Molecular Optimization [23.152338167332374]
本稿では,分子断片を用いた分子生成のためのフレキシブルな編集パラダイムを提案する。
我々は変分オートエンコーダを用いて分子断片をコヒーレント潜在空間に符号化する。
そして、分子を編集して複雑な化学特性空間を探索する語彙として利用します。
論文 参考訳(メタデータ) (2021-10-26T21:20:54Z) - Learning Latent Space Energy-Based Prior Model for Molecule Generation [59.875533935578375]
分子モデリングのためのSMILES表現を用いた潜時空間エネルギーに基づく先行モデルについて学習する。
本手法は,最先端モデルと競合する妥当性と特異性を持つ分子を生成することができる。
論文 参考訳(メタデータ) (2020-10-19T09:34:20Z) - A Deep Generative Model for Fragment-Based Molecule Generation [21.258861822241272]
フラグメントと呼ばれる小さな分子サブ構造のための言語モデルを開発した。
言い換えれば、原子のフラグメントではなく、フラグメントによって分子のフラグメントを生成します。
実験により、我々のモデルは、他の言語モデルベースの競合よりも優れていることが示された。
論文 参考訳(メタデータ) (2020-02-28T15:55:11Z) - Multi-Objective Molecule Generation using Interpretable Substructures [38.637412590671865]
薬物発見は、特定の化学的性質を持つ新規化合物を見つけることを目的としている。
目的は、複数の性質制約の交わりで分子をサンプリングすることを学ぶことである。
我々は、分子の合理性と呼ばれる部分構造の語彙から分子を構成することによって、この複雑さを相殺することを提案する。
論文 参考訳(メタデータ) (2020-02-08T22:55:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。