論文の概要: MolHF: A Hierarchical Normalizing Flow for Molecular Graph Generation
- arxiv url: http://arxiv.org/abs/2305.08457v1
- Date: Mon, 15 May 2023 08:59:35 GMT
- ステータス: 処理完了
- システム内更新日: 2023-05-16 15:20:52.928398
- Title: MolHF: A Hierarchical Normalizing Flow for Molecular Graph Generation
- Title(参考訳): MolHF:分子グラフ生成のための階層的正規化フロー
- Authors: Yiheng Zhu, Zhenqiu Ouyang, Ben Liao, Jialu Wu, Yixuan Wu, Chang-Yu
Hsieh, Tingjun Hou, Jian Wu
- Abstract要約: MolHFは分子グラフを粗い方法で生成する新しい階層型フローベースモデルである。
MolHFは100以上の重原子を持つより大きな分子(ポリマー)をモデル化するための最初のフローベースモデルである。
- 参考スコア(独自算出の注目度): 4.517805235253331
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Molecular de novo design is a critical yet challenging task in scientific
fields, aiming to design novel molecular structures with desired property
profiles. Significant progress has been made by resorting to generative models
for graphs. However, limited attention is paid to hierarchical generative
models, which can exploit the inherent hierarchical structure (with rich
semantic information) of the molecular graphs and generate complex molecules of
larger size that we shall demonstrate to be difficult for most existing models.
The primary challenge to hierarchical generation is the non-differentiable
issue caused by the generation of intermediate discrete coarsened graph
structures. To sidestep this issue, we cast the tricky hierarchical generation
problem over discrete spaces as the reverse process of hierarchical
representation learning and propose MolHF, a new hierarchical flow-based model
that generates molecular graphs in a coarse-to-fine manner. Specifically, MolHF
first generates bonds through a multi-scale architecture, then generates atoms
based on the coarsened graph structure at each scale. We demonstrate that MolHF
achieves state-of-the-art performance in random generation and property
optimization, implying its high capacity to model data distribution.
Furthermore, MolHF is the first flow-based model that can be applied to model
larger molecules (polymer) with more than 100 heavy atoms. The code and models
are available at https://github.com/violet-sto/MolHF.
- Abstract(参考訳): 分子デノボ設計は科学分野において重要な課題であり、望ましい特性プロファイルを持つ新しい分子構造を設計することを目的としている。
グラフの生成モデルを活用することで大きな進歩を遂げている。
しかし、分子グラフの固有の階層構造(豊富な意味情報を持つ)を活用でき、既存のほとんどのモデルでは困難であることを示す複雑な分子を生成する階層的生成モデルに限定的な注意が払われる。
階層生成の最大の課題は、中間離散粗いグラフ構造の生成によって生じる微分不可能な問題である。
この問題を回避するため,我々は階層的表現学習の逆プロセスとして離散空間上の難解な階層的生成問題を取り上げ,分子グラフを粗い方法で生成する新しい階層的フローベースモデルmolhfを提案する。
具体的には、MollHFはまずマルチスケールアーキテクチャを通して結合を生成し、その後各スケールで粗いグラフ構造に基づいて原子を生成する。
molhfがランダム生成とプロパティ最適化において最先端のパフォーマンスを達成し、データ分散のモデル化能力が高まることを実証する。
さらに、モルHFは100以上の重原子を持つより大きな分子(ポリマー)をモデル化できる最初のフローベースモデルである。
コードとモデルはhttps://github.com/violet-sto/molhfで入手できる。
関連論文リスト
- GraphXForm: Graph transformer for computer-aided molecular design with application to extraction [73.1842164721868]
本稿では,デコーダのみのグラフトランスフォーマアーキテクチャであるGraphXFormについて述べる。
液液抽出のための2つの溶媒設計課題について評価し,4つの最先端分子設計技術より優れていることを示した。
論文 参考訳(メタデータ) (2024-11-03T19:45:15Z) - MAGNet: Motif-Agnostic Generation of Molecules from Shapes [16.188301768974]
MAGNetは、原子と結合の型を割り当てる前に抽象的な形状を生成するグラフベースのモデルである。
MAGNetの表現性の向上は、よりトポロジカルな構造を持つ分子に繋がることを示した。
論文 参考訳(メタデータ) (2023-05-30T15:29:34Z) - An Equivariant Generative Framework for Molecular Graph-Structure
Co-Design [54.92529253182004]
分子グラフ構造アンダーラインCo設計のための機械学習ベースの生成フレームワークであるMollCodeを提案する。
MolCodeでは、3D幾何情報によって分子2Dグラフの生成が促進され、それによって分子3D構造の予測が導かれる。
分子設計における2次元トポロジーと3次元幾何は本質的に相補的な情報を含んでいることが明らかとなった。
論文 参考訳(メタデータ) (2023-04-12T13:34:22Z) - Graph Generation with Diffusion Mixture [57.78958552860948]
グラフの生成は、非ユークリッド構造の複雑な性質を理解する必要がある実世界のタスクにとって大きな課題である。
本稿では,拡散過程の最終グラフ構造を明示的に学習することにより,グラフのトポロジーをモデル化する生成フレームワークを提案する。
論文 参考訳(メタデータ) (2023-02-07T17:07:46Z) - MolCPT: Molecule Continuous Prompt Tuning to Generalize Molecular
Representation Learning [77.31492888819935]
分子表現学習のための「プリトレイン,プロンプト,ファインチューン」という新しいパラダイム,分子連続プロンプトチューニング(MolCPT)を提案する。
MolCPTは、事前訓練されたモデルを使用して、スタンドアロンの入力を表現的なプロンプトに投影するモチーフプロンプト関数を定義する。
いくつかのベンチマークデータセットの実験により、MollCPTは分子特性予測のために学習済みのGNNを効率的に一般化することが示された。
論文 参考訳(メタデータ) (2022-12-20T19:32:30Z) - Molecular Graph Generation via Geometric Scattering [7.796917261490019]
グラフニューラルネットワーク(GNN)は、薬物の設計と発見の問題を解決するために広く使われている。
分子グラフ生成における表現第一のアプローチを提案する。
我々のアーキテクチャは、医薬品のデータセットの有意義な表現を学習し、目標指向の薬物合成のためのプラットフォームを提供する。
論文 参考訳(メタデータ) (2021-10-12T18:00:23Z) - GraphPiece: Efficiently Generating High-Quality Molecular Graph with
Substructures [7.021635649909492]
分子グラフからエムグラフと呼ばれる共通部分構造を自動的に発見する手法を提案する。
グラフの断片に基づいて,変分オートエンコーダを用いて2つの相の分子を生成する。
論文 参考訳(メタデータ) (2021-06-29T05:26:18Z) - MolGrow: A Graph Normalizing Flow for Hierarchical Molecular Generation [9.594432031144716]
分子グラフを生成するための階層的正規化フローモデルを提案する。
このモデルは、全てのノードを2つに分割することで、単一ノードグラフから新しい分子構造を生成する。
我々は, 潜在符号を用いた化学特性のグローバルかつ制約付き最適化実験を成功させた。
論文 参考訳(メタデータ) (2021-02-03T17:48:52Z) - Conditional Constrained Graph Variational Autoencoders for Molecule
Design [70.59828655929194]
本稿では、このキーイデアを最先端のモデルで実装した、条件制約付きグラフ変分オートエンコーダ(CCGVAE)を提案する。
分子生成のために広く採用されている2つのデータセットについて、いくつかの評価指標について改善した結果を示す。
論文 参考訳(メタデータ) (2020-09-01T21:58:07Z) - Self-Supervised Graph Transformer on Large-Scale Molecular Data [73.3448373618865]
分子表現学習のための新しいフレームワークGROVERを提案する。
GROVERは、分子の豊富な構造的および意味的な情報を、巨大な未標識分子データから学習することができる。
分子表現学習において、最大のGNNであり、最大のトレーニングデータセットである、1000万個の未標識分子に1億のパラメータを持つGROVERを事前訓練します。
論文 参考訳(メタデータ) (2020-06-18T08:37:04Z) - Hierarchical Generation of Molecular Graphs using Structural Motifs [38.637412590671865]
本稿では,より大きく柔軟なグラフモチーフを基本構成ブロックとして利用する階層型グラフエンコーダデコーダを提案する。
エンコーダは、原子から連結モチーフまで、各分子の微細から粗い方法で多分解能表現を生成する。
我々は,高分子を含む複数の分子生成タスクにおけるモデルの評価を行い,そのモデルが従来の最先端のベースラインを著しく上回っていることを示す。
論文 参考訳(メタデータ) (2020-02-08T21:21:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。