論文の概要: Motif-based Graph Self-Supervised Learning forMolecular Property
Prediction
- arxiv url: http://arxiv.org/abs/2110.00987v1
- Date: Sun, 3 Oct 2021 11:45:51 GMT
- ステータス: 処理完了
- システム内更新日: 2021-10-06 05:44:33.662188
- Title: Motif-based Graph Self-Supervised Learning forMolecular Property
Prediction
- Title(参考訳): モチーフに基づくグラフ自己監督学習による分子特性予測
- Authors: Zaixi Zhang, Qi Liu, Hao Wang, Chengqiang Lu, Chee-Kong Lee
- Abstract要約: グラフニューラルネットワーク(GNN)は、様々な分子生成および予測タスクにおいて顕著な成功を収めている。
既存のGNN用の自己教師付き事前トレーニングフレームワークのほとんどは、ノードレベルまたはグラフレベルのタスクのみに焦点を当てている。
GNNのための新しい自己教師型モチーフ生成フレームワークを提案する。
- 参考スコア(独自算出の注目度): 12.789013658551454
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Predicting molecular properties with data-driven methods has drawn much
attention in recent years. Particularly, Graph Neural Networks (GNNs) have
demonstrated remarkable success in various molecular generation and prediction
tasks. In cases where labeled data is scarce, GNNs can be pre-trained on
unlabeled molecular data to first learn the general semantic and structural
information before being fine-tuned for specific tasks. However, most existing
self-supervised pre-training frameworks for GNNs only focus on node-level or
graph-level tasks. These approaches cannot capture the rich information in
subgraphs or graph motifs. For example, functional groups (frequently-occurred
subgraphs in molecular graphs) often carry indicative information about the
molecular properties. To bridge this gap, we propose Motif-based Graph
Self-supervised Learning (MGSSL) by introducing a novel self-supervised motif
generation framework for GNNs. First, for motif extraction from molecular
graphs, we design a molecule fragmentation method that leverages a
retrosynthesis-based algorithm BRICS and additional rules for controlling the
size of motif vocabulary. Second, we design a general motif-based generative
pre-training framework in which GNNs are asked to make topological and label
predictions. This generative framework can be implemented in two different
ways, i.e., breadth-first or depth-first. Finally, to take the multi-scale
information in molecular graphs into consideration, we introduce a multi-level
self-supervised pre-training. Extensive experiments on various downstream
benchmark tasks show that our methods outperform all state-of-the-art
baselines.
- Abstract(参考訳): 近年,データ駆動法による分子特性の予測が注目されている。
特にグラフニューラルネットワーク(GNN)は、様々な分子生成や予測タスクにおいて顕著な成功を収めている。
ラベル付きデータが不足している場合には、GNNを未ラベルの分子データで事前訓練して、特定のタスクのために微調整される前に、まず一般的な意味と構造情報を学習することができる。
しかし、既存のGNN用の自己教師付き事前トレーニングフレームワークのほとんどは、ノードレベルまたはグラフレベルタスクのみに焦点を当てている。
これらのアプローチは、サブグラフやグラフモチーフでリッチな情報をキャプチャできない。
例えば、官能基(分子グラフにしばしば現れる部分グラフ)は、しばしば分子の性質を示す情報を持っている。
このギャップを埋めるために,gnnのための新しい自己教師付きモチーフ生成フレームワークを導入することで,モチーフベースのグラフ自己教師付き学習(mgssl)を提案する。
まず,分子グラフからモチーフ抽出を行うために,再合成に基づくアルゴリズムBRICSと,モチーフ語彙のサイズを制御するための追加規則を利用する分子断片化法を設計する。
第2に、GNNにトポロジ的およびラベル的予測を依頼する一般的なモチーフに基づく生成事前学習フレームワークを設計する。
この生成フレームワークは、幅優先または深さ優先の2つの異なる方法で実装することができる。
最後に,分子グラフのマルチスケール情報を考慮し,マルチレベル自己教師型事前学習を導入する。
様々なダウンストリームベンチマークタスクに対する大規模な実験により、我々の手法は最先端のベースラインを全て上回ります。
関連論文リスト
- MAGE: Model-Level Graph Neural Networks Explanations via Motif-based Graph Generation [16.129359492539095]
グラフニューラルネットワーク(GNN)は、分子タスクにおいて顕著に成功したが、その解釈可能性はまだ難しい。
XGNNやGNNInterpreterのような伝統的なモデルレベルの説明法は、しばしば環のような有効な部分構造を特定するのに失敗し、疑わしい解釈可能性をもたらす。
我々は、モチーフを説明文を生成する基本単位として利用する革新的 textbfMotif-btextbfAsed textbfGNN textbfExplainer (MAGE) を導入する。
論文 参考訳(メタデータ) (2024-05-21T06:12:24Z) - Fragment-based Pretraining and Finetuning on Molecular Graphs [0.0]
標識されていない分子データは豊富になり、化学領域におけるGNNの自己教師付き学習の急速な発展を促進する。
本稿では,ノードレベルとグラフレベルの事前学習の限界を克服するために,フラグメントレベルでの事前学習を提案する。
グラフフラグメントに基づく事前学習(GraphFP)では,8つの共通分子ベンチマークのうち5つのパフォーマンスが向上し,少なくとも11.5%の長範囲生物学的ベンチマークのパフォーマンスが向上する。
論文 参考訳(メタデータ) (2023-10-05T03:01:09Z) - Will More Expressive Graph Neural Networks do Better on Generative
Tasks? [27.412913421460388]
グラフニューラルネットワーク(GNN)アーキテクチャはしばしば過小評価される。
グラフ生成モデルの基盤となるGNNを、より表現力のあるGNNに置き換える。
高度なGNNは、他の17の非GNNグラフ生成アプローチで最先端の結果を達成することができる。
論文 参考訳(メタデータ) (2023-08-23T07:57:45Z) - GIMLET: A Unified Graph-Text Model for Instruction-Based Molecule
Zero-Shot Learning [71.89623260998934]
本研究は,ゼロショット環境下での分子関連タスクの実現に自然言語命令を用いることの実現可能性について検討する。
既存の分子テキストモデルは、命令の不十分な処理とグラフの限られた容量のために、この設定では性能が良くない。
グラフデータとテキストデータの両方の言語モデルを統合するGIMLETを提案する。
論文 参考訳(メタデータ) (2023-05-28T18:27:59Z) - MolCPT: Molecule Continuous Prompt Tuning to Generalize Molecular
Representation Learning [77.31492888819935]
分子表現学習のための「プリトレイン,プロンプト,ファインチューン」という新しいパラダイム,分子連続プロンプトチューニング(MolCPT)を提案する。
MolCPTは、事前訓練されたモデルを使用して、スタンドアロンの入力を表現的なプロンプトに投影するモチーフプロンプト関数を定義する。
いくつかのベンチマークデータセットの実験により、MollCPTは分子特性予測のために学習済みのGNNを効率的に一般化することが示された。
論文 参考訳(メタデータ) (2022-12-20T19:32:30Z) - HiGNN: Hierarchical Informative Graph Neural Networks for Molecular
Property Prediction Equipped with Feature-Wise Attention [5.735627221409312]
分子特性を予測するための階層型情報グラフニューラルネットワークフレームワーク(HiGNN)を提案する。
実験により、HiGNNは、多くの挑戦的な薬物発見関連ベンチマークデータセットに対して最先端の予測性能を達成することが示された。
論文 参考訳(メタデータ) (2022-08-30T05:16:15Z) - MolGraph: a Python package for the implementation of molecular graphs
and graph neural networks with TensorFlow and Keras [51.92255321684027]
MolGraphは、分子機械学習(ML)のためのグラフニューラルネットワーク(GNN)パッケージである
MolGraphは、分子ML問題を解決するためにGNNアルゴリズムに渡すことができる小さな分子グラフを生成するための化学モジュールを実装している。
GNNは分子識別に有用であり,クロマトグラフィー保持時間データの解釈性が向上した。
論文 参考訳(メタデータ) (2022-08-21T18:37:41Z) - Graph neural networks for the prediction of molecular structure-property
relationships [59.11160990637615]
グラフニューラルネットワーク(GNN)は、分子グラフ上で直接動作する新しい機械学習手法である。
GNNは、エンドツーエンドでプロパティを学習できるため、情報記述子の必要性を回避することができる。
本稿では、分子特性予測のための2つの例を通して、GNNの基礎を説明し、GNNの応用を実証する。
論文 参考訳(メタデータ) (2022-07-25T11:30:44Z) - Neural Graph Matching for Pre-training Graph Neural Networks [72.32801428070749]
グラフニューラルネットワーク(GNN)は、構造データのモデリングにおいて強力な能力を示している。
GMPTと呼ばれる新しいグラフマッチングベースのGNN事前学習フレームワークを提案する。
提案手法は,完全自己指導型プレトレーニングと粗粒型プレトレーニングに適用できる。
論文 参考訳(メタデータ) (2022-03-03T09:53:53Z) - Molecular Graph Generation via Geometric Scattering [7.796917261490019]
グラフニューラルネットワーク(GNN)は、薬物の設計と発見の問題を解決するために広く使われている。
分子グラフ生成における表現第一のアプローチを提案する。
我々のアーキテクチャは、医薬品のデータセットの有意義な表現を学習し、目標指向の薬物合成のためのプラットフォームを提供する。
論文 参考訳(メタデータ) (2021-10-12T18:00:23Z) - Self-Supervised Graph Transformer on Large-Scale Molecular Data [73.3448373618865]
分子表現学習のための新しいフレームワークGROVERを提案する。
GROVERは、分子の豊富な構造的および意味的な情報を、巨大な未標識分子データから学習することができる。
分子表現学習において、最大のGNNであり、最大のトレーニングデータセットである、1000万個の未標識分子に1億のパラメータを持つGROVERを事前訓練します。
論文 参考訳(メタデータ) (2020-06-18T08:37:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。