論文の概要: MolCLR: Molecular Contrastive Learning of Representations via Graph
Neural Networks
- arxiv url: http://arxiv.org/abs/2102.10056v1
- Date: Fri, 19 Feb 2021 17:35:18 GMT
- ステータス: 処理完了
- システム内更新日: 2021-02-22 13:19:30.963758
- Title: MolCLR: Molecular Contrastive Learning of Representations via Graph
Neural Networks
- Title(参考訳): MolCLR: グラフニューラルネットワークによる表現の分子コントラスト学習
- Authors: Yuyang Wang, Jianren Wang, Zhonglin Cao, Amir Barati Farimani
- Abstract要約: MolCLRは、大規模なラベルなしの分子データセットのための自己監視学習フレームワークです。
原子マスキング、結合除去、サブグラフ除去の3つの新しい分子グラフ増強法を提案する。
提案手法は,多くの挑戦的データセットに対して最先端の性能を実現する。
- 参考スコア(独自算出の注目度): 11.994553575596228
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Molecular machine learning bears promise for efficient molecule property
prediction and drug discovery. However, due to the limited labeled data and the
giant chemical space, machine learning models trained via supervised learning
perform poorly in generalization. This greatly limits the applications of
machine learning methods for molecular design and discovery. In this work, we
present MolCLR: Molecular Contrastive Learning of Representations via Graph
Neural Networks (GNNs), a self-supervised learning framework for large
unlabeled molecule datasets. Specifically, we first build a molecular graph,
where each node represents an atom and each edge represents a chemical bond. A
GNN is then used to encode the molecule graph. We propose three novel molecule
graph augmentations: atom masking, bond deletion, and subgraph removal. A
contrastive estimator is utilized to maximize the agreement of different graph
augmentations from the same molecule. Experiments show that molecule
representations learned by MolCLR can be transferred to multiple downstream
molecular property prediction tasks. Our method thus achieves state-of-the-art
performance on many challenging datasets. We also prove the efficiency of our
proposed molecule graph augmentations on supervised molecular classification
tasks.
- Abstract(参考訳): 分子機械学習は、効率的な分子特性予測と創薬を約束する。
しかし、ラベル付きデータと巨大な化学空間のため、教師付き学習で訓練された機械学習モデルは一般化に乏しい。
これは、分子設計と発見への機械学習手法の適用を大幅に制限する。
本研究では,大規模非ラベル分子データセットのための自己監視学習フレームワークであるGNNs(Graph Neural Networks)を用いて,MolCLR: Molecular Contrastive Learning of Representationsを提案する。
具体的には、まず各ノードが原子を表し、各エッジが化学結合を表す分子グラフを構築します。
その後、GNNが分子グラフのエンコードに使用される。
原子マスキング、結合除去、サブグラフ除去の3つの新しい分子グラフ増強法を提案する。
コントラスト推定器を用いて、同じ分子から異なるグラフ拡張の一致を最大化する。
実験により、MolCLRによって学習された分子表現は、複数の下流の分子特性予測タスクに転送できることが示された。
そこで本手法は,多くの挑戦的データセットに対して最先端の性能を実現する。
また,分子分類タスクにおける分子グラフ拡張の効率性についても検証した。
関連論文リスト
- Molecular Property Prediction Based on Graph Structure Learning [29.516479802217205]
我々はGSL-MPPと呼ばれるグラフ構造学習(GSL)に基づくMPPアプローチを提案する。
具体的には、まず、分子グラフ上にグラフニューラルネットワーク(GNN)を適用し、分子表現を抽出する。
分子指紋を用いて分子類似性グラフ(MSG)を構築する。
論文 参考訳(メタデータ) (2023-12-28T06:45:13Z) - MultiModal-Learning for Predicting Molecular Properties: A Framework Based on Image and Graph Structures [2.5563339057415218]
MolIGは、画像とグラフ構造に基づいて分子特性を予測するための、新しいMultiModaL分子事前学習フレームワークである。
両者の分子表現の強さを融合させる。
ベンチマークグループ内の分子特性予測に関連する下流タスクでは、パフォーマンスが向上する。
論文 参考訳(メタデータ) (2023-11-28T10:28:35Z) - MolGrapher: Graph-based Visual Recognition of Chemical Structures [50.13749978547401]
化学構造を視覚的に認識するためにMolGrapherを導入する。
すべての候補原子と結合をノードとして扱い、それらをグラフ化する。
グラフニューラルネットワークを用いてグラフ内の原子と結合ノードを分類する。
論文 参考訳(メタデータ) (2023-08-23T16:16:11Z) - Bi-level Contrastive Learning for Knowledge-Enhanced Molecule
Representations [55.42602325017405]
本稿では,分子の2レベル構造を考慮した新しいGODE法を提案する。
異なるグラフ構造上で2つのグラフニューラルネットワーク(GNN)を事前訓練し、対照的な学習と組み合わせることで、GODEは分子構造を対応する知識グラフサブ構造と融合させる。
11の化学特性タスクを微調整した場合、我々のモデルは既存のベンチマークよりも優れており、分類タスクの平均ROC-AUCアップリフトは13.8%、回帰タスクの平均RMSE/MAEエンハンスメントは35.1%である。
論文 参考訳(メタデータ) (2023-06-02T15:49:45Z) - Conditional Graph Information Bottleneck for Molecular Relational
Learning [9.56625683182106]
本稿では,コア部分グラフを検出してグラフ間の相互作用を予測できる新しい関係学習フレームワークCGIBを提案する。
提案手法は化学反応の性質,すなわち分子の核部分構造がどの分子と相互作用するかによって異なることを模倣する。
論文 参考訳(メタデータ) (2023-04-29T01:17:43Z) - Molecular Contrastive Learning with Chemical Element Knowledge Graph [16.136921143416927]
分子表現学習は、分子特性予測や薬物設計など、下流の複数のタスクに寄与する。
我々は,元素間の微視的関連を要約するケミカル要素知識グラフ(KG)を構築した。
最初のモジュールである知識誘導グラフ拡張は、ケミカル要素KGに基づいて元の分子グラフを増強する。
第2のモジュールである知識対応グラフ表現は、元の分子グラフの共通グラフエンコーダと知識対応メッセージパッシングニューラルネットワーク(KMPNN)を用いて分子表現を抽出し、拡張された分子グラフの複雑な情報をエンコードする。
論文 参考訳(メタデータ) (2021-12-01T15:04:39Z) - Chemical-Reaction-Aware Molecule Representation Learning [88.79052749877334]
本稿では,化学反応を用いて分子表現の学習を支援することを提案する。
本手法は,1) 埋め込み空間を適切に整理し, 2) 分子埋め込みの一般化能力を向上させるために有効であることが証明された。
実験結果から,本手法は様々なダウンストリームタスクにおける最先端性能を実現することが示された。
論文 参考訳(メタデータ) (2021-09-21T00:08:43Z) - Advanced Graph and Sequence Neural Networks for Molecular Property
Prediction and Drug Discovery [53.00288162642151]
計算モデルや分子表現にまたがる包括的な機械学習ツール群であるMoleculeKitを開発した。
これらの表現に基づいて構築されたMoeculeKitには、ディープラーニングと、グラフとシーケンスデータのための従来の機械学習方法の両方が含まれている。
オンラインおよびオフラインの抗生物質発見と分子特性予測のタスクの結果から、MoneculeKitは以前の方法よりも一貫した改善を実現していることがわかる。
論文 参考訳(メタデータ) (2020-12-02T02:09:31Z) - Heterogeneous Molecular Graph Neural Networks for Predicting Molecule
Properties [12.897488702184306]
分子の新規なグラフ表現であるヘテロジニアス分子グラフ(HMG)を導入する。
HMGNNは、グローバル分子表現とアテンション機構を予測プロセスに組み込んでいる。
我々のモデルは、QM9データセット上の12タスクのうち9タスクで最先端のパフォーマンスを達成する。
論文 参考訳(メタデータ) (2020-09-26T23:29:41Z) - ASGN: An Active Semi-supervised Graph Neural Network for Molecular
Property Prediction [61.33144688400446]
本稿では,ラベル付き分子とラベルなし分子の両方を組み込んだ,アクティブ半教師付きグラフニューラルネットワーク(ASGN)を提案する。
教師モデルでは,分子構造や分子分布から情報を共同で活用する汎用表現を学習するための,新しい半教師付き学習手法を提案する。
最後に,分子多様性の観点から,フレームワーク学習全体を通して情報的データを選択するための新しい能動的学習戦略を提案する。
論文 参考訳(メタデータ) (2020-07-07T04:22:39Z) - Self-Supervised Graph Transformer on Large-Scale Molecular Data [73.3448373618865]
分子表現学習のための新しいフレームワークGROVERを提案する。
GROVERは、分子の豊富な構造的および意味的な情報を、巨大な未標識分子データから学習することができる。
分子表現学習において、最大のGNNであり、最大のトレーニングデータセットである、1000万個の未標識分子に1億のパラメータを持つGROVERを事前訓練します。
論文 参考訳(メタデータ) (2020-06-18T08:37:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。