論文の概要: 3D Graph Contrastive Learning for Molecular Property Prediction
- arxiv url: http://arxiv.org/abs/2208.06360v2
- Date: Thu, 18 Aug 2022 13:10:50 GMT
- ステータス: 処理完了
- システム内更新日: 2023-02-11 03:43:10.735862
- Title: 3D Graph Contrastive Learning for Molecular Property Prediction
- Title(参考訳): 分子特性予測のための3次元グラフコントラスト学習
- Authors: Kisung Moon, Sunyoung Kwon
- Abstract要約: 自己教師付き学習(英: Self-supervised learning, SSL)は、データ固有の監督を利用してデータ表現を学習する手法である。
分子特性予測のための新しいコントラスト学習フレームワーク,小型3次元グラフコントラスト学習(3DGCL)を提案する。
- 参考スコア(独自算出の注目度): 1.0152838128195467
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Self-supervised learning (SSL) is a method that learns the data
representation by utilizing supervision inherent in the data. This learning
method is in the spotlight in the drug field, lacking annotated data due to
time-consuming and expensive experiments. SSL using enormous unlabeled data has
shown excellent performance for molecular property prediction, but a few issues
exist. (1) Existing SSL models are large-scale; there is a limitation to
implementing SSL where the computing resource is insufficient. (2) In most
cases, they do not utilize 3D structural information for molecular
representation learning. The activity of a drug is closely related to the
structure of the drug molecule. Nevertheless, most current models do not use 3D
information or use it partially. (3) Previous models that apply contrastive
learning to molecules use the augmentation of permuting atoms and bonds.
Therefore, molecules having different characteristics can be in the same
positive samples. We propose a novel contrastive learning framework,
small-scale 3D Graph Contrastive Learning (3DGCL) for molecular property
prediction, to solve the above problems. 3DGCL learns the molecular
representation by reflecting the molecule's structure through the pre-training
process that does not change the semantics of the drug. Using only 1,128
samples for pre-train data and 1 million model parameters, we achieved the
state-of-the-art or comparable performance in four regression benchmark
datasets. Extensive experiments demonstrate that 3D structural information
based on chemical knowledge is essential to molecular representation learning
for property prediction.
- Abstract(参考訳): 自己教師付き学習(英: Self-supervised learning, SSL)は、データ固有の監督を利用してデータ表現を学習する手法である。
この学習方法は薬物分野において注目を浴びており、時間と費用のかかる実験によって注釈付きデータが不足している。
膨大なラベルのないデータを用いたSSLは、分子特性予測に優れた性能を示しているが、いくつかの問題がある。
1)既存のSSLモデルは大規模であり,計算資源が不十分なSSLの実装には限界がある。
2)ほとんどの場合,分子表現学習には3次元構造情報を使用しない。
薬物の活性は、薬物分子の構造と密接に関連している。
しかし、現在のモデルのほとんどは3d情報を使用していない。
3) 分子にコントラスト学習を適用する以前のモデルは、置換原子と結合の増強を用いる。
したがって、異なる特徴を持つ分子は同じ正のサンプルに収まる。
本稿では,分子特性予測のための新しいコントラスト学習フレームワーク,small-scale 3d graph contrastive learning (3dgcl)を提案する。
3DGCLは、薬物のセマンティクスを変えない事前学習プロセスを通じて分子の構造を反映することで分子表現を学習する。
1,128サンプルの事前トレーニングデータと100万のモデルパラメータを使用して,4つの回帰ベンチマークデータセットで,最先端あるいは同等のパフォーマンスを達成しました。
化学知識に基づく3次元構造情報は特性予測のための分子表現学習に不可欠であることを示す。
関連論文リスト
- Pre-trained Molecular Language Models with Random Functional Group Masking [54.900360309677794]
SMILESをベースとしたアンダーリネム分子アンダーリネム言語アンダーリネムモデルを提案し,特定の分子原子に対応するSMILESサブシーケンスをランダムにマスキングする。
この技術は、モデルに分子構造や特性をよりよく推測させ、予測能力を高めることを目的としている。
論文 参考訳(メタデータ) (2024-11-03T01:56:15Z) - 3D-Mol: A Novel Contrastive Learning Framework for Molecular Property Prediction with 3D Information [1.1777304970289215]
3D-Molはより正確な空間構造表現のために設計された新しいアプローチである。
分子を3つの階層グラフに分解し、幾何学的情報をよりよく抽出する。
3D-Molと最先端のベースラインを7つのベンチマークで比較し,優れた性能を示す。
論文 参考訳(メタデータ) (2023-09-28T10:05:37Z) - Bi-level Contrastive Learning for Knowledge-Enhanced Molecule
Representations [55.42602325017405]
本稿では,分子の2レベル構造を考慮した新しいGODE法を提案する。
異なるグラフ構造上で2つのグラフニューラルネットワーク(GNN)を事前訓練し、対照的な学習と組み合わせることで、GODEは分子構造を対応する知識グラフサブ構造と融合させる。
11の化学特性タスクを微調整した場合、我々のモデルは既存のベンチマークよりも優れており、分類タスクの平均ROC-AUCアップリフトは13.8%、回帰タスクの平均RMSE/MAEエンハンスメントは35.1%である。
論文 参考訳(メタデータ) (2023-06-02T15:49:45Z) - Implicit Geometry and Interaction Embeddings Improve Few-Shot Molecular
Property Prediction [53.06671763877109]
我々は, 複雑な分子特性を符号化した分子埋め込みを開発し, 数発の分子特性予測の性能を向上させる。
我々の手法は大量の合成データ、すなわち分子ドッキング計算の結果を利用する。
複数の分子特性予測ベンチマークでは、埋め込み空間からのトレーニングにより、マルチタスク、MAML、プロトタイプラーニング性能が大幅に向上する。
論文 参考訳(メタデータ) (2023-02-04T01:32:40Z) - MolCPT: Molecule Continuous Prompt Tuning to Generalize Molecular
Representation Learning [77.31492888819935]
分子表現学習のための「プリトレイン,プロンプト,ファインチューン」という新しいパラダイム,分子連続プロンプトチューニング(MolCPT)を提案する。
MolCPTは、事前訓練されたモデルを使用して、スタンドアロンの入力を表現的なプロンプトに投影するモチーフプロンプト関数を定義する。
いくつかのベンチマークデータセットの実験により、MollCPTは分子特性予測のために学習済みのGNNを効率的に一般化することが示された。
論文 参考訳(メタデータ) (2022-12-20T19:32:30Z) - Improving Molecular Contrastive Learning via Faulty Negative Mitigation
and Decomposed Fragment Contrast [17.142976840521264]
グラフニューラルネットワーク(GNN)を用いた表現の分子コントラスト学習の改善のためのiMolCLRを提案する。
実験の結果,提案手法はGNNモデルの性能を著しく向上させることがわかった。
iMolCLRは本質的に分子の類似性を推論できる足場や官能基を埋め込む。
論文 参考訳(メタデータ) (2022-02-18T18:33:27Z) - 3D Infomax improves GNNs for Molecular Property Prediction [1.9703625025720701]
本稿では,2次元分子グラフのみに与えられる分子の幾何学をモデル化するための事前学習モデルを提案する。
我々は,3次元事前学習が幅広い特性に対して大きな改善をもたらすことを示す。
論文 参考訳(メタデータ) (2021-10-08T13:30:49Z) - Molecular machine learning with conformer ensembles [0.0]
ChemPropやSchnetなどの主要なアーキテクチャに拡張された複数のディープラーニングモデルを紹介します。
次に、これらのモデルの性能トレードオフを2D、3D、4D表現で評価し、薬物活動の予測を行う。
新しいアーキテクチャは2Dモデルよりも大幅にパフォーマンスが向上するが、その性能は多くの場合、多くのモデルと同様、単一のコンフォーマを持つ。
論文 参考訳(メタデータ) (2020-12-15T17:44:48Z) - ASGN: An Active Semi-supervised Graph Neural Network for Molecular
Property Prediction [61.33144688400446]
本稿では,ラベル付き分子とラベルなし分子の両方を組み込んだ,アクティブ半教師付きグラフニューラルネットワーク(ASGN)を提案する。
教師モデルでは,分子構造や分子分布から情報を共同で活用する汎用表現を学習するための,新しい半教師付き学習手法を提案する。
最後に,分子多様性の観点から,フレームワーク学習全体を通して情報的データを選択するための新しい能動的学習戦略を提案する。
論文 参考訳(メタデータ) (2020-07-07T04:22:39Z) - Self-Supervised Graph Transformer on Large-Scale Molecular Data [73.3448373618865]
分子表現学習のための新しいフレームワークGROVERを提案する。
GROVERは、分子の豊富な構造的および意味的な情報を、巨大な未標識分子データから学習することができる。
分子表現学習において、最大のGNNであり、最大のトレーニングデータセットである、1000万個の未標識分子に1億のパラメータを持つGROVERを事前訓練します。
論文 参考訳(メタデータ) (2020-06-18T08:37:04Z) - Targeting SARS-CoV-2 with AI- and HPC-enabled Lead Generation: A First
Data Release [8.090016327163564]
このデータリリースは、4.2B分子と60TBの事前計算データの構造情報を含んでいる。
有望なアプローチのひとつは、機械学習(ML)と人工知能(AI)ツールをトレーニングして、多数の小さな分子をスクリーニングすることだ。
今後のリリースでは、より詳細な分子シミュレーションや計算モデル、その他の製品を含むように、データを拡大する予定である。
論文 参考訳(メタデータ) (2020-05-28T01:33:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。