論文の概要: Learn molecular representations from large-scale unlabeled molecules for
drug discovery
- arxiv url: http://arxiv.org/abs/2012.11175v1
- Date: Mon, 21 Dec 2020 08:21:49 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-27 06:18:08.724240
- Title: Learn molecular representations from large-scale unlabeled molecules for
drug discovery
- Title(参考訳): 薬品発見のための大規模非標識分子からの分子表現の学習
- Authors: Pengyong Li, Jun Wang, Yixuan Qiao, Hao Chen, Yihuan Yu, Xiaojun Yao,
Peng Gao, Guotong Xie, Sen Song
- Abstract要約: 分子プレトレーニンググラフベースのディープラーニングフレームワークmpgは、大規模なラベルなし分子から分子表現を頼りにする。
molgnetは、解釈可能な表現を生み出すために貴重な化学的洞察を捉えることができる。
MPGは、薬物発見パイプラインにおける新しいアプローチになることを約束している。
- 参考スコア(独自算出の注目度): 19.222413268610808
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: How to produce expressive molecular representations is a fundamental
challenge in AI-driven drug discovery. Graph neural network (GNN) has emerged
as a powerful technique for modeling molecular data. However, previous
supervised approaches usually suffer from the scarcity of labeled data and have
poor generalization capability. Here, we proposed a novel Molecular
Pre-training Graph-based deep learning framework, named MPG, that leans
molecular representations from large-scale unlabeled molecules. In MPG, we
proposed a powerful MolGNet model and an effective self-supervised strategy for
pre-training the model at both the node and graph-level. After pre-training on
11 million unlabeled molecules, we revealed that MolGNet can capture valuable
chemistry insights to produce interpretable representation. The pre-trained
MolGNet can be fine-tuned with just one additional output layer to create
state-of-the-art models for a wide range of drug discovery tasks, including
molecular properties prediction, drug-drug interaction, and drug-target
interaction, involving 13 benchmark datasets. Our work demonstrates that MPG is
promising to become a novel approach in the drug discovery pipeline.
- Abstract(参考訳): 表現的分子表現の創出は、AIによる薬物発見の根本的な課題である。
グラフニューラルネットワーク(GNN)は、分子データモデリングの強力な技術として登場した。
しかし、従来の教師付きアプローチは通常ラベル付きデータの不足に苦しみ、一般化能力に乏しい。
本稿では, 大規模未標識分子から分子表現を学習するMPGという, グラフに基づく新しいディープラーニングフレームワークを提案する。
MPGでは,ノードレベルとグラフレベルの両方でモデルを事前学習するための強力な MolGNet モデルと効果的な自己教師型戦略を提案する。
1100万個の未標識分子を事前学習した後、MoldGNetが貴重な化学的な洞察を捉え、解釈可能な表現を作り出すことを明らかにした。
MolGNetは、分子特性予測、薬物と薬物の相互作用、薬物とターゲットの相互作用など、幅広い薬物発見タスクのための最先端のモデルを作成するために、たった1つの出力層で微調整することができる。
我々の研究は、MPGが薬物発見パイプラインにおける新しいアプローチになることを約束していることを示している。
関連論文リスト
- Pre-trained Molecular Language Models with Random Functional Group Masking [54.900360309677794]
SMILESをベースとしたアンダーリネム分子アンダーリネム言語アンダーリネムモデルを提案し,特定の分子原子に対応するSMILESサブシーケンスをランダムにマスキングする。
この技術は、モデルに分子構造や特性をよりよく推測させ、予測能力を高めることを目的としている。
論文 参考訳(メタデータ) (2024-11-03T01:56:15Z) - Molecular Property Prediction Based on Graph Structure Learning [29.516479802217205]
我々はGSL-MPPと呼ばれるグラフ構造学習(GSL)に基づくMPPアプローチを提案する。
具体的には、まず、分子グラフ上にグラフニューラルネットワーク(GNN)を適用し、分子表現を抽出する。
分子指紋を用いて分子類似性グラフ(MSG)を構築する。
論文 参考訳(メタデータ) (2023-12-28T06:45:13Z) - MultiModal-Learning for Predicting Molecular Properties: A Framework Based on Image and Graph Structures [2.5563339057415218]
MolIGは、画像とグラフ構造に基づいて分子特性を予測するための、新しいMultiModaL分子事前学習フレームワークである。
両者の分子表現の強さを融合させる。
ベンチマークグループ内の分子特性予測に関連する下流タスクでは、パフォーマンスが向上する。
論文 参考訳(メタデータ) (2023-11-28T10:28:35Z) - MolCAP: Molecular Chemical reActivity pretraining and
prompted-finetuning enhanced molecular representation learning [3.179128580341411]
MolCAPは、化学反応性(IMR)知識に基づくグラフ事前学習トランスフォーマーであり、微調整を誘導する。
MolCAPによって推進され、基礎的なグラフニューラルネットワークでさえ、以前のモデルを上回る驚くべきパフォーマンスを達成することができる。
論文 参考訳(メタデータ) (2023-06-13T13:48:06Z) - Bi-level Contrastive Learning for Knowledge-Enhanced Molecule
Representations [55.42602325017405]
本稿では,分子の2レベル構造を考慮した新しいGODE法を提案する。
異なるグラフ構造上で2つのグラフニューラルネットワーク(GNN)を事前訓練し、対照的な学習と組み合わせることで、GODEは分子構造を対応する知識グラフサブ構造と融合させる。
11の化学特性タスクを微調整した場合、我々のモデルは既存のベンチマークよりも優れており、分類タスクの平均ROC-AUCアップリフトは13.8%、回帰タスクの平均RMSE/MAEエンハンスメントは35.1%である。
論文 参考訳(メタデータ) (2023-06-02T15:49:45Z) - MolCPT: Molecule Continuous Prompt Tuning to Generalize Molecular
Representation Learning [77.31492888819935]
分子表現学習のための「プリトレイン,プロンプト,ファインチューン」という新しいパラダイム,分子連続プロンプトチューニング(MolCPT)を提案する。
MolCPTは、事前訓練されたモデルを使用して、スタンドアロンの入力を表現的なプロンプトに投影するモチーフプロンプト関数を定義する。
いくつかのベンチマークデータセットの実験により、MollCPTは分子特性予測のために学習済みのGNNを効率的に一般化することが示された。
論文 参考訳(メタデータ) (2022-12-20T19:32:30Z) - Retrieval-based Controllable Molecule Generation [63.44583084888342]
制御可能な分子生成のための検索に基づく新しいフレームワークを提案する。
我々は、与えられた設計基準を満たす分子の合成に向けて、事前学習された生成モデルを操るために、分子の小さなセットを使用します。
提案手法は生成モデルの選択に非依存であり,タスク固有の微調整は不要である。
論文 参考訳(メタデータ) (2022-08-23T17:01:16Z) - Few-Shot Graph Learning for Molecular Property Prediction [46.60746023179724]
分子特性予測の新しいモデルであるMeta-MGNNを提案する。
ラベルのない分子情報を利用するため、Meta-MGNNはさらに分子構造、属性ベースの自己監視モジュール、および自己注意のタスクウェイトを組み込む。
2つの公開マルチプロパティデータセットに関する広範な実験は、Meta-MGNNがさまざまな最先端のメソッドを上回っていることを示しています。
論文 参考訳(メタデータ) (2021-02-16T01:55:34Z) - ASGN: An Active Semi-supervised Graph Neural Network for Molecular
Property Prediction [61.33144688400446]
本稿では,ラベル付き分子とラベルなし分子の両方を組み込んだ,アクティブ半教師付きグラフニューラルネットワーク(ASGN)を提案する。
教師モデルでは,分子構造や分子分布から情報を共同で活用する汎用表現を学習するための,新しい半教師付き学習手法を提案する。
最後に,分子多様性の観点から,フレームワーク学習全体を通して情報的データを選択するための新しい能動的学習戦略を提案する。
論文 参考訳(メタデータ) (2020-07-07T04:22:39Z) - Self-Supervised Graph Transformer on Large-Scale Molecular Data [73.3448373618865]
分子表現学習のための新しいフレームワークGROVERを提案する。
GROVERは、分子の豊富な構造的および意味的な情報を、巨大な未標識分子データから学習することができる。
分子表現学習において、最大のGNNであり、最大のトレーニングデータセットである、1000万個の未標識分子に1億のパラメータを持つGROVERを事前訓練します。
論文 参考訳(メタデータ) (2020-06-18T08:37:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。