論文の概要: Improving Molecular Contrastive Learning via Faulty Negative Mitigation
and Decomposed Fragment Contrast
- arxiv url: http://arxiv.org/abs/2202.09346v1
- Date: Fri, 18 Feb 2022 18:33:27 GMT
- ステータス: 処理完了
- システム内更新日: 2022-02-21 15:33:12.954477
- Title: Improving Molecular Contrastive Learning via Faulty Negative Mitigation
and Decomposed Fragment Contrast
- Title(参考訳): 欠陥負の緩和と分解フラグメントコントラストによる分子コントラスト学習の改善
- Authors: Yuyang Wang, Rishikesh Magar, Chen Liang, Amir Barati Farimani
- Abstract要約: グラフニューラルネットワーク(GNN)を用いた表現の分子コントラスト学習の改善のためのiMolCLRを提案する。
実験の結果,提案手法はGNNモデルの性能を著しく向上させることがわかった。
iMolCLRは本質的に分子の類似性を推論できる足場や官能基を埋め込む。
- 参考スコア(独自算出の注目度): 17.142976840521264
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Deep learning has been a prevalence in computational chemistry and widely
implemented in molecule property predictions. Recently, self-supervised
learning (SSL), especially contrastive learning (CL), gathers growing attention
for the potential to learn molecular representations that generalize to the
gigantic chemical space. Unlike supervised learning, SSL can directly leverage
large unlabeled data, which greatly reduces the effort to acquire molecular
property labels through costly and time-consuming simulations or experiments.
However, most molecular SSL methods borrow the insights from the machine
learning community but neglect the unique cheminformatics (e.g., molecular
fingerprints) and multi-level graphical structures (e.g., functional groups) of
molecules. In this work, we propose iMolCLR: improvement of Molecular
Contrastive Learning of Representations with graph neural networks (GNNs) in
two aspects, (1) mitigating faulty negative contrastive instances via
considering cheminformatics similarities between molecule pairs; (2)
fragment-level contrasting between intra- and inter-molecule substructures
decomposed from molecules. Experiments have shown that the proposed strategies
significantly improve the performance of GNN models on various challenging
molecular property predictions. In comparison to the previous CL framework,
iMolCLR demonstrates an averaged 1.3% improvement of ROC-AUC on 7
classification benchmarks and an averaged 4.8% decrease of the error on 5
regression benchmarks. On most benchmarks, the generic GNN pre-trained by
iMolCLR rivals or even surpasses supervised learning models with sophisticated
architecture designs and engineered features. Further investigations
demonstrate that representations learned through iMolCLR intrinsically embed
scaffolds and functional groups that can reason molecule similarities.
- Abstract(参考訳): 深層学習は計算化学において一般的であり、分子特性予測において広く実装されている。
近年、自己教師付き学習(SSL)、特に対照的学習(CL)は、巨大化学空間に一般化する分子表現を学習する可能性に注目が集まっている。
教師付き学習とは異なり、SSLは大きなラベルのないデータを直接利用することができ、コストと時間のかかるシミュレーションや実験を通じて分子特性ラベルを取得する労力を大幅に削減することができる。
しかし、ほとんどの分子SSL法は機械学習コミュニティからの洞察を借りているが、ユニークな化学情報学(分子指紋など)や分子の多レベルグラフィカル構造(機能群など)は無視している。
本稿では,iMolCLRを提案する。 グラフニューラルネットワーク(GNN)による表現の分子コントラスト学習の改善,(1) 分子対間の化学フォマティクス類似性を考慮した欠陥負のコントラストインスタンスの緩和,(2) 分子から分解された分子内および分子間サブ構造間の断片レベルのコントラスト
実験の結果,提案手法は分子特性予測におけるGNNモデルの性能を著しく向上させることがわかった。
以前のCLフレームワークと比較して、iMolCLRは7つの分類ベンチマークで平均1.3%改善し、5つの回帰ベンチマークで平均4.8%エラーが減少した。
ほとんどのベンチマークでは、iMolCLRによって事前訓練されたジェネリックGNNは、高度なアーキテクチャ設計とエンジニアリング機能を備えた教師付き学習モデルに匹敵する、あるいは超越している。
さらなる研究により、iMolCLRを通して学んだ表現が本質的に分子の類似性を推論できる足場と官能基を埋め込むことが示されている。
関連論文リスト
- FARM: Functional Group-Aware Representations for Small Molecules [55.281754551202326]
小型分子のための機能的グループ認識表現(FARM)について紹介する。
FARMはSMILES、自然言語、分子グラフのギャップを埋めるために設計された基礎モデルである。
MoleculeNetデータセット上でFARMを厳格に評価し、12タスク中10タスクで最先端のパフォーマンスを実現しています。
論文 参考訳(メタデータ) (2024-10-02T23:04:58Z) - Contrastive Dual-Interaction Graph Neural Network for Molecular Property Prediction [0.0]
本稿では,分子特性予測のための自己教師付きグラフニューラルネットワークフレームワークであるDIG-Molを紹介する。
DIG-Molは2つの相互接続ネットワークと運動量蒸留ネットワークを統合し、分子特性を効率的に改善する。
我々は,様々な分子特性予測タスクにおける広範囲な実験的評価により,DIG-Molの最先端性能を確立した。
論文 参考訳(メタデータ) (2024-05-04T10:09:27Z) - Multi-Modal Representation Learning for Molecular Property Prediction:
Sequence, Graph, Geometry [6.049566024728809]
深層学習に基づく分子特性予測は、従来の手法の資源集約性に対する解決策として登場した。
本稿では,分子特性予測のための新しいマルチモーダル表現学習モデルSGGRLを提案する。
モダリティ間の整合性を確保するため、SGGRLは異なる分子の類似性を最小化しながら同じ分子の表現の類似性を最大化するように訓練される。
論文 参考訳(メタデータ) (2024-01-07T02:18:00Z) - MultiModal-Learning for Predicting Molecular Properties: A Framework Based on Image and Graph Structures [2.5563339057415218]
MolIGは、画像とグラフ構造に基づいて分子特性を予測するための、新しいMultiModaL分子事前学習フレームワークである。
両者の分子表現の強さを融合させる。
ベンチマークグループ内の分子特性予測に関連する下流タスクでは、パフォーマンスが向上する。
論文 参考訳(メタデータ) (2023-11-28T10:28:35Z) - Learning Over Molecular Conformer Ensembles: Datasets and Benchmarks [44.934084652800976]
コンフォーマーアンサンブルを用いた学習の可能性を徹底的に評価するための,最初のMoleculAR Conformer Ensemble Learningベンチマークを導入する。
その結果,コンバータ空間からの直接学習は,様々なタスクやモデルの性能を向上させることができることがわかった。
論文 参考訳(メタデータ) (2023-09-29T20:06:46Z) - Bi-level Contrastive Learning for Knowledge-Enhanced Molecule
Representations [55.42602325017405]
本稿では,分子の2レベル構造を考慮した新しいGODE法を提案する。
異なるグラフ構造上で2つのグラフニューラルネットワーク(GNN)を事前訓練し、対照的な学習と組み合わせることで、GODEは分子構造を対応する知識グラフサブ構造と融合させる。
11の化学特性タスクを微調整した場合、我々のモデルは既存のベンチマークよりも優れており、分類タスクの平均ROC-AUCアップリフトは13.8%、回帰タスクの平均RMSE/MAEエンハンスメントは35.1%である。
論文 参考訳(メタデータ) (2023-06-02T15:49:45Z) - Atomic and Subgraph-aware Bilateral Aggregation for Molecular
Representation Learning [57.670845619155195]
我々は、原子とサブグラフを意識したバイラテラルアグリゲーション(ASBA)と呼ばれる分子表現学習の新しいモデルを導入する。
ASBAは、両方の種類の情報を統合することで、以前の原子単位とサブグラフ単位のモデルの限界に対処する。
本手法は,分子特性予測のための表現をより包括的に学習する方法を提供する。
論文 参考訳(メタデータ) (2023-05-22T00:56:00Z) - Implicit Geometry and Interaction Embeddings Improve Few-Shot Molecular
Property Prediction [53.06671763877109]
我々は, 複雑な分子特性を符号化した分子埋め込みを開発し, 数発の分子特性予測の性能を向上させる。
我々の手法は大量の合成データ、すなわち分子ドッキング計算の結果を利用する。
複数の分子特性予測ベンチマークでは、埋め込み空間からのトレーニングにより、マルチタスク、MAML、プロトタイプラーニング性能が大幅に向上する。
論文 参考訳(メタデータ) (2023-02-04T01:32:40Z) - Chemical-Reaction-Aware Molecule Representation Learning [88.79052749877334]
本稿では,化学反応を用いて分子表現の学習を支援することを提案する。
本手法は,1) 埋め込み空間を適切に整理し, 2) 分子埋め込みの一般化能力を向上させるために有効であることが証明された。
実験結果から,本手法は様々なダウンストリームタスクにおける最先端性能を実現することが示された。
論文 参考訳(メタデータ) (2021-09-21T00:08:43Z) - Do Large Scale Molecular Language Representations Capture Important
Structural Information? [31.76876206167457]
本稿では,MoLFormerと呼ばれる効率的なトランスフォーマーエンコーダモデルのトレーニングにより得られた分子埋め込みについて述べる。
実験の結果,グラフベースおよび指紋ベースによる教師付き学習ベースラインと比較して,学習された分子表現が競合的に機能することが確認された。
論文 参考訳(メタデータ) (2021-06-17T14:33:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。