論文の概要: Bi-level Contrastive Learning for Knowledge-Enhanced Molecule Representations
- arxiv url: http://arxiv.org/abs/2306.01631v6
- Date: Sun, 16 Feb 2025 05:22:45 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-02-18 17:33:50.178724
- Title: Bi-level Contrastive Learning for Knowledge-Enhanced Molecule Representations
- Title(参考訳): 知識強化分子表現のための二段階コントラスト学習
- Authors: Pengcheng Jiang, Cao Xiao, Tianfan Fu, Parminder Bhatia, Taha Kass-Hout, Jimeng Sun, Jiawei Han,
- Abstract要約: 分子に固有の二重レベル構造を考慮に入れたGODEを導入する。
分子は固有のグラフ構造を持ち、より広い分子知識グラフ内のノードとして機能する。
異なるグラフ構造上の2つのGNNを事前学習することにより、GODEは対応する知識グラフサブ構造と分子構造を効果的に融合させる。
- 参考スコア(独自算出の注目度): 68.32093648671496
- License:
- Abstract: Molecular representation learning is vital for various downstream applications, including the analysis and prediction of molecular properties and side effects. While Graph Neural Networks (GNNs) have been a popular framework for modeling molecular data, they often struggle to capture the full complexity of molecular representations. In this paper, we introduce a novel method called GODE, which accounts for the dual-level structure inherent in molecules. Molecules possess an intrinsic graph structure and simultaneously function as nodes within a broader molecular knowledge graph. GODE integrates individual molecular graph representations with multi-domain biochemical data from knowledge graphs. By pre-training two GNNs on different graph structures and employing contrastive learning, GODE effectively fuses molecular structures with their corresponding knowledge graph substructures. This fusion yields a more robust and informative representation, enhancing molecular property predictions by leveraging both chemical and biological information. When fine-tuned across 11 chemical property tasks, our model significantly outperforms existing benchmarks, achieving an average ROC-AUC improvement of 12.7% for classification tasks and an average RMSE/MAE improvement of 34.4% for regression tasks. Notably, GODE surpasses the current leading model in property prediction, with advancements of 2.2% in classification and 7.2% in regression tasks.
- Abstract(参考訳): 分子表現学習は、分子特性や副作用の分析や予測など、下流の様々な応用に不可欠である。
グラフニューラルネットワーク(GNN)は、分子データモデリングの一般的なフレームワークであるが、しばしば分子表現の完全な複雑さを捉えるのに苦労している。
本稿では,分子に固有の二重レベル構造を考慮に入れた新しいGODE法を提案する。
分子は固有のグラフ構造を持ち、より広い分子知識グラフ内のノードとして機能する。
GODEは、個々の分子グラフ表現と知識グラフからの多領域生化学的データを統合する。
異なるグラフ構造上で2つのGNNを事前学習し、対照的な学習を行うことで、GODEは分子構造を対応する知識グラフサブ構造と効果的に融合させる。
この融合により、より堅牢で情報的な表現が得られ、化学的情報と生物学的情報の両方を活用することにより、分子特性の予測が強化される。
11の化学特性タスクを微調整した場合、我々のモデルは既存のベンチマークを著しく上回り、分類タスクの平均ROC-AUC改善は12.7%、回帰タスクの平均RMSE/MAE改善は34.4%である。
特に、GODEはプロパティ予測において現在の先行モデルを上回っており、分類の2.2%、回帰タスクの7.2%が進歩している。
関連論文リスト
- Knowledge-aware contrastive heterogeneous molecular graph learning [77.94721384862699]
分子グラフを不均一な分子グラフ学習(KCHML)に符号化するパラダイムシフトを提案する。
KCHMLは、不均一な分子グラフと二重メッセージパッシング機構によって強化された3つの異なるグラフビュー-分子、元素、薬理学-を通して分子を概念化する。
この設計は、プロパティ予測やドラッグ・ドラッグ・インタラクション(DDI)予測などの下流タスクに対する包括的な表現を提供する。
論文 参考訳(メタデータ) (2025-02-17T11:53:58Z) - MolGraph-xLSTM: A graph-based dual-level xLSTM framework with multi-head mixture-of-experts for enhanced molecular representation and interpretability [9.858315463084084]
MolGraph-xLSTMはグラフベースのxLSTMモデルであり、特徴抽出を強化し、分子の長距離相互作用を効果的にモデル化する。
我々のアプローチは分子グラフを原子レベルとモチーフレベルという2つのスケールで処理する。
MolGraph-xLSTMを10個の分子特性予測データセット上で検証し、分類と回帰の両方のタスクをカバーした。
論文 参考訳(メタデータ) (2025-01-30T15:47:59Z) - Molecular Graph Representation Learning via Structural Similarity Information [11.38130169319915]
我々は新しい分子グラフ表現学習法である textbf Structure similarity Motif GNN (MSSM-GNN) を紹介する。
特に,分子間の類似性を定量的に表現するために,グラフカーネルアルゴリズムを利用した特殊設計グラフを提案する。
我々はGNNを用いて分子グラフから特徴表現を学習し、追加の分子表現情報を組み込むことで特性予測の精度を高めることを目的としている。
論文 参考訳(メタデータ) (2024-09-13T06:59:10Z) - Molecular Property Prediction Based on Graph Structure Learning [29.516479802217205]
我々はGSL-MPPと呼ばれるグラフ構造学習(GSL)に基づくMPPアプローチを提案する。
具体的には、まず、分子グラフ上にグラフニューラルネットワーク(GNN)を適用し、分子表現を抽出する。
分子指紋を用いて分子類似性グラフ(MSG)を構築する。
論文 参考訳(メタデータ) (2023-12-28T06:45:13Z) - Extracting Molecular Properties from Natural Language with Multimodal
Contrastive Learning [1.3717673827807508]
本研究では,分子特性情報を自然言語からグラフ表現へ伝達する方法について検討する。
我々は, テキスト検索を改善するために, ニューラル関連評価戦略を実装し, 化学的に有意な分子グラフ増強戦略を導入する。
グラフモダリティだけで事前学習されたモデルに対するAUROCの利得は+4.26%、最近提案された分子グラフ/テキストの対照的に訓練されたMoMuモデルに比べて+1.54%向上する。
論文 参考訳(メタデータ) (2023-07-22T10:32:58Z) - Atomic and Subgraph-aware Bilateral Aggregation for Molecular
Representation Learning [57.670845619155195]
我々は、原子とサブグラフを意識したバイラテラルアグリゲーション(ASBA)と呼ばれる分子表現学習の新しいモデルを導入する。
ASBAは、両方の種類の情報を統合することで、以前の原子単位とサブグラフ単位のモデルの限界に対処する。
本手法は,分子特性予測のための表現をより包括的に学習する方法を提供する。
論文 参考訳(メタデータ) (2023-05-22T00:56:00Z) - Graph neural networks for the prediction of molecular structure-property
relationships [59.11160990637615]
グラフニューラルネットワーク(GNN)は、分子グラフ上で直接動作する新しい機械学習手法である。
GNNは、エンドツーエンドでプロパティを学習できるため、情報記述子の必要性を回避することができる。
本稿では、分子特性予測のための2つの例を通して、GNNの基礎を説明し、GNNの応用を実証する。
論文 参考訳(メタデータ) (2022-07-25T11:30:44Z) - ASGN: An Active Semi-supervised Graph Neural Network for Molecular
Property Prediction [61.33144688400446]
本稿では,ラベル付き分子とラベルなし分子の両方を組み込んだ,アクティブ半教師付きグラフニューラルネットワーク(ASGN)を提案する。
教師モデルでは,分子構造や分子分布から情報を共同で活用する汎用表現を学習するための,新しい半教師付き学習手法を提案する。
最後に,分子多様性の観点から,フレームワーク学習全体を通して情報的データを選択するための新しい能動的学習戦略を提案する。
論文 参考訳(メタデータ) (2020-07-07T04:22:39Z) - Self-Supervised Graph Transformer on Large-Scale Molecular Data [73.3448373618865]
分子表現学習のための新しいフレームワークGROVERを提案する。
GROVERは、分子の豊富な構造的および意味的な情報を、巨大な未標識分子データから学習することができる。
分子表現学習において、最大のGNNであり、最大のトレーニングデータセットである、1000万個の未標識分子に1億のパラメータを持つGROVERを事前訓練します。
論文 参考訳(メタデータ) (2020-06-18T08:37:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。