論文の概要: Extracting Molecular Properties from Natural Language with Multimodal
Contrastive Learning
- arxiv url: http://arxiv.org/abs/2307.12996v1
- Date: Sat, 22 Jul 2023 10:32:58 GMT
- ステータス: 処理完了
- システム内更新日: 2023-07-26 19:32:16.063515
- Title: Extracting Molecular Properties from Natural Language with Multimodal
Contrastive Learning
- Title(参考訳): マルチモーダルコントラスト学習による自然言語からの分子特性抽出
- Authors: Romain Lacombe, Andrew Gaut, Jeff He, David L\"udeke, Kateryna
Pistunova
- Abstract要約: 本研究では,分子特性情報を自然言語からグラフ表現へ伝達する方法について検討する。
我々は, テキスト検索を改善するために, ニューラル関連評価戦略を実装し, 化学的に有意な分子グラフ増強戦略を導入する。
グラフモダリティだけで事前学習されたモデルに対するAUROCの利得は+4.26%、最近提案された分子グラフ/テキストの対照的に訓練されたMoMuモデルに比べて+1.54%向上する。
- 参考スコア(独自算出の注目度): 1.3717673827807508
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Deep learning in computational biochemistry has traditionally focused on
molecular graphs neural representations; however, recent advances in language
models highlight how much scientific knowledge is encoded in text. To bridge
these two modalities, we investigate how molecular property information can be
transferred from natural language to graph representations. We study property
prediction performance gains after using contrastive learning to align neural
graph representations with representations of textual descriptions of their
characteristics. We implement neural relevance scoring strategies to improve
text retrieval, introduce a novel chemically-valid molecular graph augmentation
strategy inspired by organic reactions, and demonstrate improved performance on
downstream MoleculeNet property classification tasks. We achieve a +4.26% AUROC
gain versus models pre-trained on the graph modality alone, and a +1.54% gain
compared to recently proposed molecular graph/text contrastively trained MoMu
model (Su et al. 2022).
- Abstract(参考訳): 計算生物化学における深層学習は伝統的に分子グラフに焦点をあててきたが、言語モデルにおける最近の進歩は、どの程度の科学的知識がテキストにエンコードされているかを強調している。
これら2つのモダリティを橋渡しするために,分子特性情報を自然言語からグラフ表現へどのように伝達するかを検討する。
コントラスト学習による特性予測性能向上について検討し,その特徴のテキスト記述の表現とニューラルグラフ表現の整合性を検討した。
我々は,テキスト検索の改善を目的としたニューラルネットワーク評価戦略を実装し,有機反応にインスパイアされた新規な分子グラフ増強戦略を導入し,下流のMoneculeNet特性分類タスクの性能向上を実証した。
グラフモダリティだけで事前学習したモデルに対するAUROCの利得は+4.26%、最近提案された分子グラフ/テキストが対照的に訓練したMoMuモデルに比べて+1.54%向上した(Su et al. 2022)。
関連論文リスト
- Pre-trained Molecular Language Models with Random Functional Group Masking [54.900360309677794]
SMILESをベースとしたアンダーリネム分子アンダーリネム言語アンダーリネムモデルを提案し,特定の分子原子に対応するSMILESサブシーケンスをランダムにマスキングする。
この技術は、モデルに分子構造や特性をよりよく推測させ、予測能力を高めることを目的としている。
論文 参考訳(メタデータ) (2024-11-03T01:56:15Z) - Bi-level Contrastive Learning for Knowledge-Enhanced Molecule
Representations [55.42602325017405]
本稿では,分子の2レベル構造を考慮した新しいGODE法を提案する。
異なるグラフ構造上で2つのグラフニューラルネットワーク(GNN)を事前訓練し、対照的な学習と組み合わせることで、GODEは分子構造を対応する知識グラフサブ構造と融合させる。
11の化学特性タスクを微調整した場合、我々のモデルは既存のベンチマークよりも優れており、分類タスクの平均ROC-AUCアップリフトは13.8%、回帰タスクの平均RMSE/MAEエンハンスメントは35.1%である。
論文 参考訳(メタデータ) (2023-06-02T15:49:45Z) - Atomic and Subgraph-aware Bilateral Aggregation for Molecular
Representation Learning [57.670845619155195]
我々は、原子とサブグラフを意識したバイラテラルアグリゲーション(ASBA)と呼ばれる分子表現学習の新しいモデルを導入する。
ASBAは、両方の種類の情報を統合することで、以前の原子単位とサブグラフ単位のモデルの限界に対処する。
本手法は,分子特性予測のための表現をより包括的に学習する方法を提供する。
論文 参考訳(メタデータ) (2023-05-22T00:56:00Z) - Enhancing Model Learning and Interpretation Using Multiple Molecular
Graph Representations for Compound Property and Activity Prediction [0.0]
本研究では,高次情報を含む複数の分子グラフ表現を導入する。
モデル学習と多様な視点からの解釈に対するそれらの効果について研究する。
その結果, 原子グラフ表現と分子グラフ表現の低減を組み合わせれば, 有望なモデル性能が得られることがわかった。
論文 参考訳(メタデータ) (2023-04-13T04:20:30Z) - A Molecular Multimodal Foundation Model Associating Molecule Graphs with
Natural Language [63.60376252491507]
本稿では,分子グラフとその意味的関連テキストデータから事前学習した分子マルチモーダル基礎モデルを提案する。
我々のモデルは、生物学、化学、材料、環境、医学などの分野において、AIを動力とする分野に幅広い影響を与えるだろうと考えています。
論文 参考訳(メタデータ) (2022-09-12T00:56:57Z) - Graph neural networks for the prediction of molecular structure-property
relationships [59.11160990637615]
グラフニューラルネットワーク(GNN)は、分子グラフ上で直接動作する新しい機械学習手法である。
GNNは、エンドツーエンドでプロパティを学習できるため、情報記述子の必要性を回避することができる。
本稿では、分子特性予測のための2つの例を通して、GNNの基礎を説明し、GNNの応用を実証する。
論文 参考訳(メタデータ) (2022-07-25T11:30:44Z) - Attention-wise masked graph contrastive learning for predicting
molecular property [15.387677968070912]
大規模無ラベル分子のための自己教師付き表現学習フレームワークを提案する。
我々は,注目グラフマスクと呼ばれる新しい分子グラフ拡張戦略を開発した。
我々のモデルは重要な分子構造と高次意味情報を捉えることができる。
論文 参考訳(メタデータ) (2022-05-02T00:28:02Z) - Learning Attributed Graph Representations with Communicative Message
Passing Transformer [3.812358821429274]
分子グラフ表現を改善するために,コミュニケーティブメッセージパッシングトランス (CoMPT) ニューラルネットワークを提案する。
分子を完全連結グラフとして扱う従来のトランスフォーマースタイルのGNNとは異なり、グラフ接続帰納バイアスを利用するメッセージ拡散機構を導入する。
論文 参考訳(メタデータ) (2021-07-19T11:58:32Z) - Reinforced Molecular Optimization with Neighborhood-Controlled Grammars [63.84003497770347]
分子最適化のためのグラフ畳み込みポリシネットワークであるMNCE-RLを提案する。
我々は、元の近傍制御された埋め込み文法を拡張して、分子グラフ生成に適用する。
提案手法は, 分子最適化タスクの多種多様さにおいて, 最先端性能を実現する。
論文 参考訳(メタデータ) (2020-11-14T05:42:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。