論文の概要: Extracting Molecular Properties from Natural Language with Multimodal
Contrastive Learning
- arxiv url: http://arxiv.org/abs/2307.12996v1
- Date: Sat, 22 Jul 2023 10:32:58 GMT
- ステータス: 処理完了
- システム内更新日: 2023-07-26 19:32:16.063515
- Title: Extracting Molecular Properties from Natural Language with Multimodal
Contrastive Learning
- Title(参考訳): マルチモーダルコントラスト学習による自然言語からの分子特性抽出
- Authors: Romain Lacombe, Andrew Gaut, Jeff He, David L\"udeke, Kateryna
Pistunova
- Abstract要約: 本研究では,分子特性情報を自然言語からグラフ表現へ伝達する方法について検討する。
我々は, テキスト検索を改善するために, ニューラル関連評価戦略を実装し, 化学的に有意な分子グラフ増強戦略を導入する。
グラフモダリティだけで事前学習されたモデルに対するAUROCの利得は+4.26%、最近提案された分子グラフ/テキストの対照的に訓練されたMoMuモデルに比べて+1.54%向上する。
- 参考スコア(独自算出の注目度): 1.3717673827807508
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Deep learning in computational biochemistry has traditionally focused on
molecular graphs neural representations; however, recent advances in language
models highlight how much scientific knowledge is encoded in text. To bridge
these two modalities, we investigate how molecular property information can be
transferred from natural language to graph representations. We study property
prediction performance gains after using contrastive learning to align neural
graph representations with representations of textual descriptions of their
characteristics. We implement neural relevance scoring strategies to improve
text retrieval, introduce a novel chemically-valid molecular graph augmentation
strategy inspired by organic reactions, and demonstrate improved performance on
downstream MoleculeNet property classification tasks. We achieve a +4.26% AUROC
gain versus models pre-trained on the graph modality alone, and a +1.54% gain
compared to recently proposed molecular graph/text contrastively trained MoMu
model (Su et al. 2022).
- Abstract(参考訳): 計算生物化学における深層学習は伝統的に分子グラフに焦点をあててきたが、言語モデルにおける最近の進歩は、どの程度の科学的知識がテキストにエンコードされているかを強調している。
これら2つのモダリティを橋渡しするために,分子特性情報を自然言語からグラフ表現へどのように伝達するかを検討する。
コントラスト学習による特性予測性能向上について検討し,その特徴のテキスト記述の表現とニューラルグラフ表現の整合性を検討した。
我々は,テキスト検索の改善を目的としたニューラルネットワーク評価戦略を実装し,有機反応にインスパイアされた新規な分子グラフ増強戦略を導入し,下流のMoneculeNet特性分類タスクの性能向上を実証した。
グラフモダリティだけで事前学習したモデルに対するAUROCの利得は+4.26%、最近提案された分子グラフ/テキストが対照的に訓練したMoMuモデルに比べて+1.54%向上した(Su et al. 2022)。
関連論文リスト
- Knowledge-aware contrastive heterogeneous molecular graph learning [77.94721384862699]
分子グラフを不均一な分子グラフ学習(KCHML)に符号化するパラダイムシフトを提案する。
KCHMLは、不均一な分子グラフと二重メッセージパッシング機構によって強化された3つの異なるグラフビュー-分子、元素、薬理学-を通して分子を概念化する。
この設計は、プロパティ予測やドラッグ・ドラッグ・インタラクション(DDI)予測などの下流タスクに対する包括的な表現を提供する。
論文 参考訳(メタデータ) (2025-02-17T11:53:58Z) - Pre-trained Molecular Language Models with Random Functional Group Masking [54.900360309677794]
SMILESをベースとしたアンダーリネム分子アンダーリネム言語アンダーリネムモデルを提案し,特定の分子原子に対応するSMILESサブシーケンスをランダムにマスキングする。
この技術は、モデルに分子構造や特性をよりよく推測させ、予測能力を高めることを目的としている。
論文 参考訳(メタデータ) (2024-11-03T01:56:15Z) - Bi-level Contrastive Learning for Knowledge-Enhanced Molecule Representations [68.32093648671496]
分子に固有の二重レベル構造を考慮に入れたGODEを導入する。
分子は固有のグラフ構造を持ち、より広い分子知識グラフ内のノードとして機能する。
異なるグラフ構造上の2つのGNNを事前学習することにより、GODEは対応する知識グラフサブ構造と分子構造を効果的に融合させる。
論文 参考訳(メタデータ) (2023-06-02T15:49:45Z) - Enhancing Model Learning and Interpretation Using Multiple Molecular
Graph Representations for Compound Property and Activity Prediction [0.0]
本研究では,高次情報を含む複数の分子グラフ表現を導入する。
モデル学習と多様な視点からの解釈に対するそれらの効果について研究する。
その結果, 原子グラフ表現と分子グラフ表現の低減を組み合わせれば, 有望なモデル性能が得られることがわかった。
論文 参考訳(メタデータ) (2023-04-13T04:20:30Z) - A Molecular Multimodal Foundation Model Associating Molecule Graphs with
Natural Language [63.60376252491507]
本稿では,分子グラフとその意味的関連テキストデータから事前学習した分子マルチモーダル基礎モデルを提案する。
我々のモデルは、生物学、化学、材料、環境、医学などの分野において、AIを動力とする分野に幅広い影響を与えるだろうと考えています。
論文 参考訳(メタデータ) (2022-09-12T00:56:57Z) - Graph neural networks for the prediction of molecular structure-property
relationships [59.11160990637615]
グラフニューラルネットワーク(GNN)は、分子グラフ上で直接動作する新しい機械学習手法である。
GNNは、エンドツーエンドでプロパティを学習できるため、情報記述子の必要性を回避することができる。
本稿では、分子特性予測のための2つの例を通して、GNNの基礎を説明し、GNNの応用を実証する。
論文 参考訳(メタデータ) (2022-07-25T11:30:44Z) - Attention-wise masked graph contrastive learning for predicting
molecular property [15.387677968070912]
大規模無ラベル分子のための自己教師付き表現学習フレームワークを提案する。
我々は,注目グラフマスクと呼ばれる新しい分子グラフ拡張戦略を開発した。
我々のモデルは重要な分子構造と高次意味情報を捉えることができる。
論文 参考訳(メタデータ) (2022-05-02T00:28:02Z) - Learning Attributed Graph Representations with Communicative Message
Passing Transformer [3.812358821429274]
分子グラフ表現を改善するために,コミュニケーティブメッセージパッシングトランス (CoMPT) ニューラルネットワークを提案する。
分子を完全連結グラフとして扱う従来のトランスフォーマースタイルのGNNとは異なり、グラフ接続帰納バイアスを利用するメッセージ拡散機構を導入する。
論文 参考訳(メタデータ) (2021-07-19T11:58:32Z) - Reinforced Molecular Optimization with Neighborhood-Controlled Grammars [63.84003497770347]
分子最適化のためのグラフ畳み込みポリシネットワークであるMNCE-RLを提案する。
我々は、元の近傍制御された埋め込み文法を拡張して、分子グラフ生成に適用する。
提案手法は, 分子最適化タスクの多種多様さにおいて, 最先端性能を実現する。
論文 参考訳(メタデータ) (2020-11-14T05:42:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。