論文の概要: Contextual Molecule Representation Learning from Chemical Reaction
Knowledge
- arxiv url: http://arxiv.org/abs/2402.13779v1
- Date: Wed, 21 Feb 2024 12:58:40 GMT
- ステータス: 処理完了
- システム内更新日: 2024-02-22 15:17:41.135493
- Title: Contextual Molecule Representation Learning from Chemical Reaction
Knowledge
- Title(参考訳): 化学反応知識を用いた文脈分子表現学習
- Authors: Han Tang, Shikun Feng, Bicheng Lin, Yuyan Ni, JIngjing Liu, Wei-Ying
Ma, Yanyan Lan
- Abstract要約: 本稿では,共通化学における原子結合規則をうまく利用した自己教師型学習フレームワークREMOを紹介する。
REMOは、文献における170万の既知の化学反応に関するグラフ/トランスフォーマーエンコーダを事前訓練する。
- 参考スコア(独自算出の注目度): 24.501564702095937
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In recent years, self-supervised learning has emerged as a powerful tool to
harness abundant unlabelled data for representation learning and has been
broadly adopted in diverse areas. However, when applied to molecular
representation learning (MRL), prevailing techniques such as masked sub-unit
reconstruction often fall short, due to the high degree of freedom in the
possible combinations of atoms within molecules, which brings insurmountable
complexity to the masking-reconstruction paradigm. To tackle this challenge, we
introduce REMO, a self-supervised learning framework that takes advantage of
well-defined atom-combination rules in common chemistry. Specifically, REMO
pre-trains graph/Transformer encoders on 1.7 million known chemical reactions
in the literature. We propose two pre-training objectives: Masked Reaction
Centre Reconstruction (MRCR) and Reaction Centre Identification (RCI). REMO
offers a novel solution to MRL by exploiting the underlying shared patterns in
chemical reactions as \textit{context} for pre-training, which effectively
infers meaningful representations of common chemistry knowledge. Such
contextual representations can then be utilized to support diverse downstream
molecular tasks with minimum finetuning, such as affinity prediction and
drug-drug interaction prediction. Extensive experimental results on
MoleculeACE, ACNet, drug-drug interaction (DDI), and reaction type
classification show that across all tested downstream tasks, REMO outperforms
the standard baseline of single-molecule masked modeling used in current MRL.
Remarkably, REMO is the pioneering deep learning model surpassing
fingerprint-based methods in activity cliff benchmarks.
- Abstract(参考訳): 近年、自己教師あり学習は、豊富なラベルのないデータを表現学習に活用する強力なツールとして登場し、様々な分野で広く採用されている。
しかしながら、分子表象学習(mrl)に適用すると、マスキング・リコンストラクションパラダイムにおいて、分子内の原子の組合せの可能性の高い自由度のため、マスキングサブユニット再構成のような一般的な手法が不足することが多い。
この課題に取り組むために,我々は共通化学における原子結合規則をうまく活用した自己教師付き学習フレームワークremoを紹介する。
特に、remoは170万の既知の化学反応でグラフ/トランスフォーマーエンコーダを事前訓練している。
本研究では,MRCR (Masked Reaction Centre Reconstruction) とRCI (Reaction Centre Identification) の2つの事前学習目標を提案する。
REMOは、化学反応における基礎となる共有パターンを事前学習の「textit{context}」として活用することで、MRLに新しい解決策を提供する。
このような文脈表現は、アフィニティ予測や薬物と薬物の相互作用予測など、最小限の微調整で下流分子タスクをサポートするために利用できる。
分子ACE, ACNet, 薬物と薬物の相互作用 (DDI) および反応型分類の広範囲にわたる実験結果から, REMOは現在のMRLで用いられる単一分子マスマスキングの標準基準よりも優れていることが示された。
驚くべきことに、remoはアクティビティクリフベンチマークで指紋ベースの方法を上回る、先駆的なディープラーニングモデルである。
関連論文リスト
- Text-Augmented Multimodal LLMs for Chemical Reaction Condition Recommendation [50.639325453203504]
MM-RCRは、化学反応レコメンデーション(RCR)のためのSMILES、反応グラフ、テキストコーパスから統一的な反応表現を学習するテキスト拡張マルチモーダルLLMである。
この結果から,MM-RCRは2つのオープンベンチマークデータセット上で最先端の性能を達成できることが示唆された。
論文 参考訳(メタデータ) (2024-07-21T12:27:26Z) - ReactAIvate: A Deep Learning Approach to Predicting Reaction Mechanisms and Unmasking Reactivity Hotspots [4.362338454684645]
我々は,反応ステップ分類の精度を96%とほぼ均一に達成した,解釈可能な注意に基づくGNNを開発した。
我々のモデルは、配布外クラスからでも、キー原子を十分に識別します。
この一般性は、モジュラーな方法で新しい反応型を包含することができるため、新しい分子の反応性を理解するための専門家にとって価値がある。
論文 参考訳(メタデータ) (2024-07-14T05:53:18Z) - Substrate Scope Contrastive Learning: Repurposing Human Bias to Learn
Atomic Representations [14.528429119352328]
本稿では,化学反応性に適合した原子表現を学習する,新しい事前学習戦略,基板スコープコントラスト学習を導入する。
我々は, 数千の出版物にまたがるCASコンテントコレクションにおいて, 20,798 のアリルハロゲン化物に着目し, アリルハロゲン化物反応性の表現を学習した。
この研究は、反応性に整合した原子表現を学ぶための、化学調整されたニューラルネットワーク事前学習戦略を示すだけでなく、基質スコープ設計における人間のバイアスの恩恵を受けるための、第一級のアプローチを示す。
論文 参考訳(メタデータ) (2024-02-19T02:21:20Z) - Chemist-X: Large Language Model-empowered Agent for Reaction Condition Recommendation in Chemical Synthesis [57.70772230913099]
Chemist-Xは、検索増強生成(RAG)技術を用いた化学合成において、反応条件レコメンデーション(RCR)タスクを自動化する。
Chemist-Xはオンラインの分子データベースを尋問し、最新の文献データベースから重要なデータを蒸留する。
Chemist-Xは化学者の作業量を大幅に減らし、より根本的で創造的な問題に集中できるようにする。
論文 参考訳(メタデータ) (2023-11-16T01:21:33Z) - MolCAP: Molecular Chemical reActivity pretraining and
prompted-finetuning enhanced molecular representation learning [3.179128580341411]
MolCAPは、化学反応性(IMR)知識に基づくグラフ事前学習トランスフォーマーであり、微調整を誘導する。
MolCAPによって推進され、基礎的なグラフニューラルネットワークでさえ、以前のモデルを上回る驚くべきパフォーマンスを達成することができる。
論文 参考訳(メタデータ) (2023-06-13T13:48:06Z) - From Cloze to Comprehension: Retrofitting Pre-trained Masked Language
Model to Pre-trained Machine Reader [130.45769668885487]
Pre-trained Machine Reader (PMR) は、ラベル付きデータを取得することなく、MLMを事前学習機械読解(MRC)モデルに適合させる新しい手法である。
提案したPMRを構築するために,多量の汎用および高品質なMRCスタイルのトレーニングデータを構築した。
PMRは、MRCの定式化における様々な抽出および分類タスクに対処するための統一モデルとして機能する可能性がある。
論文 参考訳(メタデータ) (2022-12-09T10:21:56Z) - Retrieval-based Controllable Molecule Generation [63.44583084888342]
制御可能な分子生成のための検索に基づく新しいフレームワークを提案する。
我々は、与えられた設計基準を満たす分子の合成に向けて、事前学習された生成モデルを操るために、分子の小さなセットを使用します。
提案手法は生成モデルの選択に非依存であり,タスク固有の微調整は不要である。
論文 参考訳(メタデータ) (2022-08-23T17:01:16Z) - Improving Molecular Contrastive Learning via Faulty Negative Mitigation
and Decomposed Fragment Contrast [17.142976840521264]
グラフニューラルネットワーク(GNN)を用いた表現の分子コントラスト学習の改善のためのiMolCLRを提案する。
実験の結果,提案手法はGNNモデルの性能を著しく向上させることがわかった。
iMolCLRは本質的に分子の類似性を推論できる足場や官能基を埋め込む。
論文 参考訳(メタデータ) (2022-02-18T18:33:27Z) - Improving Molecular Representation Learning with Metric
Learning-enhanced Optimal Transport [49.237577649802034]
分子レグレッション問題に対する一般化能力を高めるために,MROTと呼ばれる新しい最適輸送ベースアルゴリズムを開発した。
MROTは最先端のモデルよりも優れており、新しい物質の発見を加速する有望な可能性を示している。
論文 参考訳(メタデータ) (2022-02-13T04:56:18Z) - Chemical-Reaction-Aware Molecule Representation Learning [88.79052749877334]
本稿では,化学反応を用いて分子表現の学習を支援することを提案する。
本手法は,1) 埋め込み空間を適切に整理し, 2) 分子埋め込みの一般化能力を向上させるために有効であることが証明された。
実験結果から,本手法は様々なダウンストリームタスクにおける最先端性能を実現することが示された。
論文 参考訳(メタデータ) (2021-09-21T00:08:43Z) - Modern Hopfield Networks for Few- and Zero-Shot Reaction Prediction [3.885603826656419]
物理分子を実現するコンピュータ支援合成計画(CASP)はまだ初期段階にあり、大規模な分子発見を可能にする性能レベルが欠けています。
コントラスト学習により最適化された最新のHopfieldネットワーク(MHN)を用いた深層学習アーキテクチャを用いた新しい反応予測手法を提案する。
その結果,mhnのコントラスト学習アプローチは,従来の手法と対照的に,レア,シングル,さらにはトレーニング例のない反応予測に対して,少数およびゼロショットの学習を可能にすることがわかった。
論文 参考訳(メタデータ) (2021-04-07T17:35:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。