論文の概要: Learning Over Molecular Conformer Ensembles: Datasets and Benchmarks
- arxiv url: http://arxiv.org/abs/2310.00115v1
- Date: Fri, 29 Sep 2023 20:06:46 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-05 06:32:12.304119
- Title: Learning Over Molecular Conformer Ensembles: Datasets and Benchmarks
- Title(参考訳): 分子コンフォーマアンサンブルによる学習:データセットとベンチマーク
- Authors: Yanqiao Zhu, Jeehyun Hwang, Keir Adams, Zhen Liu, Bozhao Nan, Brock
Stenfors, Yuanqi Du, Jatin Chauhan, Olaf Wiest, Olexandr Isayev, Connor W.
Coley, Yizhou Sun, Wei Wang
- Abstract要約: コンフォーマーアンサンブルを用いた学習の可能性を徹底的に評価するための,最初のMoleculAR Conformer Ensemble Learningベンチマークを導入する。
その結果,コンバータ空間からの直接学習は,様々なタスクやモデルの性能を向上させることができることがわかった。
- 参考スコア(独自算出の注目度): 45.9401235464876
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Molecular Representation Learning (MRL) has proven impactful in numerous
biochemical applications such as drug discovery and enzyme design. While Graph
Neural Networks (GNNs) are effective at learning molecular representations from
a 2D molecular graph or a single 3D structure, existing works often overlook
the flexible nature of molecules, which continuously interconvert across
conformations via chemical bond rotations and minor vibrational perturbations.
To better account for molecular flexibility, some recent works formulate MRL as
an ensemble learning problem, focusing on explicitly learning from a set of
conformer structures. However, most of these studies have limited datasets,
tasks, and models. In this work, we introduce the first MoleculAR Conformer
Ensemble Learning (MARCEL) benchmark to thoroughly evaluate the potential of
learning on conformer ensembles and suggest promising research directions.
MARCEL includes four datasets covering diverse molecule- and reaction-level
properties of chemically diverse molecules including organocatalysts and
transition-metal catalysts, extending beyond the scope of common GNN benchmarks
that are confined to drug-like molecules. In addition, we conduct a
comprehensive empirical study, which benchmarks representative 1D, 2D, and 3D
molecular representation learning models, along with two strategies that
explicitly incorporate conformer ensembles into 3D MRL models. Our findings
reveal that direct learning from an accessible conformer space can improve
performance on a variety of tasks and models.
- Abstract(参考訳): 分子表現学習(MRL)は、薬物発見や酵素設計などの多くの生化学的応用に影響を与えている。
グラフニューラルネットワーク(GNN)は、2次元の分子グラフや1つの3次元構造から分子表現を学ぶのに効果的であるが、既存の研究はしばしば分子の柔軟な性質を見落としている。
分子の柔軟性をよりよく考慮するため、最近の研究でmrlをアンサンブル学習問題として定式化し、コンフォーマー構造から明示的に学習することに焦点を当てている。
しかし、これらの研究のほとんどは限られたデータセット、タスク、モデルを持っている。
本研究では,コンフォーマー・アンサンブル・ラーニング(MARCEL)ベンチマークを初めて導入し,コンフォーマー・アンサンブルで学習する可能性を徹底的に評価し,有望な研究方向性を提案する。
マルセルは、有機触媒や遷移金属触媒を含む化学的に多様な分子の多様な分子および反応レベルの特性をカバーする4つのデータセットを含んでいる。
さらに,1次元,2次元,3次元の分子表現学習モデルをベンチマークし,コンフォーマアンサンブルを3次元MRLモデルに明示的に組み込む2つの戦略を総合的な実証研究として実施する。
その結果,コンバータ空間から直接学習することで,様々なタスクやモデルの性能向上が期待できることがわかった。
関連論文リスト
- FARM: Functional Group-Aware Representations for Small Molecules [55.281754551202326]
小型分子のための機能的グループ認識表現(FARM)について紹介する。
FARMはSMILES、自然言語、分子グラフのギャップを埋めるために設計された基礎モデルである。
MoleculeNetデータセット上でFARMを厳格に評価し、12タスク中10タスクで最先端のパフォーマンスを実現しています。
論文 参考訳(メタデータ) (2024-10-02T23:04:58Z) - UniIF: Unified Molecule Inverse Folding [67.60267592514381]
全分子の逆折り畳みのための統一モデルUniIFを提案する。
提案手法は,全タスクにおける最先端手法を超越した手法である。
論文 参考訳(メタデータ) (2024-05-29T10:26:16Z) - MolTC: Towards Molecular Relational Modeling In Language Models [28.960416816491392]
分子間相互作用予測のための新しい枠組みとして,分子間相互作用予測法(分子間相互作用予測法)を提案する。
我々の実験は4000,000以上の分子対を含む様々なデータセットで実施され、現在のGNNおよびLLMベースラインよりも優れていることを示した。
論文 参考訳(メタデータ) (2024-02-06T07:51:56Z) - MultiModal-Learning for Predicting Molecular Properties: A Framework Based on Image and Graph Structures [2.5563339057415218]
MolIGは、画像とグラフ構造に基づいて分子特性を予測するための、新しいMultiModaL分子事前学習フレームワークである。
両者の分子表現の強さを融合させる。
ベンチマークグループ内の分子特性予測に関連する下流タスクでは、パフォーマンスが向上する。
論文 参考訳(メタデータ) (2023-11-28T10:28:35Z) - Bi-level Contrastive Learning for Knowledge-Enhanced Molecule
Representations [55.42602325017405]
本稿では,分子の2レベル構造を考慮した新しいGODE法を提案する。
異なるグラフ構造上で2つのグラフニューラルネットワーク(GNN)を事前訓練し、対照的な学習と組み合わせることで、GODEは分子構造を対応する知識グラフサブ構造と融合させる。
11の化学特性タスクを微調整した場合、我々のモデルは既存のベンチマークよりも優れており、分類タスクの平均ROC-AUCアップリフトは13.8%、回帰タスクの平均RMSE/MAEエンハンスメントは35.1%である。
論文 参考訳(メタデータ) (2023-06-02T15:49:45Z) - Improving Molecular Pretraining with Complementary Featurizations [20.86159731100242]
分子プレトレーニング(英: molecular pretraining)は、計算化学と薬物発見における様々な課題を解決するためのパラダイムである。
化学情報を異なる方法で伝達できることが示される。
我々は, 簡易で効果的な分子事前学習フレームワーク(MOCO)を提案する。
論文 参考訳(メタデータ) (2022-09-29T21:11:09Z) - A Molecular Multimodal Foundation Model Associating Molecule Graphs with
Natural Language [63.60376252491507]
本稿では,分子グラフとその意味的関連テキストデータから事前学習した分子マルチモーダル基礎モデルを提案する。
我々のモデルは、生物学、化学、材料、環境、医学などの分野において、AIを動力とする分野に幅広い影響を与えるだろうと考えています。
論文 参考訳(メタデータ) (2022-09-12T00:56:57Z) - Graph-based Molecular Representation Learning [59.06193431883431]
分子表現学習(MRL)は、機械学習と化学科学を結びつけるための重要なステップである。
近年、MRLは、特に深層分子グラフ学習に基づく手法において、かなりの進歩を遂げている。
論文 参考訳(メタデータ) (2022-07-08T17:43:20Z) - Improving Molecular Contrastive Learning via Faulty Negative Mitigation
and Decomposed Fragment Contrast [17.142976840521264]
グラフニューラルネットワーク(GNN)を用いた表現の分子コントラスト学習の改善のためのiMolCLRを提案する。
実験の結果,提案手法はGNNモデルの性能を著しく向上させることがわかった。
iMolCLRは本質的に分子の類似性を推論できる足場や官能基を埋め込む。
論文 参考訳(メタデータ) (2022-02-18T18:33:27Z) - ChemRL-GEM: Geometry Enhanced Molecular Representation Learning for
Property Prediction [25.49976851499949]
化学表現学習のための新しい幾何強化分子表現学習法(GEM)を提案する。
まず、分子内の原子、結合、結合角を同時にモデル化する幾何学に基づくGNNアーキテクチャを設計する。
考案されたGNNアーキテクチャの上に,空間知識を学習するための幾何レベルの自己教師型学習戦略を提案する。
論文 参考訳(メタデータ) (2021-06-11T02:35:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。