論文の概要: Why Deep Models Often cannot Beat Non-deep Counterparts on Molecular
Property Prediction?
- arxiv url: http://arxiv.org/abs/2306.17702v1
- Date: Fri, 30 Jun 2023 14:29:06 GMT
- ステータス: 処理完了
- システム内更新日: 2023-07-03 12:07:55.320083
- Title: Why Deep Models Often cannot Beat Non-deep Counterparts on Molecular
Property Prediction?
- Title(参考訳): なぜ深層モデルが分子特性予測の非深層モデルに勝てないのか?
- Authors: Jun Xia, Lecheng Zhang, Xiao Zhu, Stan Z.Li
- Abstract要約: 14分子データセット上で12の代表的なモデルをベンチマークする。
ディープモデルは一般にディープでないモデルよりも優れている。
分子指紋を入力として使用するツリーモデルは、他の競合製品よりもパフォーマンスが良い傾向にある。
- 参考スコア(独自算出の注目度): 32.720498229813025
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Molecular property prediction (MPP) is a crucial task in the drug discovery
pipeline, which has recently gained considerable attention thanks to advances
in deep neural networks. However, recent research has revealed that deep models
struggle to beat traditional non-deep ones on MPP. In this study, we benchmark
12 representative models (3 non-deep models and 9 deep models) on 14 molecule
datasets. Through the most comprehensive study to date, we make the following
key observations: \textbf{(\romannumeral 1)} Deep models are generally unable
to outperform non-deep ones; \textbf{(\romannumeral 2)} The failure of deep
models on MPP cannot be solely attributed to the small size of molecular
datasets. What matters is the irregular molecule data pattern;
\textbf{(\romannumeral 3)} In particular, tree models using molecular
fingerprints as inputs tend to perform better than other competitors.
Furthermore, we conduct extensive empirical investigations into the unique
patterns of molecule data and inductive biases of various models underlying
these phenomena.
- Abstract(参考訳): 分子特性予測(mpp)は薬物発見パイプラインにおいて重要なタスクであり、深層ニューラルネットワークの進歩により最近かなりの注目を集めている。
しかし最近の研究では、ディープモデルが従来の非ディープモデルにMPPで打ち勝つのに苦労していることが明らかになっている。
本研究では14分子データセット上で12種類の代表モデル(非ディープモデル3とディープモデル9)をベンチマークした。
これまでの最も包括的な研究を通じて、以下の重要な観察を行う: \textbf{(\romannumeral 1)} 深層モデルは一般に非深層モデルよりも優れていない; \textbf{(\romannumeral 2)} mppにおける深層モデルの失敗は、分子データセットの小さなサイズだけでは説明できない。
特に\textbf{(\romannumeral 3)} では、入力として分子指紋を使用するツリーモデルが、他の競合製品よりも優れたパフォーマンスを示す傾向がある。
さらに,これらの現象の根底にある分子データの特異なパターンと様々なモデルの帰納的バイアスについて,広範な経験的考察を行う。
関連論文リスト
- Integrating Chemical Language and Molecular Graph in Multimodal Fused Deep Learning for Drug Property Prediction [9.388979080270103]
分子表現の異なる多モード深層学習モデルを構築した。
モノモーダルモデルと比較すると,マルチモーダルフューズドディープラーニング(MMFDL)モデルは単一モデルよりも精度,信頼性,耐雑音性に優れている。
論文 参考訳(メタデータ) (2023-12-29T07:19:42Z) - Bi-level Contrastive Learning for Knowledge-Enhanced Molecule
Representations [55.42602325017405]
本稿では,分子の2レベル構造を考慮した新しいGODE法を提案する。
異なるグラフ構造上で2つのグラフニューラルネットワーク(GNN)を事前訓練し、対照的な学習と組み合わせることで、GODEは分子構造を対応する知識グラフサブ構造と融合させる。
11の化学特性タスクを微調整した場合、我々のモデルは既存のベンチマークよりも優れており、分類タスクの平均ROC-AUCアップリフトは13.8%、回帰タスクの平均RMSE/MAEエンハンスメントは35.1%である。
論文 参考訳(メタデータ) (2023-06-02T15:49:45Z) - MolCPT: Molecule Continuous Prompt Tuning to Generalize Molecular
Representation Learning [77.31492888819935]
分子表現学習のための「プリトレイン,プロンプト,ファインチューン」という新しいパラダイム,分子連続プロンプトチューニング(MolCPT)を提案する。
MolCPTは、事前訓練されたモデルを使用して、スタンドアロンの入力を表現的なプロンプトに投影するモチーフプロンプト関数を定義する。
いくつかのベンチマークデータセットの実験により、MollCPTは分子特性予測のために学習済みのGNNを効率的に一般化することが示された。
論文 参考訳(メタデータ) (2022-12-20T19:32:30Z) - Supervised Pretraining for Molecular Force Fields and Properties
Prediction [16.86839767858162]
本研究では, 原子電荷と3次元ジオメトリーを入力とし, 分子エネルギーをラベルとする8800万分子のデータセット上で, ニューラルネットワークを事前学習することを提案する。
実験により、スクラッチからのトレーニングと比較して、事前訓練されたモデルを微調整すると、7つの分子特性予測タスクと2つの力場タスクのパフォーマンスが大幅に向上することが示された。
論文 参考訳(メタデータ) (2022-11-23T08:36:50Z) - A Molecular Multimodal Foundation Model Associating Molecule Graphs with
Natural Language [63.60376252491507]
本稿では,分子グラフとその意味的関連テキストデータから事前学習した分子マルチモーダル基礎モデルを提案する。
我々のモデルは、生物学、化学、材料、環境、医学などの分野において、AIを動力とする分野に幅広い影響を与えるだろうと考えています。
論文 参考訳(メタデータ) (2022-09-12T00:56:57Z) - 3D Graph Contrastive Learning for Molecular Property Prediction [1.0152838128195467]
自己教師付き学習(英: Self-supervised learning, SSL)は、データ固有の監督を利用してデータ表現を学習する手法である。
分子特性予測のための新しいコントラスト学習フレームワーク,小型3次元グラフコントラスト学習(3DGCL)を提案する。
論文 参考訳(メタデータ) (2022-05-31T04:45:31Z) - Learn molecular representations from large-scale unlabeled molecules for
drug discovery [19.222413268610808]
分子プレトレーニンググラフベースのディープラーニングフレームワークmpgは、大規模なラベルなし分子から分子表現を頼りにする。
molgnetは、解釈可能な表現を生み出すために貴重な化学的洞察を捉えることができる。
MPGは、薬物発見パイプラインにおける新しいアプローチになることを約束している。
論文 参考訳(メタデータ) (2020-12-21T08:21:49Z) - Learning Latent Space Energy-Based Prior Model for Molecule Generation [59.875533935578375]
分子モデリングのためのSMILES表現を用いた潜時空間エネルギーに基づく先行モデルについて学習する。
本手法は,最先端モデルと競合する妥当性と特異性を持つ分子を生成することができる。
論文 参考訳(メタデータ) (2020-10-19T09:34:20Z) - Self-Supervised Graph Transformer on Large-Scale Molecular Data [73.3448373618865]
分子表現学習のための新しいフレームワークGROVERを提案する。
GROVERは、分子の豊富な構造的および意味的な情報を、巨大な未標識分子データから学習することができる。
分子表現学習において、最大のGNNであり、最大のトレーニングデータセットである、1000万個の未標識分子に1億のパラメータを持つGROVERを事前訓練します。
論文 参考訳(メタデータ) (2020-06-18T08:37:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。