論文の概要: Predicting Drug Solubility Using Different Machine Learning Methods --
Linear Regression Model with Extracted Chemical Features vs Graph
Convolutional Neural Network
- arxiv url: http://arxiv.org/abs/2308.12325v2
- Date: Fri, 5 Jan 2024 01:28:36 GMT
- ステータス: 処理完了
- システム内更新日: 2024-01-08 18:17:40.495902
- Title: Predicting Drug Solubility Using Different Machine Learning Methods --
Linear Regression Model with Extracted Chemical Features vs Graph
Convolutional Neural Network
- Title(参考訳): 異なる機械学習手法による薬物溶解度予測 -抽出化学特性とグラフ畳み込みニューラルネットワークを用いた回帰モデル-
- Authors: John Ho, Zhao-Heng Yin, Colin Zhang, Nicole Guo, Yang Ha
- Abstract要約: 我々は、線形回帰モデルとグラフ畳み込みニューラルネットワーク(GCNN)モデルという2つの機械学習モデルを用いて、様々な実験データセットを用いた。
現在のGCNNモデルは解釈可能性に制限があるが、線形回帰モデルは、基礎となる要因の詳細な分析を可能にする。
化学の観点からは, 線形回帰モデルを用いて, 個々の原子種と官能基が全体の溶解度に及ぼす影響を解明した。
- 参考スコア(独自算出の注目度): 1.8936798735951967
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Predicting the solubility of given molecules remains crucial in the
pharmaceutical industry. In this study, we revisited this extensively studied
topic, leveraging the capabilities of contemporary computing resources. We
employed two machine learning models: a linear regression model and a graph
convolutional neural network (GCNN) model, using various experimental datasets.
Both methods yielded reasonable predictions, with the GCNN model exhibiting the
highest level of performance. However, the present GCNN model has limited
interpretability while the linear regression model allows scientists for a
greater in-depth analysis of the underlying factors through feature importance
analysis, although more human inputs and evaluations on the overall dataset is
required. From the perspective of chemistry, using the linear regression model,
we elucidated the impact of individual atom species and functional groups on
overall solubility, highlighting the significance of comprehending how chemical
structure influences chemical properties in the drug development process. It is
learned that introducing oxygen atoms can increase the solubility of organic
molecules, while almost all other hetero atoms except oxygen and nitrogen tend
to decrease solubility.
- Abstract(参考訳): 特定の分子の溶解度を予測することは、製薬業界では依然として重要である。
本研究では,現代コンピューティング資源の能力を活用して,この幅広い研究課題を再考する。
様々な実験データセットを用いて,線形回帰モデルとグラフ畳み込みニューラルネットワーク(gcnn)モデルという2つの機械学習モデルを用いた。
どちらの手法も合理的な予測が得られ、GCNNモデルは最高の性能を示した。
しかし,現在のGCNNモデルでは解釈可能性に制限がある一方で,線形回帰モデルでは特徴重要度分析による基礎因子の詳細な分析が可能であるが,データセット全体のインプットや評価がさらに必要である。
化学の立場から, 線形回帰モデルを用いて, 個々の原子種と官能基が全体の溶解度に与える影響を解明し, 化学構造が医薬品開発過程の化学的性質に与える影響を理解することの重要性を強調した。
酸素原子の導入は有機分子の溶解度を増大させるが、酸素や窒素以外のほとんどのヘテロ原子は溶解度を低下させる傾向にある。
関連論文リスト
- Bi-level Contrastive Learning for Knowledge-Enhanced Molecule
Representations [55.42602325017405]
本稿では,分子の2レベル構造を考慮した新しいGODE法を提案する。
異なるグラフ構造上で2つのグラフニューラルネットワーク(GNN)を事前訓練し、対照的な学習と組み合わせることで、GODEは分子構造を対応する知識グラフサブ構造と融合させる。
11の化学特性タスクを微調整した場合、我々のモデルは既存のベンチマークよりも優れており、分類タスクの平均ROC-AUCアップリフトは13.8%、回帰タスクの平均RMSE/MAEエンハンスメントは35.1%である。
論文 参考訳(メタデータ) (2023-06-02T15:49:45Z) - Atomic and Subgraph-aware Bilateral Aggregation for Molecular
Representation Learning [57.670845619155195]
我々は、原子とサブグラフを意識したバイラテラルアグリゲーション(ASBA)と呼ばれる分子表現学習の新しいモデルを導入する。
ASBAは、両方の種類の情報を統合することで、以前の原子単位とサブグラフ単位のモデルの限界に対処する。
本手法は,分子特性予測のための表現をより包括的に学習する方法を提供する。
論文 参考訳(メタデータ) (2023-05-22T00:56:00Z) - Graph neural networks for the prediction of molecular structure-property
relationships [59.11160990637615]
グラフニューラルネットワーク(GNN)は、分子グラフ上で直接動作する新しい機械学習手法である。
GNNは、エンドツーエンドでプロパティを学習できるため、情報記述子の必要性を回避することができる。
本稿では、分子特性予測のための2つの例を通して、GNNの基礎を説明し、GNNの応用を実証する。
論文 参考訳(メタデータ) (2022-07-25T11:30:44Z) - Rxn Hypergraph: a Hypergraph Attention Model for Chemical Reaction
Representation [70.97737157902947]
現在、化学反応を強固に表現するための普遍的で広く採用されている方法は存在しない。
ここでは、グラフに基づく分子構造の表現を利用して、ハイパーグラフアテンションニューラルネットワークアプローチを開発し、テストする。
我々はこのハイパーグラフ表現を3つの独立な化学反応データセットを用いて3つの実験で評価した。
論文 参考訳(メタデータ) (2022-01-02T12:33:10Z) - Size doesn't matter: predicting physico- or biochemical properties based
on dozens of molecules [0.0]
本論文は,データ不足を伴う対象特性のモデルの性能を著しく改善したことを示す。
また,データセット構成がモデル品質および結果モデルの適用性領域に及ぼす影響についても検討した。
論文 参考訳(メタデータ) (2021-07-22T18:57:24Z) - Machine Learning Implicit Solvation for Molecular Dynamics [0.0]
平均力の暗黙の溶媒ポテンシャルをモデル化するために,グラフニューラルネットワークであるボルネットを導入した。
この手法の成功は、溶媒効果の正確なモデリングに機械学習手法を適用することの潜在的利点を示すものである。
論文 参考訳(メタデータ) (2021-06-14T15:21:45Z) - Predicting Aqueous Solubility of Organic Molecules Using Deep Learning
Models with Varied Molecular Representations [3.10678679607547]
本研究の目的は、幅広い有機分子の溶解度を予測できる一般モデルを開発することである。
現在利用可能な最大の溶解度データセットを用いて、分子構造から溶解度を予測するディープラーニングモデルを構築した。
分子ディスクリプタを用いたモデルでは,GNNモデルでも優れた性能が得られた。
論文 参考訳(メタデータ) (2021-05-26T15:54:54Z) - Accurate Prediction of Free Solvation Energy of Organic Molecules via
Graph Attention Network and Message Passing Neural Network from Pairwise
Atomistic Interactions [14.87390785780636]
本稿では,グラフニューラルネットワーク(gnn)アーキテクチャに基づく自由解法エネルギー予測問題に対する2つの新しいモデルを提案する。
gnnは分子の予測情報をグラフ構造から直接低次元の特徴として要約することができる。
提案手法は, 解解自由エネルギー予測のタスクにおいて, 既存の機械学習手法に加えて, 量子力学および分子動力学の手法を上回っていることを示す。
論文 参考訳(メタデータ) (2021-04-15T22:15:18Z) - Graph Neural Networks for the Prediction of Substrate-Specific Organic
Reaction Conditions [79.45090959869124]
有機化学反応をモデル化するために,グラフニューラルネットワーク(GNN)を用いた系統的研究を行った。
実験試薬と条件の識別に関わる分類タスクに対して、7つの異なるGNNアーキテクチャを評価した。
論文 参考訳(メタデータ) (2020-07-08T17:21:00Z) - ASGN: An Active Semi-supervised Graph Neural Network for Molecular
Property Prediction [61.33144688400446]
本稿では,ラベル付き分子とラベルなし分子の両方を組み込んだ,アクティブ半教師付きグラフニューラルネットワーク(ASGN)を提案する。
教師モデルでは,分子構造や分子分布から情報を共同で活用する汎用表現を学習するための,新しい半教師付き学習手法を提案する。
最後に,分子多様性の観点から,フレームワーク学習全体を通して情報的データを選択するための新しい能動的学習戦略を提案する。
論文 参考訳(メタデータ) (2020-07-07T04:22:39Z) - MLSolv-A: A Novel Machine Learning-Based Prediction of Solvation Free
Energies from Pairwise Atomistic Interactions [0.0]
MLに基づく新しい解法モデルを導入し, 対の原子間相互作用から解エネルギーを計算する。
6,493実験の結果, トレーニングデータの拡大に際し, 優れた性能と伝達性を実現した。
論文 参考訳(メタデータ) (2020-05-13T06:53:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。