論文の概要: Accurate, reliable and interpretable solubility prediction of druglike
molecules with attention pooling and Bayesian learning
- arxiv url: http://arxiv.org/abs/2210.07145v1
- Date: Thu, 29 Sep 2022 07:48:10 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-16 16:20:48.991845
- Title: Accurate, reliable and interpretable solubility prediction of druglike
molecules with attention pooling and Bayesian learning
- Title(参考訳): 注意プールとベイズ学習を伴う薬物様分子の正確・信頼性・解釈可能な溶解度予測
- Authors: Seongok Ryu and Sumin Lee
- Abstract要約: 可溶性のシリコ予測は, 仮想スクリーニングと鉛最適化において有用性について研究されている。
近年,物理に基づく手法は高スループットタスクには適さないため,実験データを用いた機械学習(ML)手法が普及している。
本稿では,グラフニューラルネットワーク(GNN)を自己注意型読み出し層で開発し,予測性能を向上させる。
- 参考スコア(独自算出の注目度): 1.8275108630751844
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In drug discovery, aqueous solubility is an important pharmacokinetic
property which affects absorption and assay availability of drug. Thus, in
silico prediction of solubility has been studied for its utility in virtual
screening and lead optimization. Recently, machine learning (ML) methods using
experimental data has been popular because physics-based methods like quantum
mechanics and molecular dynamics are not suitable for high-throughput tasks due
to its computational costs. However, ML method can exhibit over-fitting problem
in a data-deficient condition, and this is the case for most chemical property
datasets. In addition, ML methods are regarded as a black box function in that
it is difficult to interpret contribution of hidden features to outputs,
hindering analysis and modification of structure-activity relationship. To deal
with mentioned issues, we developed Bayesian graph neural networks (GNNs) with
the self-attention readout layer. Unlike most GNNs using self-attention in node
updates, self-attention applied at readout layer enabled a model to improve
prediction performance as well as to identify atom-wise importance, which can
help lead optimization as exemplified for three FDA-approved drugs. Also,
Bayesian inference enables us to separate more or less accurate results
according to uncertainty in solubility prediction task We expect that our
accurate, reliable and interpretable model can be used for more careful
decision-making and various applications in the development of drugs.
- Abstract(参考訳): 薬物発見において、水溶性は薬物の吸収と測定に影響を及ぼす重要な薬物動態特性である。
そこで, 仮想スクリーニングと鉛最適化において, 可溶性のシリコ予測が有用であることがわかった。
近年,量子力学や分子動力学などの物理ベースの手法は計算コストのかかる高スループットタスクには適していないため,実験データを用いた機械学習(ml)手法が普及している。
しかし、ML法はデータ不足状態において過度に適合する問題を示すことができ、ほとんどの化学特性データセットではそうである。
さらに、ML法は、隠れた特徴の出力への寄与の解釈が困難であり、解析や構造-活性関係の修正を妨げるブラックボックス関数とみなされる。
上記の問題に対処するため,我々は自己参照読み取り層を備えたベイズグラフニューラルネットワーク(gnns)を開発した。
ノード更新で自己アテンションを使用するほとんどのGNNとは異なり、リードアウト層で適用された自己アテンションは、予測性能を改善し、原子レベルでの重要性を識別するモデルを可能にした。
また、ベイズ推論により、溶解度予測タスクの不確実性に応じて、より正確に結果を分離することができ、より慎重な意思決定や薬物開発における様々な応用に、正確で信頼性の高い解釈可能なモデルが使用できると期待できる。
関連論文リスト
- YZS-model: A Predictive Model for Organic Drug Solubility Based on Graph Convolutional Networks and Transformer-Attention [9.018408514318631]
伝統的な手法は複雑な分子構造を見逃し、不正確な結果をもたらすことが多い。
本稿では,グラフ畳み込みネットワーク(GCN),トランスフォーマーアーキテクチャ,Long Short-Term Memory(LSTM)ネットワークを統合するディープラーニングフレームワークであるYZS-Modelを紹介する。
YZS-Modelは、R2$ 0.59、RMSE$ 0.57を達成し、ベンチマークモデルを上回った。
論文 参考訳(メタデータ) (2024-06-27T12:40:29Z) - Physical formula enhanced multi-task learning for pharmacokinetics prediction [54.13787789006417]
AIによる薬物発見の大きな課題は、高品質なデータの不足である。
薬物動態の4つの重要なパラメータを同時に予測するPEMAL法を開発した。
実験の結果,PEMALは一般的なグラフニューラルネットワークに比べてデータ需要を著しく低減することがわかった。
論文 参考訳(メタデータ) (2024-04-16T07:42:55Z) - Machine Learning Small Molecule Properties in Drug Discovery [44.62264781248437]
我々は, 結合親和性, 溶解性, ADMET (吸収, 分布, 代謝, 排出, 毒性) を含む幅広い特性について検討する。
化学指紋やグラフベースニューラルネットワークなど,既存の一般的な記述子や埋め込みについて論じる。
最後に、モデル予測の理解を提供する技術、特に薬物発見における重要な意思決定について評価する。
論文 参考訳(メタデータ) (2023-08-02T22:18:41Z) - On the Interplay of Subset Selection and Informed Graph Neural Networks [3.091456764812509]
この研究は、QM9データセットにおける分子の原子化エネルギーの予測に焦点を当てている。
トレーニングセット選択過程における分子多様性の最大化は,線形回帰法および非線形回帰法のロバスト性を高めることを示す。
また、モデルに依存しない説明器を用いて、グラフニューラルネットワークによる予測の信頼性を確認する。
論文 参考訳(メタデータ) (2023-06-15T09:09:27Z) - Monte Carlo Neural PDE Solver for Learning PDEs via Probabilistic Representation [59.45669299295436]
教師なしニューラルソルバのトレーニングのためのモンテカルロPDEソルバを提案する。
我々は、マクロ現象をランダム粒子のアンサンブルとみなすPDEの確率的表現を用いる。
対流拡散, アレン・カーン, ナヴィエ・ストークス方程式に関する実験により, 精度と効率が著しく向上した。
論文 参考訳(メタデータ) (2023-02-10T08:05:19Z) - Uncertainty quantification for predictions of atomistic neural networks [0.0]
本稿では、量子化学参照データに基づくトレーニングニューラルネットワーク(NN)の予測における不確かさの定量化値について検討する。
PhysNet NN のアーキテクチャを好適に修正し,キャリブレーションの定量化,予測品質,予測誤差と予測不確かさの相関性を評価した。
論文 参考訳(メタデータ) (2022-07-14T13:39:43Z) - SSM-DTA: Breaking the Barriers of Data Scarcity in Drug-Target Affinity
Prediction [127.43571146741984]
薬物標的親和性(DTA)は、早期の薬物発見において極めて重要である。
湿式実験は依然として最も信頼性の高い方法であるが、時間と資源が集中している。
既存の手法は主に、データ不足の問題に適切に対処することなく、利用可能なDTAデータに基づく技術開発に重点を置いている。
SSM-DTAフレームワークについて述べる。
論文 参考訳(メタデータ) (2022-06-20T14:53:25Z) - Extracting Chemical-Protein Interactions via Calibrated Deep Neural
Network and Self-training [0.8376091455761261]
データ不確実性を推定し、信頼性を向上させるため、ディープラーニングモデルに"校正"技術が適用されている。
本研究では, 化学物質-タンパク質相互作用を抽出するために, 不確実性情報とキャリブレーション手法を取り入れたDNNベースの手法を提案する。
我々の手法は,従来の手法よりも高い校正能力を維持しつつ,Biocreative VI ChemProtタスクに関して最先端のパフォーマンスを実現している。
論文 参考訳(メタデータ) (2020-11-04T10:14:31Z) - Optimizing Molecules using Efficient Queries from Property Evaluations [66.66290256377376]
汎用的なクエリベースの分子最適化フレームワークであるQMOを提案する。
QMOは効率的なクエリに基づいて入力分子の所望の特性を改善する。
QMOは, 有機分子を最適化するベンチマークタスクにおいて, 既存の手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2020-11-03T18:51:18Z) - Deep Learning for Virtual Screening: Five Reasons to Use ROC Cost
Functions [80.12620331438052]
深層学習は サイリコの何十億もの分子を 迅速にスクリーニングする 重要なツールとなりました
その重要性にもかかわらず、厳密なクラス不均衡、高い決定しきい値、いくつかのデータセットにおける基底真理ラベルの欠如など、これらのモデルのトレーニングにおいて重大な課題が続いている。
このような場合、クラス不均衡に対するロバスト性から、レシーバ動作特性(ROC)を直接最適化することを好んで論じる。
論文 参考訳(メタデータ) (2020-06-25T08:46:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。