論文の概要: OWPCP: A Deep Learning Model to Predict Octanol-Water Partition Coefficient
- arxiv url: http://arxiv.org/abs/2410.18118v1
- Date: Thu, 10 Oct 2024 08:14:31 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-10-27 05:11:46.917578
- Title: OWPCP: A Deep Learning Model to Predict Octanol-Water Partition Coefficient
- Title(参考訳): OWPCP:オクタノール-水分配係数を予測するディープラーニングモデル
- Authors: Mohammadjavad Maleki, Sobhan Zahiri,
- Abstract要約: 本稿では,Morgan の指紋とMACCS キーを入力として,logP を計算するためのディープラーニングモデル OWPCP を提案する。
26,254化合物から抽出したlogP値とこのような分子表現の相互結合を用いる。
その結果,OWPCPはlogPの信頼性の高い予測を提供することがわかった。
- 参考スコア(独自算出の注目度): 0.0
- License:
- Abstract: The physicochemical properties of chemical compounds have great importance in several areas, including pharmaceuticals, environmental and separation science. Among these are physicochemical properties such as the octanol-water partition coefficient, which has been considered an important index pointing out lipophilicity and hydrophilicity. It affects drug absorption and membrane permeability. Following Lipinski's rule of five, logP was identified as one of the key determinants of the stability of chemical entities and, as such, needed state-of-the-art methods for measuring lipophilicity. This paper presents a deep-learning model, OWPCP, developed to compute logP using Morgan fingerprints and MACCS keys as input features. It uses the interconnection of such molecular representations with logP values extracted from 26,254 compounds. The dataset was prepared to contain a wide range of chemical structures with differing molecular weights and polar surface area. Hyperparameter optimization was conducted using the Keras Tuner alongside the Hyperband algorithm to enhance the performance. OWPCP demonstrated outstanding performance compared to current computational methods, achieving an MAE=0.247 on the test set and outperforming all previous DL models. Remarkably, while one of the most accurate recent models is based on experimental data on retention time to make predictions, OWPCP manages computing logP efficiently without depending on these factors, being, therefore, very useful during early-stage drug discovery. Our model outperforms the best model, which leverages Retention Time, and our model does not require any experimental data. Further validation of the model performance was done across different functional groups, and it showed very high accuracy, especially for compounds that contain aliphatic OH groups. The results have indicated that OWPCP provides a reliable prediction of logP.
- Abstract(参考訳): 化学物質の物理化学的性質は、医薬品、環境科学、分離科学などいくつかの分野で非常に重要である。
このうちオクタノール-水分配係数のような物理化学的性質は、リポフィリシティと親水性を示す重要な指標と考えられている。
薬物の吸収と膜透過性に影響を及ぼす。
リピンスキーの5つの規則に従うと、logPは化学体の安定性の重要な決定要因の1つとして同定され、その結果、リポフィリシティの測定に最先端の方法が必要となった。
本稿では,Morgan の指紋とMACCS キーを入力として,logP を計算するためのディープラーニングモデル OWPCP を提案する。
26,254化合物から抽出したlogP値とこのような分子表現の相互結合を用いる。
データセットは、分子量と極表面積が異なる幅広い化学構造を含むように準備された。
ハイパパラメータ最適化は、ハイパバンドアルゴリズムと共にKeras Tunerを用いて実行され、性能が向上した。
OWPCPは、現在の計算手法と比較して優れた性能を示し、テストセット上でMAE=0.247を達成し、以前の全てのDLモデルよりも優れた性能を示した。
興味深いことに、最近の最も正確なモデルの一つは保持時間に関する実験データに基づいて予測を行うが、OWPCPはこれらの要因によらずに効率的にlogPを管理しているため、初期の薬物発見において非常に有用である。
我々のモデルは保持時間を利用する最良のモデルよりも優れており、実験データを必要としない。
モデル性能のさらなる検証は, 異なる官能基間で行われ, 特に脂肪族OH基を含む化合物に対して非常に高い精度を示した。
その結果,OWPCPはlogPの信頼性の高い予測を提供することがわかった。
関連論文リスト
- A Unified Approach to Inferring Chemical Compounds with the Desired Aqueous Solubility [5.763661159910719]
水溶性(AS)は、医薬品の発見と材料設計において重要な役割を果たす重要な物理化学的性質である。
本稿では,単純な決定論的グラフ理論記述子に基づいて,化学化合物を所望のASで予測し,推定するための新しい統一的アプローチについて報告する。
論文 参考訳(メタデータ) (2024-09-06T14:20:38Z) - Benchmark Computations of Nearly Degenerate Singlet and Triplet states of N-heterocyclic Chromophores : II. Density-based Methods [0.0]
LR-TDDFT と$Delta$SCF の両方に対して最小絶対誤差 (MAE) を持つ関数セットを提案する。
本研究は3種類のシクラジン系分子テンプレートの広範な研究に基づいている。
DFTの文脈における正確な交換、スピン汚染、スピン分極の役割は、我々の研究の最前線に来ている。
論文 参考訳(メタデータ) (2024-08-09T07:47:38Z) - YZS-model: A Predictive Model for Organic Drug Solubility Based on Graph Convolutional Networks and Transformer-Attention [9.018408514318631]
伝統的な手法は複雑な分子構造を見逃し、不正確な結果をもたらすことが多い。
本稿では,グラフ畳み込みネットワーク(GCN),トランスフォーマーアーキテクチャ,Long Short-Term Memory(LSTM)ネットワークを統合するディープラーニングフレームワークであるYZS-Modelを紹介する。
YZS-Modelは、R2$ 0.59、RMSE$ 0.57を達成し、ベンチマークモデルを上回った。
論文 参考訳(メタデータ) (2024-06-27T12:40:29Z) - Regressor-free Molecule Generation to Support Drug Response Prediction [83.25894107956735]
目標IC50スコアに基づく条件生成により、より効率的なサンプリングスペースを得ることができる。
回帰自由誘導は、拡散モデルのスコア推定と、数値ラベルに基づく回帰制御モデルの勾配を結合する。
論文 参考訳(メタデータ) (2024-05-23T13:22:17Z) - SE(3)-Invariant Multiparameter Persistent Homology for Chiral-Sensitive
Molecular Property Prediction [1.534667887016089]
多パラメータ持続ホモロジー(MPPH)を用いた新しい分子指紋生成法を提案する。
この技術は、正確な分子特性予測が不可欠である薬物発見と材料科学において、かなりの重要性を持っている。
分子特性の予測における既存の最先端手法よりも優れた性能を示し,MoleculeNetベンチマークで広範囲な評価を行った。
論文 参考訳(メタデータ) (2023-12-12T09:33:54Z) - Efficient Prediction of Peptide Self-assembly through Sequential and
Graphical Encoding [57.89530563948755]
この研究は、高度なディープラーニングモデルを用いたペプチドエンコーディングのベンチマーク分析を提供する。
等電点や水和自由エネルギーなど、幅広いペプチド関連予測のガイドとして機能する。
論文 参考訳(メタデータ) (2023-07-17T00:43:33Z) - Accurate, reliable and interpretable solubility prediction of druglike
molecules with attention pooling and Bayesian learning [1.8275108630751844]
可溶性のシリコ予測は, 仮想スクリーニングと鉛最適化において有用性について研究されている。
近年,物理に基づく手法は高スループットタスクには適さないため,実験データを用いた機械学習(ML)手法が普及している。
本稿では,グラフニューラルネットワーク(GNN)を自己注意型読み出し層で開発し,予測性能を向上させる。
論文 参考訳(メタデータ) (2022-09-29T07:48:10Z) - Accurate Machine Learned Quantum-Mechanical Force Fields for
Biomolecular Simulations [51.68332623405432]
分子動力学(MD)シミュレーションは、化学的および生物学的プロセスに関する原子論的な洞察を可能にする。
近年,MDシミュレーションの代替手段として機械学習力場(MLFF)が出現している。
本研究は、大規模分子シミュレーションのための正確なMLFFを構築するための一般的なアプローチを提案する。
論文 参考訳(メタデータ) (2022-05-17T13:08:28Z) - Unassisted Noise Reduction of Chemical Reaction Data Sets [59.127921057012564]
本稿では,データセットから化学的に間違ったエントリを除去するための,機械学習に基づく無支援アプローチを提案する。
その結果,クリーン化およびバランスの取れたデータセットでトレーニングしたモデルの予測精度が向上した。
論文 参考訳(メタデータ) (2021-02-02T09:34:34Z) - Deep Learning for Virtual Screening: Five Reasons to Use ROC Cost
Functions [80.12620331438052]
深層学習は サイリコの何十億もの分子を 迅速にスクリーニングする 重要なツールとなりました
その重要性にもかかわらず、厳密なクラス不均衡、高い決定しきい値、いくつかのデータセットにおける基底真理ラベルの欠如など、これらのモデルのトレーニングにおいて重大な課題が続いている。
このような場合、クラス不均衡に対するロバスト性から、レシーバ動作特性(ROC)を直接最適化することを好んで論じる。
論文 参考訳(メタデータ) (2020-06-25T08:46:37Z) - Assessing Graph-based Deep Learning Models for Predicting Flash Point [52.931492216239995]
グラフベースのディープラーニング(GBDL)モデルは初めてフラッシュポイントを予測するために実装された。
MPNNの平均R2と平均絶対誤差(MAE)は、それぞれ2.3%低、2.0K高である。
論文 参考訳(メタデータ) (2020-02-26T06:10:12Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。