論文の概要: Predicting drug properties with parameter-free machine learning:
Pareto-Optimal Embedded Modeling (POEM)
- arxiv url: http://arxiv.org/abs/2002.04555v2
- Date: Thu, 2 Apr 2020 19:13:45 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-02 01:38:02.150529
- Title: Predicting drug properties with parameter-free machine learning:
Pareto-Optimal Embedded Modeling (POEM)
- Title(参考訳): パラメータフリー機械学習による薬物特性予測 : Pareto-Optimal Embedded Modeling (POEM)
- Authors: Andrew E. Brereton, Stephen MacKinnon, Zhaleh Safikhani, Shawn Reeves,
Sana Alwash, Vijay Shahani, Andreas Windemuth
- Abstract要約: POEMは、最適化を必要とせず、信頼性の高い予測モデルを生成するために開発された非パラメトリックな教師付きMLアルゴリズムである。
我々は、業界標準のMLアルゴリズムと比較してPOEMをベンチマークし、17の分類タスクにまたがって結果を公表する。
- 参考スコア(独自算出の注目度): 0.13854111346209866
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The prediction of absorption, distribution, metabolism, excretion, and
toxicity (ADMET) of small molecules from their molecular structure is a central
problem in medicinal chemistry with great practical importance in drug
discovery. Creating predictive models conventionally requires substantial
trial-and-error for the selection of molecular representations, machine
learning (ML) algorithms, and hyperparameter tuning. A generally applicable
method that performs well on all datasets without tuning would be of great
value but is currently lacking. Here, we describe Pareto-Optimal Embedded
Modeling (POEM), a similarity-based method for predicting molecular properties.
POEM is a non-parametric, supervised ML algorithm developed to generate
reliable predictive models without need for optimization. POEMs predictive
strength is obtained by combining multiple different representations of
molecular structures in a context-specific manner, while maintaining low
dimensionality. We benchmark POEM relative to industry-standard ML algorithms
and published results across 17 classifications tasks. POEM performs well in
all cases and reduces the risk of overfitting.
- Abstract(参考訳): 分子構造からの微量分子の吸収、分布、代謝、排出、毒性(ADMET)の予測は、薬物発見において非常に重要な薬理化学における中心的な問題である。
従来の予測モデルの作成には、分子表現の選択、機械学習(ML)アルゴリズム、ハイパーパラメータチューニングなど、かなりの試行錯誤が必要となる。
チューニングなしですべてのデータセットでうまく機能する一般的な適用方法は、非常に価値はあるが、現在不足している。
本稿では,分子特性を予測する類似性に基づくPOEM(Pareto-Optimal Embedded Modeling)について述べる。
POEMは、最適化を必要とせずに信頼できる予測モデルを生成するために開発された、非パラメトリックで教師付きMLアルゴリズムである。
POEMの予測強度は、低次元性を維持しながら、コンテキスト特異的に複数の異なる分子構造の表現を組み合わせることで得られる。
業界標準のMLアルゴリズムと比較してPOEMをベンチマークし、17の分類タスクにまたがって結果を公表した。
すべてのケースにおいてPOEMは良好に機能し、オーバーフィッティングのリスクを低減する。
関連論文リスト
- Pre-trained Molecular Language Models with Random Functional Group Masking [54.900360309677794]
SMILESをベースとしたアンダーリネム分子アンダーリネム言語アンダーリネムモデルを提案し,特定の分子原子に対応するSMILESサブシーケンスをランダムにマスキングする。
この技術は、モデルに分子構造や特性をよりよく推測させ、予測能力を高めることを目的としている。
論文 参考訳(メタデータ) (2024-11-03T01:56:15Z) - Text-Guided Multi-Property Molecular Optimization with a Diffusion Language Model [77.50732023411811]
変換器を用いた拡散言語モデル(TransDLM)を用いたテキスト誘導多目的分子最適化手法を提案する。
TransDLMは標準化された化学命名法を分子の意味表現として利用し、プロパティ要求をテキスト記述に暗黙的に埋め込む。
提案手法は, 分子構造類似性を最適化し, ベンチマークデータセットの化学的特性を向上するための最先端手法を超越した手法である。
論文 参考訳(メタデータ) (2024-10-17T14:30:27Z) - Pretraining Graph Transformers with Atom-in-a-Molecule Quantum Properties for Improved ADMET Modeling [38.53065398127086]
我々は,グラフトランスフォーマーの事前学習が原子レベルの量子力学特性に与える影響を評価する。
原子量子力学的性質に基づいて事前訓練されたモデルは、より低周波ラプラシアン固有モードを捕捉する。
論文 参考訳(メタデータ) (2024-10-10T15:20:30Z) - YZS-model: A Predictive Model for Organic Drug Solubility Based on Graph Convolutional Networks and Transformer-Attention [9.018408514318631]
伝統的な手法は複雑な分子構造を見逃し、不正確な結果をもたらすことが多い。
本稿では,グラフ畳み込みネットワーク(GCN),トランスフォーマーアーキテクチャ,Long Short-Term Memory(LSTM)ネットワークを統合するディープラーニングフレームワークであるYZS-Modelを紹介する。
YZS-Modelは、R2$ 0.59、RMSE$ 0.57を達成し、ベンチマークモデルを上回った。
論文 参考訳(メタデータ) (2024-06-27T12:40:29Z) - Balancing Molecular Information and Empirical Data in the Prediction of Physico-Chemical Properties [8.649679686652648]
本稿では,分子記述子と表現学習を組み合わせた一般的な手法を提案する。
提案したハイブリッドモデルは,グラフニューラルネットワークを用いた化学構造情報を利用する。
構造に基づく予測が信頼できない場合を自動的に検出し、表現学習に基づく予測によって修正する。
論文 参考訳(メタデータ) (2024-06-12T10:51:00Z) - Machine Learning Small Molecule Properties in Drug Discovery [44.62264781248437]
我々は, 結合親和性, 溶解性, ADMET (吸収, 分布, 代謝, 排出, 毒性) を含む幅広い特性について検討する。
化学指紋やグラフベースニューラルネットワークなど,既存の一般的な記述子や埋め込みについて論じる。
最後に、モデル予測の理解を提供する技術、特に薬物発見における重要な意思決定について評価する。
論文 参考訳(メタデータ) (2023-08-02T22:18:41Z) - Implicit Geometry and Interaction Embeddings Improve Few-Shot Molecular
Property Prediction [53.06671763877109]
我々は, 複雑な分子特性を符号化した分子埋め込みを開発し, 数発の分子特性予測の性能を向上させる。
我々の手法は大量の合成データ、すなわち分子ドッキング計算の結果を利用する。
複数の分子特性予測ベンチマークでは、埋め込み空間からのトレーニングにより、マルチタスク、MAML、プロトタイプラーニング性能が大幅に向上する。
論文 参考訳(メタデータ) (2023-02-04T01:32:40Z) - Molecular Attributes Transfer from Non-Parallel Data [57.010952598634944]
分子最適化をスタイル伝達問題として定式化し、非並列データの2つのグループ間の内部差を自動的に学習できる新しい生成モデルを提案する。
毒性修飾と合成性向上という2つの分子最適化タスクの実験により,本モデルがいくつかの最先端手法を著しく上回ることを示した。
論文 参考訳(メタデータ) (2021-11-30T06:10:22Z) - MIMOSA: Multi-constraint Molecule Sampling for Molecule Optimization [51.00815310242277]
生成モデルと強化学習アプローチは、最初の成功をおさめたが、複数の薬物特性を同時に最適化する上で、依然として困難に直面している。
本稿では,MultI-Constraint MOlecule SAmpling (MIMOSA)アプローチ,初期推定として入力分子を用いるサンプリングフレームワーク,ターゲット分布からのサンプル分子を提案する。
論文 参考訳(メタデータ) (2020-10-05T20:18:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。