論文の概要: CASTELO: Clustered Atom Subtypes aidEd Lead Optimization -- a combined
machine learning and molecular modeling method
- arxiv url: http://arxiv.org/abs/2011.13788v1
- Date: Fri, 27 Nov 2020 15:41:00 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-20 02:47:19.381148
- Title: CASTELO: Clustered Atom Subtypes aidEd Lead Optimization -- a combined
machine learning and molecular modeling method
- Title(参考訳): CASTELO: Clustered Atom Subtypes aidEd Lead Optimization -- 機械学習と分子モデリングを組み合わせた手法
- Authors: Leili Zhang, Giacomo Domeniconi, Chih-Chieh Yang, Seung-gu Kang,
Ruhong Zhou, Guojing Cong
- Abstract要約: 我々は、リード最適化ワークフローを自動化する機械学習と分子モデリングを組み合わせたアプローチを提案する。
本手法は, 薬剤の有効性向上に有効な, ホットスポットの新規なヒントを提供する。
- 参考スコア(独自算出の注目度): 2.8381402107366034
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Drug discovery is a multi-stage process that comprises two costly major
steps: pre-clinical research and clinical trials. Among its stages, lead
optimization easily consumes more than half of the pre-clinical budget. We
propose a combined machine learning and molecular modeling approach that
automates lead optimization workflow \textit{in silico}. The initial data
collection is achieved with physics-based molecular dynamics (MD) simulation.
Contact matrices are calculated as the preliminary features extracted from the
simulations. To take advantage of the temporal information from the
simulations, we enhanced contact matrices data with temporal dynamism
representation, which are then modeled with unsupervised convolutional
variational autoencoder (CVAE). Finally, conventional clustering method and
CVAE-based clustering method are compared with metrics to rank the submolecular
structures and propose potential candidates for lead optimization. With no need
for extensive structure-activity relationship database, our method provides new
hints for drug modification hotspots which can be used to improve drug
efficacy. Our workflow can potentially reduce the lead optimization turnaround
time from months/years to days compared with the conventional labor-intensive
process and thus can potentially become a valuable tool for medical
researchers.
- Abstract(参考訳): 薬物の発見は、前臨床研究と臨床試験の2つの大きなステップからなる多段階のプロセスである。
その段階の中で、リード最適化は前臨床予算の半分以上を簡単に消費する。
本稿では,リード最適化ワークフローを自動化した機械学習と分子モデリングを組み合わせたアプローチを提案する。
初期データ収集は物理に基づく分子動力学(MD)シミュレーションによって達成される。
シミュレーションから抽出した予備特徴として接触行列を算出する。
シミュレーションからの時間情報を活用するために,時間的ダイナミズム表現を用いた接触行列データを強化し,教師なし畳み込み型変分オートエンコーダ(cvae)を用いてモデル化した。
最後に,従来のクラスタリング法とCVAEに基づくクラスタリング法を比較し,分子下構造をランク付けし,リード最適化の可能性を提案する。
構造-活性関係データベースは必要とせず,薬剤の有効性を改善するための薬剤修飾ホットスポットに対する新たなヒントを提供する。
我々のワークフローは、従来の労働集約的なプロセスと比較して、数ヶ月から数日のリード最適化のターンアラウンド時間を短縮できる可能性があり、医療研究者にとって貴重なツールになる可能性がある。
関連論文リスト
- Efficient Generation of Molecular Clusters with Dual-Scale Equivariant Flow Matching [5.909830898977327]
トレーニングと推論を粗い粒度と全原子ステージに分離する2次元フローマッチング法を開発した。
MDシミュレーションにより得られたY6分子クラスターのデータセット上で,本手法の有効性を示す。
論文 参考訳(メタデータ) (2024-10-10T02:17:27Z) - Hierarchical Matrix Completion for the Prediction of Properties of Binary Mixtures [3.0478550046333965]
データ駆動モデルを改善するための新しいジェネリックアプローチを導入する。
化学のクラスに同じように振る舞うコンポーネントを持ち込み、それらを共同でモデル化します。
クラスタリングを使用すると、クラスタリングなしのCMに比べて予測が大幅に改善される。
論文 参考訳(メタデータ) (2024-10-08T14:04:30Z) - A Multi-Grained Symmetric Differential Equation Model for Learning Protein-Ligand Binding Dynamics [73.35846234413611]
薬物発見において、分子動力学(MD)シミュレーションは、結合親和性を予測し、輸送特性を推定し、ポケットサイトを探索する強力なツールを提供する。
我々は,数値MDを容易にし,タンパク質-リガンド結合ダイナミクスの正確なシミュレーションを提供する,最初の機械学習サロゲートであるNeuralMDを提案する。
従来の数値MDシミュレーションと比較して1K$times$ Speedupを実現することにより,NeuralMDの有効性と有効性を示す。
論文 参考訳(メタデータ) (2024-01-26T09:35:17Z) - Enhancing Multi-Objective Optimization through Machine Learning-Supported Multiphysics Simulation [1.6685829157403116]
本稿では,訓練,自己最適化,自己組織的代理モデルのための方法論的枠組みを提案する。
シュロゲートモデルを比較的少量のデータで訓練し、基礎となるシミュレーションを正確に近似できることを示す。
論文 参考訳(メタデータ) (2023-09-22T20:52:50Z) - HD-Bind: Encoding of Molecular Structure with Low Precision,
Hyperdimensional Binary Representations [3.3934198248179026]
超次元計算(HDC)は、低精度二進ベクトル算術を活用できる学習パラダイムである。
本稿では,HDCに基づく推論手法が,より複雑な機械学習手法よりも90倍効率が高いことを示す。
論文 参考訳(メタデータ) (2023-03-27T21:21:46Z) - Retrieval-based Controllable Molecule Generation [63.44583084888342]
制御可能な分子生成のための検索に基づく新しいフレームワークを提案する。
我々は、与えられた設計基準を満たす分子の合成に向けて、事前学習された生成モデルを操るために、分子の小さなセットを使用します。
提案手法は生成モデルの選択に非依存であり,タスク固有の微調整は不要である。
論文 参考訳(メタデータ) (2022-08-23T17:01:16Z) - Differentiable Agent-based Epidemiology [71.81552021144589]
GradABM(GradABM)は、エージェントベースのモデリングのためのスケーラブルで微分可能な設計で、勾配に基づく学習と自動微分が可能である。
GradABMは、コモディティハードウェア上で数秒で数百万の人口をシミュレートし、ディープニューラルネットワークと統合し、異種データソースを取り込みます。
論文 参考訳(メタデータ) (2022-07-20T07:32:02Z) - HyperImpute: Generalized Iterative Imputation with Automatic Model
Selection [77.86861638371926]
カラムワイズモデルを適応的かつ自動的に構成するための一般化反復計算フレームワークを提案する。
既製の学習者,シミュレータ,インターフェースを備えた具体的な実装を提供する。
論文 参考訳(メタデータ) (2022-06-15T19:10:35Z) - Molecular Attributes Transfer from Non-Parallel Data [57.010952598634944]
分子最適化をスタイル伝達問題として定式化し、非並列データの2つのグループ間の内部差を自動的に学習できる新しい生成モデルを提案する。
毒性修飾と合成性向上という2つの分子最適化タスクの実験により,本モデルがいくつかの最先端手法を著しく上回ることを示した。
論文 参考訳(メタデータ) (2021-11-30T06:10:22Z) - Deep Bayesian Active Learning for Accelerating Stochastic Simulation [74.58219903138301]
Interactive Neural Process(INP)は、シミュレーションとアクティブな学習アプローチのためのディープラーニングフレームワークである。
能動的学習のために,NPベースモデルの潜時空間で計算された新しい取得関数Latent Information Gain (LIG)を提案する。
その結果,STNPは学習環境のベースラインを上回り,LIGは能動学習の最先端を達成していることがわかった。
論文 参考訳(メタデータ) (2021-06-05T01:31:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。