論文の概要: Machine learning on DNA-encoded libraries: A new paradigm for
hit-finding
- arxiv url: http://arxiv.org/abs/2002.02530v1
- Date: Fri, 31 Jan 2020 19:31:23 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-05 07:07:20.710791
- Title: Machine learning on DNA-encoded libraries: A new paradigm for
hit-finding
- Title(参考訳): DNA符号化ライブラリによる機械学習: ヒットフィンディングの新しいパラダイム
- Authors: Kevin McCloskey, Eric A. Sigel, Steven Kearnes, Ling Xue, Xia Tian,
Dennis Moccia, Diana Gikunju, Sana Bazzaz, Betty Chan, Matthew A. Clark, John
W. Cuozzo, Marie-Aude Gui\'e, John P. Guilinger, Christelle Huguet,
Christopher D. Hupp, Anthony D. Keefe, Christopher J. Mulhern, Ying Zhang,
and Patrick Riley
- Abstract要約: DEL選択データに機械学習を適用した新しい手法を示す。
DEL選択データのみを使用してモデルをトレーニングし、自動または自動化可能なフィルタを適用します。
アプローチは有効であり、全体としては30本のテキストミューMで sim30% のヒット率と各ターゲットに対する強力な化合物(IC50 10 nM)の発見である。
- 参考スコア(独自算出の注目度): 4.473676566828977
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: DNA-encoded small molecule libraries (DELs) have enabled discovery of novel
inhibitors for many distinct protein targets of therapeutic value through
screening of libraries with up to billions of unique small molecules. We
demonstrate a new approach applying machine learning to DEL selection data by
identifying active molecules from a large commercial collection and a virtual
library of easily synthesizable compounds. We train models using only DEL
selection data and apply automated or automatable filters with chemist review
restricted to the removal of molecules with potential for instability or
reactivity. We validate this approach with a large prospective study (nearly
2000 compounds tested) across three diverse protein targets: sEH (a hydrolase),
ER{\alpha} (a nuclear receptor), and c-KIT (a kinase). The approach is
effective, with an overall hit rate of {\sim}30% at 30 {\textmu}M and discovery
of potent compounds (IC50 <10 nM) for every target. The model makes useful
predictions even for molecules dissimilar to the original DEL and the compounds
identified are diverse, predominantly drug-like, and different from known
ligands. Collectively, the quality and quantity of DEL selection data; the
power of modern machine learning methods; and access to large, inexpensive,
commercially-available libraries creates a powerful new approach for hit
finding.
- Abstract(参考訳): DNAエンコードされた小分子ライブラリー(DEL)は、最大で数十億の特異な小分子を持つライブラリーのスクリーニングを通じて、治療価値の多くの異なるタンパク質標的に対する新規な阻害剤の発見を可能にした。
本研究では,大規模な商業コレクションから活性分子を同定し,容易に合成可能な化合物の仮想ライブラリを用いて,機械学習をデル選択データに適用する新しいアプローチを示す。
我々は、DEL選択データのみを用いてモデルを訓練し、不安定性や反応性の可能性がある分子の除去に制限された化学レビュー付き自動または自動化可能なフィルタを適用した。
本手法は, sEH(ヒドロラーゼ), ER{\alpha(核受容体), c-KIT(キナーゼ)の3種類のタンパク質標的に対して, 概説(2000種近い化合物)により検証した。
このアプローチは有効であり、30 {\textmu}mでの全体のヒット率は30%であり、標的ごとに強力な化合物(ic50 <10 nm)が発見される。
このモデルは、元のDELと異なる分子に対しても有用な予測を行い、同定された化合物は多様であり、主に薬物様であり、既知の配位子とは異なる。
集合的に言えば、DEL選択データの品質と量、現代の機械学習手法のパワー、そして大規模で安価な商用ライブラリへのアクセスは、ヒットを見つけるための強力な新しいアプローチを生み出します。
関連論文リスト
- Compositional Deep Probabilistic Models of DNA Encoded Libraries [6.206196935093064]
分子表現をモノシンソン,ジシンソン,トリシンソン構造ブロックに分解するDELデータ(DEL-Compose)の合成確率モデルを提案する。
本モデルでは, 基準値と比較して高い性能を示し, 適切な薬局網を充実させ, 内在的解釈可能な構造を通じて貴重な知見を提供する。
論文 参考訳(メタデータ) (2023-10-20T19:04:28Z) - Multi-objective Molecular Optimization for Opioid Use Disorder Treatment
Using Generative Network Complex [5.33208055504216]
オピオイド・ユース障害(OUD)が世界的な健康問題として浮上している。
本研究では,微分方程式(SDE)に基づく拡散モデルと事前学習された自己エンコーダモデルの潜在空間を結合した深部生成モデルを提案する。
分子発生器は、複数の標的に有効である分子の効率的な生成を可能にする。
論文 参考訳(メタデータ) (2023-06-13T01:12:31Z) - Target Specific De Novo Design of Drug Candidate Molecules with Graph
Transformer-based Generative Adversarial Networks [0.0]
本稿では,選択された標的タンパク質と相互作用する薬物候補分子のデノボ設計のための薬物遺伝子を提案する。
医薬品は、ChEMBLおよび標的特異的な生物活性分子からの大量の化合物のデータセットを用いて訓練される。
論文 参考訳(メタデータ) (2023-02-15T18:59:27Z) - DEL-Dock: Molecular Docking-Enabled Modeling of DNA-Encoded Libraries [1.290382979353427]
我々は、リガンドベースの記述子とドッキングされたタンパク質-リガンド複合体の3次元空間情報を組み合わせた新しいパラダイムDEL-Dockを導入する。
本モデルでは,分子富化スコアを予測するために,DELカウントデータを効果的にデノベートできることを示す。
論文 参考訳(メタデータ) (2022-11-30T22:00:24Z) - Retrieval-based Controllable Molecule Generation [63.44583084888342]
制御可能な分子生成のための検索に基づく新しいフレームワークを提案する。
我々は、与えられた設計基準を満たす分子の合成に向けて、事前学習された生成モデルを操るために、分子の小さなセットを使用します。
提案手法は生成モデルの選択に非依存であり,タスク固有の微調整は不要である。
論文 参考訳(メタデータ) (2022-08-23T17:01:16Z) - Exploring Chemical Space with Score-based Out-of-distribution Generation [57.15855198512551]
生成微分方程式(SDE)にアウト・オブ・ディストリビューション制御を組み込んだスコアベース拡散方式を提案する。
いくつかの新しい分子は現実世界の薬物の基本的な要件を満たしていないため、MOODは特性予測器からの勾配を利用して条件付き生成を行う。
我々はMOODがトレーニング分布を超えて化学空間を探索できることを実験的に検証し、既存の方法で見いだされた分子、そして元のトレーニングプールの上位0.01%までも生成できることを実証した。
論文 参考訳(メタデータ) (2022-06-06T06:17:11Z) - Partial Product Aware Machine Learning on DNA-Encoded Libraries [0.0]
DELデータに基づく機械学習モデルの訓練は、元のDELと異なる関心の分子を予測するのに有効であることが示されている。
反応収率データを利用して、与えられたDNAタグに対応する分子の集合を列挙する。
論文 参考訳(メタデータ) (2022-05-16T23:18:02Z) - Neural networks for Anatomical Therapeutic Chemical (ATC) [83.73971067918333]
両方向の長期記憶ネットワーク(BiLSTM)から抽出された集合を含む、特徴の異なるセットで訓練された複数の複数ラベル分類器を組み合わせることを提案する。
実験はこのアプローチのパワーを実証し、文献で報告された最良の手法よりも優れていることを示した。
論文 参考訳(メタデータ) (2021-01-22T19:49:47Z) - RetroGNN: Approximating Retrosynthesis by Graph Neural Networks for De
Novo Drug Design [75.14290780116002]
我々は、再合成計画ソフトウェアの出力を近似するために、ディープグラフニューラルネットワークを訓練する。
提案手法では, 薬剤的特性は良好であり, 合成が容易であるにもかかわらず, 抗生物質である可能性が示唆された分子について検討した。
論文 参考訳(メタデータ) (2020-11-25T22:04:16Z) - MIMOSA: Multi-constraint Molecule Sampling for Molecule Optimization [66.84839948236478]
生成モデルと強化学習アプローチは、最初の成功をおさめたが、複数の薬物特性を同時に最適化する上で、依然として困難に直面している。
本稿では,MultI-Constraint MOlecule SAmpling (MIMOSA)アプローチ,初期推定として入力分子を用いるサンプリングフレームワーク,ターゲット分布からのサンプル分子を提案する。
論文 参考訳(メタデータ) (2020-10-05T20:18:42Z) - A Systematic Approach to Featurization for Cancer Drug Sensitivity
Predictions with Deep Learning [49.86828302591469]
35,000以上のニューラルネットワークモデルをトレーニングし、一般的な成果化技術を駆使しています。
RNA-seqは128以上のサブセットであっても非常に冗長で情報的であることがわかった。
論文 参考訳(メタデータ) (2020-04-30T20:42:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。