Fugu-MT 論文翻訳(概要): Machine learning on DNA-encoded libraries: A new paradigm for hit-finding

論文の概要: Machine learning on DNA-encoded libraries: A new paradigm for hit-finding

arxiv url: http://arxiv.org/abs/2002.02530v1
Date: Fri, 31 Jan 2020 19:31:23 GMT
ステータス: 翻訳完了
システム内更新日: 2023-01-05 07:07:20.710791
Title: Machine learning on DNA-encoded libraries: A new paradigm for hit-finding
Title（参考訳）: DNA符号化ライブラリによる機械学習: ヒットフィンディングの新しいパラダイム
Authors: Kevin McCloskey, Eric A. Sigel, Steven Kearnes, Ling Xue, Xia Tian, Dennis Moccia, Diana Gikunju, Sana Bazzaz, Betty Chan, Matthew A. Clark, John W. Cuozzo, Marie-Aude Gui\'e, John P. Guilinger, Christelle Huguet, Christopher D. Hupp, Anthony D. Keefe, Christopher J. Mulhern, Ying Zhang, and Patrick Riley
Abstract要約: DEL選択データに機械学習を適用した新しい手法を示す。 DEL選択データのみを使用してモデルをトレーニングし、自動または自動化可能なフィルタを適用します。アプローチは有効であり、全体としては30本のテキストミューMで sim30% のヒット率と各ターゲットに対する強力な化合物(IC50 10 nM)の発見である。
参考スコア（独自算出の注目度）: 4.473676566828977
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: DNA-encoded small molecule libraries (DELs) have enabled discovery of novel inhibitors for many distinct protein targets of therapeutic value through screening of libraries with up to billions of unique small molecules. We demonstrate a new approach applying machine learning to DEL selection data by identifying active molecules from a large commercial collection and a virtual library of easily synthesizable compounds. We train models using only DEL selection data and apply automated or automatable filters with chemist review restricted to the removal of molecules with potential for instability or reactivity. We validate this approach with a large prospective study (nearly 2000 compounds tested) across three diverse protein targets: sEH (a hydrolase), ER{\alpha} (a nuclear receptor), and c-KIT (a kinase). The approach is effective, with an overall hit rate of {\sim}30% at 30 {\textmu}M and discovery of potent compounds (IC50 <10 nM) for every target. The model makes useful predictions even for molecules dissimilar to the original DEL and the compounds identified are diverse, predominantly drug-like, and different from known ligands. Collectively, the quality and quantity of DEL selection data; the power of modern machine learning methods; and access to large, inexpensive, commercially-available libraries creates a powerful new approach for hit finding.
Abstract（参考訳）: DNAエンコードされた小分子ライブラリー(DEL)は、最大で数十億の特異な小分子を持つライブラリーのスクリーニングを通じて、治療価値の多くの異なるタンパク質標的に対する新規な阻害剤の発見を可能にした。本研究では,大規模な商業コレクションから活性分子を同定し,容易に合成可能な化合物の仮想ライブラリを用いて,機械学習をデル選択データに適用する新しいアプローチを示す。我々は、DEL選択データのみを用いてモデルを訓練し、不安定性や反応性の可能性がある分子の除去に制限された化学レビュー付き自動または自動化可能なフィルタを適用した。本手法は, sEH(ヒドロラーゼ), ER{\alpha(核受容体), c-KIT(キナーゼ)の3種類のタンパク質標的に対して, 概説(2000種近い化合物)により検証した。このアプローチは有効であり、30 {\textmu}mでの全体のヒット率は30%であり、標的ごとに強力な化合物(ic50 <10 nm)が発見される。このモデルは、元のDELと異なる分子に対しても有用な予測を行い、同定された化合物は多様であり、主に薬物様であり、既知の配位子とは異なる。集合的に言えば、DEL選択データの品質と量、現代の機械学習手法のパワー、そして大規模で安価な商用ライブラリへのアクセスは、ヒットを見つけるための強力な新しいアプローチを生み出します。

関連論文リスト

CL-MFAP: A Contrastive Learning-Based Multimodal Foundation Model for Molecular Property Prediction and Antibiotic Screening [9.162517838181683]
非教師付きコントラスト学習(CL)ベースのマルチモーダル基礎(MF)モデルであるCL-MFAPを導入する。このモデルは、ChEMBLデータセットから薬物のような性質を持つ1.6万の生物活性分子を用いて、3つのエンコーダを共同で事前訓練する。 CL-MFAPは、異なる分子モードを有効利用することにより、抗生物質特性予測におけるベースラインモデルより優れ、抗生物質関連特性予測タスクの微調整時に、ドメイン特異的性能が優れていることを示す。
論文参考訳（メタデータ） (2025-02-16T05:45:19Z)
KinDEL: DNA-Encoded Library Dataset for Kinase Inhibitors [2.0179908661487986]
KinDELは2つのキナーゼ上のDELデータセットとして初めて公開された。我々は、ヒット識別のための予測モデルを開発するために、異なる機械学習手法をベンチマークする。我々は、分子の小さなサブセット上でモデルを検証するために、オンとオフの両方で生物物理学的なアッセイデータを提供する。
論文参考訳（メタデータ） (2024-10-11T16:03:58Z)
Unlocking Potential Binders: Multimodal Pretraining DEL-Fusion for Denoising DNA-Encoded Libraries [51.72836644350993]
マルチモーダルプレトレーニング DEL-Fusion Model (MPDF) 我々は,異なる複合表現とそれらのテキスト記述の対比対象を適用した事前学習タスクを開発する。本稿では, 原子, 分子, 分子レベルでの複合情報をアマルガメートする新しいDEL融合フレームワークを提案する。
論文参考訳（メタデータ） (2024-09-07T17:32:21Z)
RGFN: Synthesizable Molecular Generation Using GFlowNets [51.33672611338754]
本稿では,化学反応の空間内で直接動作するGFlowNetフレームワークの拡張であるReaction-GFlowNetを提案する。 RGFNは、生成した候補の同等の品質を維持しながら、アウト・オブ・ボックスの合成を可能にする。提案手法の有効性を,事前訓練されたプロキシモデルやGPUアクセラレーションドッキングなど,さまざまなオラクルモデルに適用した。
論文参考訳（メタデータ） (2024-06-01T13:11:11Z)
Regressor-free Molecule Generation to Support Drug Response Prediction [83.25894107956735]
目標IC50スコアに基づく条件生成により、より効率的なサンプリングスペースを得ることができる。回帰自由誘導は、拡散モデルのスコア推定と、数値ラベルに基づく回帰制御モデルの勾配を結合する。
論文参考訳（メタデータ） (2024-05-23T13:22:17Z)
Multi-objective Molecular Optimization for Opioid Use Disorder Treatment Using Generative Network Complex [5.33208055504216]
オピオイド・ユース障害(OUD)が世界的な健康問題として浮上している。本研究では,微分方程式(SDE)に基づく拡散モデルと事前学習された自己エンコーダモデルの潜在空間を結合した深部生成モデルを提案する。分子発生器は、複数の標的に有効である分子の効率的な生成を可能にする。
論文参考訳（メタデータ） (2023-06-13T01:12:31Z)
Target Specific De Novo Design of Drug Candidate Molecules with Graph Transformer-based Generative Adversarial Networks [0.0]
薬物候補分子のデノボ設計のためのエンド・ツー・エンド生成システムであるDr.GENを提案する。このシステムは、薬物のような化合物と標的特異的な生物活性分子の大規模なデータセットを用いて訓練される。オープンアクセスされた薬物遺伝子を用いて、他の薬剤性タンパク質のモデルを容易に訓練することができる。
論文参考訳（メタデータ） (2023-02-15T18:59:27Z)
DEL-Dock: Molecular Docking-Enabled Modeling of DNA-Encoded Libraries [1.290382979353427]
我々は、リガンドベースの記述子とドッキングされたタンパク質-リガンド複合体の3次元空間情報を組み合わせた新しいパラダイムDEL-Dockを導入する。本モデルでは,分子富化スコアを予測するために,DELカウントデータを効果的にデノベートできることを示す。
論文参考訳（メタデータ） (2022-11-30T22:00:24Z)
Exploring Chemical Space with Score-based Out-of-distribution Generation [57.15855198512551]
生成微分方程式(SDE)にアウト・オブ・ディストリビューション制御を組み込んだスコアベース拡散方式を提案する。いくつかの新しい分子は現実世界の薬物の基本的な要件を満たしていないため、MOODは特性予測器からの勾配を利用して条件付き生成を行う。我々はMOODがトレーニング分布を超えて化学空間を探索できることを実験的に検証し、既存の方法で見いだされた分子、そして元のトレーニングプールの上位0.01%までも生成できることを実証した。
論文参考訳（メタデータ） (2022-06-06T06:17:11Z)
Partial Product Aware Machine Learning on DNA-Encoded Libraries [0.0]
DELデータに基づく機械学習モデルの訓練は、元のDELと異なる関心の分子を予測するのに有効であることが示されている。反応収率データを利用して、与えられたDNAタグに対応する分子の集合を列挙する。
論文参考訳（メタデータ） (2022-05-16T23:18:02Z)
Neural networks for Anatomical Therapeutic Chemical (ATC) [83.73971067918333]
両方向の長期記憶ネットワーク(BiLSTM)から抽出された集合を含む、特徴の異なるセットで訓練された複数の複数ラベル分類器を組み合わせることを提案する。実験はこのアプローチのパワーを実証し、文献で報告された最良の手法よりも優れていることを示した。
論文参考訳（メタデータ） (2021-01-22T19:49:47Z)
A Systematic Approach to Featurization for Cancer Drug Sensitivity Predictions with Deep Learning [49.86828302591469]
35,000以上のニューラルネットワークモデルをトレーニングし、一般的な成果化技術を駆使しています。 RNA-seqは128以上のサブセットであっても非常に冗長で情報的であることがわかった。
論文参考訳（メタデータ） (2020-04-30T20:42:17Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。