論文の概要: Scaling Structure Aware Virtual Screening to Billions of Molecules with SPRINT
- arxiv url: http://arxiv.org/abs/2411.15418v2
- Date: Mon, 20 Jan 2025 22:10:33 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-01-22 14:14:52.329206
- Title: Scaling Structure Aware Virtual Screening to Billions of Molecules with SPRINT
- Title(参考訳): SPRINTによる数十億の分子への仮想スクリーニングを意識した構造解析
- Authors: Andrew T. McNutt, Abhinav K. Adduri, Caleb N. Ellington, Monica T. Dayao, Eric P. Xing, Hosein Mohimani, David R. Koes,
- Abstract要約: SPRINTは、DTIのための全プロテオームと新しい作用機構に対して、全ての化学ライブラリーをスクリーニングするためのベクトルベースのアプローチである。
SPRINTは正確かつ解釈可能なだけでなく、超高速で、ENAMINE Real Databaseに対してヒトのプロテオーム全体を問い合わせるのに16分かかります。
- 参考スコア(独自算出の注目度): 34.0426830266348
- License:
- Abstract: Virtual screening of small molecules against protein targets can accelerate drug discovery and development by predicting drug-target interactions (DTIs). However, structure-based methods like molecular docking are too slow to allow for broad proteome-scale screens, limiting their application in screening for off-target effects or new molecular mechanisms. Recently, vector-based methods using protein language models (PLMs) have emerged as a complementary approach that bypasses explicit 3D structure modeling. Here, we develop SPRINT, a vector-based approach for screening entire chemical libraries against whole proteomes for DTIs and novel mechanisms of action. SPRINT improves on prior work by using a self-attention based architecture and structure-aware PLMs to learn drug-target co-embeddings for binder prediction, search, and retrieval. SPRINT achieves SOTA enrichment factors in virtual screening on LIT-PCBA, DTI classification benchmarks, and binding affinity prediction benchmarks, while providing interpretability in the form of residue-level attention maps. In addition to being both accurate and interpretable, SPRINT is ultra-fast: querying the whole human proteome against the ENAMINE Real Database (6.7B drugs) for the 100 most likely binders per protein takes 16 minutes. SPRINT promises to enable virtual screening at an unprecedented scale, opening up new opportunities for in silico drug repurposing and development. SPRINT is available on the web as ColabScreen: https://bit.ly/colab-screen
- Abstract(参考訳): タンパク質標的に対する小さな分子の仮想スクリーニングは、ドラッグ・ターゲット相互作用(DTI)を予測することによって、薬物の発見と開発を加速させる。
しかし、分子ドッキングのような構造に基づく手法はあまりに遅く、プロテオームスケールの広いスクリーンを可能にし、オフターゲット効果のスクリーニングや新しい分子機構への応用を制限する。
近年, タンパク質言語モデル (PLM) を用いたベクトルベース手法が, 明示的な3次元構造モデリングを回避した補完的手法として出現している。
本稿では,DTIのプロテオーム全体に対する化学ライブラリ全体に対するベクターベースのスクリーニング手法であるSPRINTを開発し,その作用機構について述べる。
SPRINTは、自己認識型アーキテクチャと構造認識型PLMを使用して、バインダー予測、検索、検索のためのドラッグターゲット共埋め込みを学習することにより、以前の作業を改善する。
SPRINTは、LIT-PCBA、DTI分類ベンチマーク、バインディング親和性予測ベンチマークの仮想スクリーニングにおけるSOTA濃縮係数を達成し、残差レベルの注意マップの形で解釈可能性を提供する。
SPRINTは正確かつ解釈可能であり、ENAMINE Real Database (6.7Bの薬物)に対してヒトのプロテオーム全体を問い合わせるのに16分かかる。
SPRINTは、前例のない規模のバーチャルスクリーニングを可能にすることを約束し、シリコドラッグの購入と開発のための新たな機会を開く。
SPRINTはWeb上でColabScreenとして利用可能である。
関連論文リスト
- MSAGPT: Neural Prompting Protein Structure Prediction via MSA Generative Pre-Training [48.398329286769304]
マルチシークエンスアライメント(MSA)は、タンパク質ファミリーの進化的軌道を明らかにする上で重要な役割を担っている。
MSAGPTは、低MSA状態下でのMSA生成前訓練を通じてタンパク質構造予測を促進する新しいアプローチである。
論文 参考訳(メタデータ) (2024-06-08T04:23:57Z) - FragXsiteDTI: Revealing Responsible Segments in Drug-Target Interaction
with Transformer-Driven Interpretation [0.09236074230806578]
薬物-標的相互作用(DTI)予測は薬物発見に不可欠であるが、モデル解釈可能性の実現と性能の最適化には課題が続く。
DTI予測におけるこれらの課題に対処することを目的とした新しいトランスフォーマーモデルFragXsiteDTIを提案する。
FragXsiteDTIは、薬物分子断片とタンパク質ポケットを同時に利用する最初のDTIモデルである。
論文 参考訳(メタデータ) (2023-11-04T04:57:13Z) - ProFSA: Self-supervised Pocket Pretraining via Protein
Fragment-Surroundings Alignment [20.012210194899605]
本稿では,高分解能原子タンパク質構造からの知識を活用したポケット事前学習手法を提案する。
ProFSAと命名された本手法は,ポケットの薬剤性予測など,様々なタスクにおける最先端性能を実現する。
我々の研究は、高品質で多様なタンパク質構造データベースを活用することにより、タンパク質-リガンド複合体データの不足を軽減するための新たな道を開く。
論文 参考訳(メタデータ) (2023-10-11T06:36:23Z) - PGraphDTA: Improving Drug Target Interaction Prediction using Protein
Language Models and Contact Maps [4.590060921188914]
薬物発見の鍵となる側面は、新規な薬物標的相互作用(DT)の同定である。
タンパク質-リガンド相互作用は結合親和性として知られる結合強度の連続性を示す。
性能向上のための新しい改良を提案する。
論文 参考訳(メタデータ) (2023-10-06T05:00:25Z) - PharmacoNet: Accelerating Large-Scale Virtual Screening by Deep
Pharmacophore Modeling [0.0]
我々は,この課題に対処するために,構造に基づく薬剤師範モデリングのためのディープラーニングフレームワークを初めて記述する。
PharmacoNetは最先端の構造に基づくアプローチよりもはるかに高速だが、単純なスコアリング機能では合理的に正確である。
論文 参考訳(メタデータ) (2023-10-01T14:13:09Z) - HydraScreen: A Generalizable Structure-Based Deep Learning Approach to
Drug Discovery [0.0]
HydraScreenは、より堅牢な機械学習による薬物発見のためのフレームワークを提供することを目指している。
我々は最先端の3D畳み込みニューラルネットワークを用いて、タンパク質-リガンド結合における分子構造と相互作用を表現している。
HydraScreenはユーザフレンドリなGUIと公開APIを提供し、個々のタンパク質-リガンド複合体の簡易な評価を容易にする。
論文 参考訳(メタデータ) (2023-09-22T18:48:34Z) - Tailoring Molecules for Protein Pockets: a Transformer-based Generative
Solution for Structured-based Drug Design [133.1268990638971]
標的タンパク質の構造に基づくデノボ薬物の設計は、新規な薬物候補を提供することができる。
そこで本研究では,特定のターゲットに対して,対象薬物をスクラッチから直接生成できるTamGentという生成ソリューションを提案する。
論文 参考訳(メタデータ) (2022-08-30T09:32:39Z) - SSM-DTA: Breaking the Barriers of Data Scarcity in Drug-Target Affinity
Prediction [127.43571146741984]
薬物標的親和性(DTA)は、早期の薬物発見において極めて重要である。
湿式実験は依然として最も信頼性の高い方法であるが、時間と資源が集中している。
既存の手法は主に、データ不足の問題に適切に対処することなく、利用可能なDTAデータに基づく技術開発に重点を置いている。
SSM-DTAフレームワークについて述べる。
論文 参考訳(メタデータ) (2022-06-20T14:53:25Z) - Learning To Navigate The Synthetically Accessible Chemical Space Using
Reinforcement Learning [75.95376096628135]
ド・ノボ薬物設計のための強化学習(RL)を利用した新しい前方合成フレームワークを提案する。
このセットアップでは、エージェントは巨大な合成可能な化学空間をナビゲートする。
本研究は,合成可能な化学空間を根本的に拡張する上で,エンド・ツー・エンド・トレーニングが重要なパラダイムであることを示す。
論文 参考訳(メタデータ) (2020-04-26T21:40:03Z) - DeepPurpose: a Deep Learning Library for Drug-Target Interaction
Prediction [69.7424023336611]
DeepPurposeは、DTI予測のための包括的で使いやすいディープラーニングライブラリである。
15の複合およびタンパク質エンコーダと50以上のニューラルアーキテクチャを実装することで、カスタマイズされたDTI予測モデルのトレーニングをサポートする。
複数のベンチマークデータセット上でDeepPurposeの最先端性能を示す。
論文 参考訳(メタデータ) (2020-04-19T17:31:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。