論文の概要: DOCKSTRING: easy molecular docking yields better benchmarks for ligand
design
- arxiv url: http://arxiv.org/abs/2110.15486v1
- Date: Fri, 29 Oct 2021 01:37:13 GMT
- ステータス: 処理完了
- システム内更新日: 2021-11-01 23:03:42.684920
- Title: DOCKSTRING: easy molecular docking yields better benchmarks for ligand
design
- Title(参考訳): DOCKSTRING:分子ドッキングはリガンド設計のためのより良いベンチマークをもたらす
- Authors: Miguel Garc\'ia-Orteg\'on, Gregor N. C. Simm, Austin J. Tripp, Jos\'e
Miguel Hern\'andez-Lobato, Andreas Bender and Sergio Bacallado
- Abstract要約: 本稿では、3つのコンポーネントからなる機械学習モデルの有意義かつ堅牢な比較のためのバンドルであるDOCKSTRINGを提案する。
Pythonパッケージはロバストなリガンドとターゲットの準備プロトコルを実装しており、非専門家が意味のあるドッキングスコアを得ることができる。
私たちのデータセットには、ドッキングのポーズと、フルマトリックスである最初のサイズが含まれています。
- 参考スコア(独自算出の注目度): 3.848364262836075
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The field of machine learning for drug discovery is witnessing an explosion
of novel methods. These methods are often benchmarked on simple physicochemical
properties such as solubility or general druglikeness, which can be readily
computed. However, these properties are poor representatives of objective
functions in drug design, mainly because they do not depend on the candidate's
interaction with the target. By contrast, molecular docking is a widely
successful method in drug discovery to estimate binding affinities. However,
docking simulations require a significant amount of domain knowledge to set up
correctly which hampers adoption. To this end, we present DOCKSTRING, a bundle
for meaningful and robust comparison of ML models consisting of three
components: (1) an open-source Python package for straightforward computation
of docking scores; (2) an extensive dataset of docking scores and poses of more
than 260K ligands for 58 medically-relevant targets; and (3) a set of
pharmaceutically-relevant benchmark tasks including regression, virtual
screening, and de novo design. The Python package implements a robust ligand
and target preparation protocol that allows non-experts to obtain meaningful
docking scores. Our dataset is the first to include docking poses, as well as
the first of its size that is a full matrix, thus facilitating experiments in
multiobjective optimization and transfer learning. Overall, our results
indicate that docking scores are a more appropriate evaluation objective than
simple physicochemical properties, yielding more realistic benchmark tasks and
molecular candidates.
- Abstract(参考訳): 薬物発見のための機械学習の分野は、新しい方法の爆発を目撃している。
これらの手法は、溶解度や一般的な薬物類似性のような単純な物理化学的性質でしばしばベンチマークされ、容易に計算できる。
しかしながら、これらの性質は、主にターゲットとの相互作用に依存しないため、薬物設計における客観的機能の悪い代表である。
対照的に、分子ドッキングは結合親和性を推定する薬物発見において広く成功した方法である。
しかし、ドッキングシミュレーションは正しく設定するためにかなりの量のドメイン知識を必要とし、採用を妨げている。
そこで本研究では,(1)ドッキングスコアの簡単な計算のためのオープンソースのPythonパッケージ,(2)ドッキングスコアの広範なデータセットと58の医療関連目標に対する260Kリガンドのポーズ,(3)レグレッション,仮想スクリーニング,デノボデザインを含む医薬関連ベンチマークタスクのセットの3つのコンポーネントからなる,MLモデルの有意義かつ堅牢な比較のためのバンドルであるDOCKSTRINGを提案する。
pythonパッケージはロバストなリガンドとターゲット準備プロトコルを実装しており、非専門家が有意義なドッキングスコアを得ることができる。
当社のデータセットは、ドッキングポーズと、フルマトリックスである最初のサイズを含む最初のものなので、多目的最適化と転送学習の実験が容易になります。
その結果,ドッキングスコアは単純な物理化学的特性よりも適切な評価対象であり,より現実的なベンチマークタスクや分子候補が得られた。
関連論文リスト
- Quantum-Inspired Machine Learning for Molecular Docking [9.16729372551085]
分子ドッキングは、構造に基づく薬物設計において重要なツールであり、薬物開発効率を向上する。
結合部位やコンホメーションの探索による従来のドッキングは計算が複雑であり、盲点ドッキングでは不十分である。
量子特性と空間最適化問題を組み合わせた量子インスピレーションアルゴリズムを提案する。
本手法は従来のドッキングアルゴリズムとディープラーニングに基づくアルゴリズムを10%以上上回る性能を示した。
論文 参考訳(メタデータ) (2024-01-22T09:16:41Z) - Multi-scale Iterative Refinement towards Robust and Versatile Molecular
Docking [17.28573902701018]
分子ドッキング(英: molecular docking)は、小分子のタンパク質標的への結合コンホメーションを予測するために使われる重要な計算ツールである。
我々は、効率的な分子ドッキング用に設計された堅牢で汎用的なフレームワークであるDeltaDockを紹介する。
論文 参考訳(メタデータ) (2023-11-30T14:09:20Z) - ETDock: A Novel Equivariant Transformer for Protein-Ligand Docking [36.14826783009814]
従来のドッキング法は、タンパク質と薬物のドッキングを予測するために、スコアリング機能とディープラーニングに依存している。
本稿では,タンパク質リガンドドッキングポーズ予測のためのトランスフォーマーニューラルネットワークを提案する。
実データを用いた実験結果から,本モデルが最先端の性能を達成できることが示唆された。
論文 参考訳(メタデータ) (2023-10-12T06:23:12Z) - FABind: Fast and Accurate Protein-Ligand Binding [127.7790493202716]
$mathbfFABind$はポケット予測とドッキングを組み合わせたエンドツーエンドモデルで、正確で高速なタンパク質-リガンド結合を実現する。
提案モデルでは,既存手法と比較して有効性と効率性に強い利点が示される。
論文 参考訳(メタデータ) (2023-10-10T16:39:47Z) - Class Anchor Margin Loss for Content-Based Image Retrieval [97.81742911657497]
距離学習パラダイムに該当する新しいレペラ・トラクタ損失を提案するが、ペアを生成する必要がなく、直接L2メトリックに最適化する。
CBIRタスクにおいて,畳み込みアーキテクチャと変圧器アーキテクチャの両方を用いて,少数ショットおよびフルセットトレーニングの文脈で提案した目的を評価する。
論文 参考訳(メタデータ) (2023-06-01T12:53:10Z) - Deep Surrogate Docking: Accelerating Automated Drug Discovery with Graph
Neural Networks [0.9785311158871759]
本稿では,ディープラーニングに基づくサロゲートモデリングを適用し,ドッキングプロセスを大幅に高速化するフレームワークであるDeep Surrogate Docking(DSD)を紹介する。
我々は、DSDワークフローとFiLMv2アーキテクチャを組み合わせることで、分子スクリーニングにおける9.496倍の高速化と3%のリコールエラー率が得られることを示した。
論文 参考訳(メタデータ) (2022-11-04T19:36:02Z) - SSM-DTA: Breaking the Barriers of Data Scarcity in Drug-Target Affinity
Prediction [127.43571146741984]
薬物標的親和性(DTA)は、早期の薬物発見において極めて重要である。
湿式実験は依然として最も信頼性の高い方法であるが、時間と資源が集中している。
既存の手法は主に、データ不足の問題に適切に対処することなく、利用可能なDTAデータに基づく技術開発に重点を置いている。
SSM-DTAフレームワークについて述べる。
論文 参考訳(メタデータ) (2022-06-20T14:53:25Z) - Tyger: Task-Type-Generic Active Learning for Molecular Property
Prediction [121.97742787439546]
分子の性質を正確に予測する方法は、AIによる薬物発見において重要な問題である。
アノテーションのコストを削減するため,注釈付けのための最も代表的で情報性の高いデータのみを選択するために,深層能動学習法が開発された。
本稿では,異なるタイプの学習タスクを統一的に処理できるタスク型汎用能動的学習フレームワーク(Tyger)を提案する。
論文 参考訳(メタデータ) (2022-05-23T12:56:12Z) - Deep Learning for Virtual Screening: Five Reasons to Use ROC Cost
Functions [80.12620331438052]
深層学習は サイリコの何十億もの分子を 迅速にスクリーニングする 重要なツールとなりました
その重要性にもかかわらず、厳密なクラス不均衡、高い決定しきい値、いくつかのデータセットにおける基底真理ラベルの欠如など、これらのモデルのトレーニングにおいて重大な課題が続いている。
このような場合、クラス不均衡に対するロバスト性から、レシーバ動作特性(ROC)を直接最適化することを好んで論じる。
論文 参考訳(メタデータ) (2020-06-25T08:46:37Z) - A Trainable Optimal Transport Embedding for Feature Aggregation and its
Relationship to Attention [96.77554122595578]
固定サイズのパラメータ化表現を導入し、与えられた入力セットから、そのセットとトレーニング可能な参照の間の最適な輸送計画に従って要素を埋め込み、集約する。
我々のアプローチは大規模なデータセットにスケールし、参照のエンドツーエンドのトレーニングを可能にすると同時に、計算コストの少ない単純な教師なし学習メカニズムも提供する。
論文 参考訳(メタデータ) (2020-06-22T08:35:58Z) - We Should at Least Be Able to Design Molecules That Dock Well [5.751280593108197]
そこで本研究では,タンパク質への分子結合を評価する一般的な計算手法であるドッキングに基づくベンチマークを提案する。
グラフベース生成モデルでは,ドッキングスコアの高い分子を現実的な大きさのトレーニングセットを用いて学習すると生成できないことが観察された。
本稿では,簡易なスコアリング関数に基づくベンチマークの簡易版を提案し,テストしたモデルで部分的に解けることを示す。
論文 参考訳(メタデータ) (2020-06-20T16:40:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。