論文の概要: DOCKSTRING: easy molecular docking yields better benchmarks for ligand
design
- arxiv url: http://arxiv.org/abs/2110.15486v1
- Date: Fri, 29 Oct 2021 01:37:13 GMT
- ステータス: 処理完了
- システム内更新日: 2021-11-01 23:03:42.684920
- Title: DOCKSTRING: easy molecular docking yields better benchmarks for ligand
design
- Title(参考訳): DOCKSTRING:分子ドッキングはリガンド設計のためのより良いベンチマークをもたらす
- Authors: Miguel Garc\'ia-Orteg\'on, Gregor N. C. Simm, Austin J. Tripp, Jos\'e
Miguel Hern\'andez-Lobato, Andreas Bender and Sergio Bacallado
- Abstract要約: 本稿では、3つのコンポーネントからなる機械学習モデルの有意義かつ堅牢な比較のためのバンドルであるDOCKSTRINGを提案する。
Pythonパッケージはロバストなリガンドとターゲットの準備プロトコルを実装しており、非専門家が意味のあるドッキングスコアを得ることができる。
私たちのデータセットには、ドッキングのポーズと、フルマトリックスである最初のサイズが含まれています。
- 参考スコア(独自算出の注目度): 3.848364262836075
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The field of machine learning for drug discovery is witnessing an explosion
of novel methods. These methods are often benchmarked on simple physicochemical
properties such as solubility or general druglikeness, which can be readily
computed. However, these properties are poor representatives of objective
functions in drug design, mainly because they do not depend on the candidate's
interaction with the target. By contrast, molecular docking is a widely
successful method in drug discovery to estimate binding affinities. However,
docking simulations require a significant amount of domain knowledge to set up
correctly which hampers adoption. To this end, we present DOCKSTRING, a bundle
for meaningful and robust comparison of ML models consisting of three
components: (1) an open-source Python package for straightforward computation
of docking scores; (2) an extensive dataset of docking scores and poses of more
than 260K ligands for 58 medically-relevant targets; and (3) a set of
pharmaceutically-relevant benchmark tasks including regression, virtual
screening, and de novo design. The Python package implements a robust ligand
and target preparation protocol that allows non-experts to obtain meaningful
docking scores. Our dataset is the first to include docking poses, as well as
the first of its size that is a full matrix, thus facilitating experiments in
multiobjective optimization and transfer learning. Overall, our results
indicate that docking scores are a more appropriate evaluation objective than
simple physicochemical properties, yielding more realistic benchmark tasks and
molecular candidates.
- Abstract(参考訳): 薬物発見のための機械学習の分野は、新しい方法の爆発を目撃している。
これらの手法は、溶解度や一般的な薬物類似性のような単純な物理化学的性質でしばしばベンチマークされ、容易に計算できる。
しかしながら、これらの性質は、主にターゲットとの相互作用に依存しないため、薬物設計における客観的機能の悪い代表である。
対照的に、分子ドッキングは結合親和性を推定する薬物発見において広く成功した方法である。
しかし、ドッキングシミュレーションは正しく設定するためにかなりの量のドメイン知識を必要とし、採用を妨げている。
そこで本研究では,(1)ドッキングスコアの簡単な計算のためのオープンソースのPythonパッケージ,(2)ドッキングスコアの広範なデータセットと58の医療関連目標に対する260Kリガンドのポーズ,(3)レグレッション,仮想スクリーニング,デノボデザインを含む医薬関連ベンチマークタスクのセットの3つのコンポーネントからなる,MLモデルの有意義かつ堅牢な比較のためのバンドルであるDOCKSTRINGを提案する。
pythonパッケージはロバストなリガンドとターゲット準備プロトコルを実装しており、非専門家が有意義なドッキングスコアを得ることができる。
当社のデータセットは、ドッキングポーズと、フルマトリックスである最初のサイズを含む最初のものなので、多目的最適化と転送学習の実験が容易になります。
その結果,ドッキングスコアは単純な物理化学的特性よりも適切な評価対象であり,より現実的なベンチマークタスクや分子候補が得られた。
関連論文リスト
- Dockformer: A transformer-based molecular docking paradigm for large-scale virtual screening [29.886873241333433]
複合ライブラリのサイズが大きくなるにつれて、従来のドッキングモデルの複雑さが増す。
ディープラーニングアルゴリズムは、ドッキングプロセスのスピードを高めるために、データ駆動リサーチと開発モデルを提供することができる。
本研究では,Dockformerという,ディープラーニングに基づくドッキング手法を紹介する。
論文 参考訳(メタデータ) (2024-11-11T06:25:13Z) - One-step Structure Prediction and Screening for Protein-Ligand Complexes using Multi-Task Geometric Deep Learning [6.605588716386855]
マルチタスク幾何学的深層学習に基づいて,LigPoseを1つのモデル,すなわちLigPoseに正確に取り組めることを示す。
LigPoseはリガンドとタンパク質のペアをグラフとして表現し、結合強度と原子間相互作用を補助的なタスクとして学習する。
実験によると、LigPoseは薬物研究の主要な課題について最先端のパフォーマンスを達成した。
論文 参考訳(メタデータ) (2024-08-21T05:53:50Z) - Smiles2Dock: an open large-scale multi-task dataset for ML-based molecular docking [0.0]
分子ドッキングのための大規模マルチタスクデータセットであるSmiles2Dockを紹介する。
我々は、ChEMBLデータベースから15のAlphaFoldタンパク質に170万をドッキングし、2500万以上のタンパク質-リガンド結合スコアを与えました。
我々のデータセットとコードは、分子ドッキングのための新しいMLベースの手法の開発を支援するために公開されています。
論文 参考訳(メタデータ) (2024-06-09T11:13:03Z) - Multi-scale Iterative Refinement towards Robust and Versatile Molecular
Docking [17.28573902701018]
分子ドッキング(英: molecular docking)は、小分子のタンパク質標的への結合コンホメーションを予測するために使われる重要な計算ツールである。
我々は、効率的な分子ドッキング用に設計された堅牢で汎用的なフレームワークであるDeltaDockを紹介する。
論文 参考訳(メタデータ) (2023-11-30T14:09:20Z) - FABind: Fast and Accurate Protein-Ligand Binding [127.7790493202716]
$mathbfFABind$はポケット予測とドッキングを組み合わせたエンドツーエンドモデルで、正確で高速なタンパク質-リガンド結合を実現する。
提案モデルでは,既存手法と比較して有効性と効率性に強い利点が示される。
論文 参考訳(メタデータ) (2023-10-10T16:39:47Z) - Class Anchor Margin Loss for Content-Based Image Retrieval [97.81742911657497]
距離学習パラダイムに該当する新しいレペラ・トラクタ損失を提案するが、ペアを生成する必要がなく、直接L2メトリックに最適化する。
CBIRタスクにおいて,畳み込みアーキテクチャと変圧器アーキテクチャの両方を用いて,少数ショットおよびフルセットトレーニングの文脈で提案した目的を評価する。
論文 参考訳(メタデータ) (2023-06-01T12:53:10Z) - SSM-DTA: Breaking the Barriers of Data Scarcity in Drug-Target Affinity
Prediction [127.43571146741984]
薬物標的親和性(DTA)は、早期の薬物発見において極めて重要である。
湿式実験は依然として最も信頼性の高い方法であるが、時間と資源が集中している。
既存の手法は主に、データ不足の問題に適切に対処することなく、利用可能なDTAデータに基づく技術開発に重点を置いている。
SSM-DTAフレームワークについて述べる。
論文 参考訳(メタデータ) (2022-06-20T14:53:25Z) - Tyger: Task-Type-Generic Active Learning for Molecular Property
Prediction [121.97742787439546]
分子の性質を正確に予測する方法は、AIによる薬物発見において重要な問題である。
アノテーションのコストを削減するため,注釈付けのための最も代表的で情報性の高いデータのみを選択するために,深層能動学習法が開発された。
本稿では,異なるタイプの学習タスクを統一的に処理できるタスク型汎用能動的学習フレームワーク(Tyger)を提案する。
論文 参考訳(メタデータ) (2022-05-23T12:56:12Z) - Deep Learning for Virtual Screening: Five Reasons to Use ROC Cost
Functions [80.12620331438052]
深層学習は サイリコの何十億もの分子を 迅速にスクリーニングする 重要なツールとなりました
その重要性にもかかわらず、厳密なクラス不均衡、高い決定しきい値、いくつかのデータセットにおける基底真理ラベルの欠如など、これらのモデルのトレーニングにおいて重大な課題が続いている。
このような場合、クラス不均衡に対するロバスト性から、レシーバ動作特性(ROC)を直接最適化することを好んで論じる。
論文 参考訳(メタデータ) (2020-06-25T08:46:37Z) - A Trainable Optimal Transport Embedding for Feature Aggregation and its
Relationship to Attention [96.77554122595578]
固定サイズのパラメータ化表現を導入し、与えられた入力セットから、そのセットとトレーニング可能な参照の間の最適な輸送計画に従って要素を埋め込み、集約する。
我々のアプローチは大規模なデータセットにスケールし、参照のエンドツーエンドのトレーニングを可能にすると同時に、計算コストの少ない単純な教師なし学習メカニズムも提供する。
論文 参考訳(メタデータ) (2020-06-22T08:35:58Z) - We Should at Least Be Able to Design Molecules That Dock Well [5.751280593108197]
そこで本研究では,タンパク質への分子結合を評価する一般的な計算手法であるドッキングに基づくベンチマークを提案する。
グラフベース生成モデルでは,ドッキングスコアの高い分子を現実的な大きさのトレーニングセットを用いて学習すると生成できないことが観察された。
本稿では,簡易なスコアリング関数に基づくベンチマークの簡易版を提案し,テストしたモデルで部分的に解けることを示す。
論文 参考訳(メタデータ) (2020-06-20T16:40:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。