Fugu-MT 論文翻訳(概要): DOCKSTRING: easy molecular docking yields better benchmarks for ligand design

論文の概要: DOCKSTRING: easy molecular docking yields better benchmarks for ligand design

arxiv url: http://arxiv.org/abs/2110.15486v1
Date: Fri, 29 Oct 2021 01:37:13 GMT
ステータス: 翻訳完了
システム内更新日: 2021-11-01 23:03:42.684920
Title: DOCKSTRING: easy molecular docking yields better benchmarks for ligand design
Title（参考訳）: DOCKSTRING:分子ドッキングはリガンド設計のためのより良いベンチマークをもたらす
Authors: Miguel Garc\'ia-Orteg\'on, Gregor N. C. Simm, Austin J. Tripp, Jos\'e Miguel Hern\'andez-Lobato, Andreas Bender and Sergio Bacallado
Abstract要約: 本稿では、3つのコンポーネントからなる機械学習モデルの有意義かつ堅牢な比較のためのバンドルであるDOCKSTRINGを提案する。 Pythonパッケージはロバストなリガンドとターゲットの準備プロトコルを実装しており、非専門家が意味のあるドッキングスコアを得ることができる。私たちのデータセットには、ドッキングのポーズと、フルマトリックスである最初のサイズが含まれています。
参考スコア（独自算出の注目度）: 3.848364262836075
License: http://creativecommons.org/licenses/by/4.0/
Abstract: The field of machine learning for drug discovery is witnessing an explosion of novel methods. These methods are often benchmarked on simple physicochemical properties such as solubility or general druglikeness, which can be readily computed. However, these properties are poor representatives of objective functions in drug design, mainly because they do not depend on the candidate's interaction with the target. By contrast, molecular docking is a widely successful method in drug discovery to estimate binding affinities. However, docking simulations require a significant amount of domain knowledge to set up correctly which hampers adoption. To this end, we present DOCKSTRING, a bundle for meaningful and robust comparison of ML models consisting of three components: (1) an open-source Python package for straightforward computation of docking scores; (2) an extensive dataset of docking scores and poses of more than 260K ligands for 58 medically-relevant targets; and (3) a set of pharmaceutically-relevant benchmark tasks including regression, virtual screening, and de novo design. The Python package implements a robust ligand and target preparation protocol that allows non-experts to obtain meaningful docking scores. Our dataset is the first to include docking poses, as well as the first of its size that is a full matrix, thus facilitating experiments in multiobjective optimization and transfer learning. Overall, our results indicate that docking scores are a more appropriate evaluation objective than simple physicochemical properties, yielding more realistic benchmark tasks and molecular candidates.
Abstract（参考訳）: 薬物発見のための機械学習の分野は、新しい方法の爆発を目撃している。これらの手法は、溶解度や一般的な薬物類似性のような単純な物理化学的性質でしばしばベンチマークされ、容易に計算できる。しかしながら、これらの性質は、主にターゲットとの相互作用に依存しないため、薬物設計における客観的機能の悪い代表である。対照的に、分子ドッキングは結合親和性を推定する薬物発見において広く成功した方法である。しかし、ドッキングシミュレーションは正しく設定するためにかなりの量のドメイン知識を必要とし、採用を妨げている。そこで本研究では,(1)ドッキングスコアの簡単な計算のためのオープンソースのPythonパッケージ,(2)ドッキングスコアの広範なデータセットと58の医療関連目標に対する260Kリガンドのポーズ,(3)レグレッション,仮想スクリーニング,デノボデザインを含む医薬関連ベンチマークタスクのセットの3つのコンポーネントからなる,MLモデルの有意義かつ堅牢な比較のためのバンドルであるDOCKSTRINGを提案する。 pythonパッケージはロバストなリガンドとターゲット準備プロトコルを実装しており、非専門家が有意義なドッキングスコアを得ることができる。当社のデータセットは、ドッキングポーズと、フルマトリックスである最初のサイズを含む最初のものなので、多目的最適化と転送学習の実験が容易になります。その結果,ドッキングスコアは単純な物理化学的特性よりも適切な評価対象であり,より現実的なベンチマークタスクや分子候補が得られた。

関連論文リスト

PoseX: AI Defeats Physics Approaches on Protein-Ligand Cross Docking [74.76447568426276]
PoseXは、セルフドッキングとクロスドッキングの両方を評価するためのオープンソースのベンチマークである。 23のドッキング法を3つの方法論カテゴリに組み込んだ。我々は,コンフォメーションエネルギーを最小化し,結合ポーズを洗練するために,後処理の緩和法を開発した。
論文参考訳（メタデータ） (2025-05-03T05:35:37Z)
Fast and Accurate Blind Flexible Docking [79.88520988144442]
小分子(配位子)のタンパク質標的への結合構造を予測する分子ドッキングは、薬物発見において重要な役割を果たす。本研究では,現実的な視覚的フレキシブルドッキングシナリオを対象とした,高速かつ高精度な回帰ベースマルチタスク学習モデルであるFABFlexを提案する。
論文参考訳（メタデータ） (2025-02-20T07:31:13Z)
Dockformer: A transformer-based molecular docking paradigm for large-scale virtual screening [29.886873241333433]
複合ライブラリのサイズが大きくなるにつれて、従来のドッキングモデルの複雑さが増す。ディープラーニングアルゴリズムは、ドッキングプロセスのスピードを高めるために、データ駆動リサーチと開発モデルを提供することができる。本研究では,Dockformerという,ディープラーニングに基づくドッキング手法を紹介する。
論文参考訳（メタデータ） (2024-11-11T06:25:13Z)
One-step Structure Prediction and Screening for Protein-Ligand Complexes using Multi-Task Geometric Deep Learning [6.605588716386855]
マルチタスク幾何学的深層学習に基づいて,LigPoseを1つのモデル,すなわちLigPoseに正確に取り組めることを示す。 LigPoseはリガンドとタンパク質のペアをグラフとして表現し、結合強度と原子間相互作用を補助的なタスクとして学習する。実験によると、LigPoseは薬物研究の主要な課題について最先端のパフォーマンスを達成した。
論文参考訳（メタデータ） (2024-08-21T05:53:50Z)
Smiles2Dock: an open large-scale multi-task dataset for ML-based molecular docking [0.0]
分子ドッキングのための大規模マルチタスクデータセットであるSmiles2Dockを紹介する。我々は、ChEMBLデータベースから15のAlphaFoldタンパク質に170万をドッキングし、2500万以上のタンパク質-リガンド結合スコアを与えました。我々のデータセットとコードは、分子ドッキングのための新しいMLベースの手法の開発を支援するために公開されています。
論文参考訳（メタデータ） (2024-06-09T11:13:03Z)
Multi-scale Iterative Refinement towards Robust and Versatile Molecular Docking [17.28573902701018]
分子ドッキング(英: molecular docking)は、小分子のタンパク質標的への結合コンホメーションを予測するために使われる重要な計算ツールである。我々は、効率的な分子ドッキング用に設計された堅牢で汎用的なフレームワークであるDeltaDockを紹介する。
論文参考訳（メタデータ） (2023-11-30T14:09:20Z)
FABind: Fast and Accurate Protein-Ligand Binding [127.7790493202716]
$mathbfFABind$はポケット予測とドッキングを組み合わせたエンドツーエンドモデルで、正確で高速なタンパク質-リガンド結合を実現する。提案モデルでは,既存手法と比較して有効性と効率性に強い利点が示される。
論文参考訳（メタデータ） (2023-10-10T16:39:47Z)
Class Anchor Margin Loss for Content-Based Image Retrieval [97.81742911657497]
距離学習パラダイムに該当する新しいレペラ・トラクタ損失を提案するが、ペアを生成する必要がなく、直接L2メトリックに最適化する。 CBIRタスクにおいて,畳み込みアーキテクチャと変圧器アーキテクチャの両方を用いて,少数ショットおよびフルセットトレーニングの文脈で提案した目的を評価する。
論文参考訳（メタデータ） (2023-06-01T12:53:10Z)
SSM-DTA: Breaking the Barriers of Data Scarcity in Drug-Target Affinity Prediction [127.43571146741984]
薬物標的親和性(DTA)は、早期の薬物発見において極めて重要である。湿式実験は依然として最も信頼性の高い方法であるが、時間と資源が集中している。既存の手法は主に、データ不足の問題に適切に対処することなく、利用可能なDTAデータに基づく技術開発に重点を置いている。 SSM-DTAフレームワークについて述べる。
論文参考訳（メタデータ） (2022-06-20T14:53:25Z)
Tyger: Task-Type-Generic Active Learning for Molecular Property Prediction [121.97742787439546]
分子の性質を正確に予測する方法は、AIによる薬物発見において重要な問題である。アノテーションのコストを削減するため,注釈付けのための最も代表的で情報性の高いデータのみを選択するために,深層能動学習法が開発された。本稿では,異なるタイプの学習タスクを統一的に処理できるタスク型汎用能動的学習フレームワーク(Tyger)を提案する。
論文参考訳（メタデータ） (2022-05-23T12:56:12Z)
Deep Learning for Virtual Screening: Five Reasons to Use ROC Cost Functions [80.12620331438052]
深層学習はサイリコの何十億もの分子を迅速にスクリーニングする重要なツールとなりましたその重要性にもかかわらず、厳密なクラス不均衡、高い決定しきい値、いくつかのデータセットにおける基底真理ラベルの欠如など、これらのモデルのトレーニングにおいて重大な課題が続いている。このような場合、クラス不均衡に対するロバスト性から、レシーバ動作特性(ROC)を直接最適化することを好んで論じる。
論文参考訳（メタデータ） (2020-06-25T08:46:37Z)
A Trainable Optimal Transport Embedding for Feature Aggregation and its Relationship to Attention [96.77554122595578]
固定サイズのパラメータ化表現を導入し、与えられた入力セットから、そのセットとトレーニング可能な参照の間の最適な輸送計画に従って要素を埋め込み、集約する。我々のアプローチは大規模なデータセットにスケールし、参照のエンドツーエンドのトレーニングを可能にすると同時に、計算コストの少ない単純な教師なし学習メカニズムも提供する。
論文参考訳（メタデータ） (2020-06-22T08:35:58Z)
We Should at Least Be Able to Design Molecules That Dock Well [5.751280593108197]
そこで本研究では,タンパク質への分子結合を評価する一般的な計算手法であるドッキングに基づくベンチマークを提案する。グラフベース生成モデルでは,ドッキングスコアの高い分子を現実的な大きさのトレーニングセットを用いて学習すると生成できないことが観察された。本稿では,簡易なスコアリング関数に基づくベンチマークの簡易版を提案し,テストしたモデルで部分的に解けることを示す。
論文参考訳（メタデータ） (2020-06-20T16:40:56Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。