論文の概要: Pre-Training on Large-Scale Generated Docking Conformations with
HelixDock to Unlock the Potential of Protein-ligand Structure Prediction
Models
- arxiv url: http://arxiv.org/abs/2310.13913v2
- Date: Wed, 15 Nov 2023 02:29:25 GMT
- ステータス: 処理完了
- システム内更新日: 2023-11-16 19:20:29.884110
- Title: Pre-Training on Large-Scale Generated Docking Conformations with
HelixDock to Unlock the Potential of Protein-ligand Structure Prediction
Models
- Title(参考訳): タンパク質リガンド構造予測モデルの可能性を解き放つため, HelixDock を用いた大規模ドッキングコンフォーメーションの事前評価
- Authors: Lihang Liu, Donglong He, Xianbin Ye, Jingbo Zhou, Shanzhuo Zhang,
Xiaonan Zhang, Jun Li, Hua Chai, Fan Wang, Jingzhou He, Liang Zheng, Yonghui
Li, Xiaomin Fang
- Abstract要約: 本研究では,大規模ドッキングコンフォメーションにおける幾何認識SE(3)-同変ニューラルネットワークの事前学習により,優れた性能が得られることを示す。
提案モデルであるHelixDockは,物理ベースのドッキングツールによってカプセル化された物理知識を,事前学習期間中に取得することを目的としている。
- 参考スコア(独自算出の注目度): 40.743510516659896
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Protein-ligand structure prediction is an essential task in drug discovery,
predicting the binding interactions between small molecules (ligands) and
target proteins (receptors). Although conventional physics-based docking tools
are widely utilized, their accuracy is compromised by limited conformational
sampling and imprecise scoring functions. Recent advances have incorporated
deep learning techniques to improve the accuracy of structure prediction.
Nevertheless, the experimental validation of docking conformations remains
costly, it raises concerns regarding the generalizability of these deep
learning-based methods due to the limited training data. In this work, we show
that by pre-training a geometry-aware SE(3)-Equivariant neural network on a
large-scale docking conformation generated by traditional physics-based docking
tools and then fine-tuning with a limited set of experimentally validated
receptor-ligand complexes, we can achieve outstanding performance. This process
involved the generation of 100 million docking conformations, consuming roughly
1 million CPU core days. The proposed model, HelixDock, aims to acquire the
physical knowledge encapsulated by the physics-based docking tools during the
pre-training phase. HelixDock has been benchmarked against both physics-based
and deep learning-based baselines, showing that it outperforms its closest
competitor by over 40% for RMSD. HelixDock also exhibits enhanced performance
on a dataset that poses a greater challenge, thereby highlighting its
robustness. Moreover, our investigation reveals the scaling laws governing
pre-trained structure prediction models, indicating a consistent enhancement in
performance with increases in model parameters and pre-training data. This
study illuminates the strategic advantage of leveraging a vast and varied
repository of generated data to advance the frontiers of AI-driven drug
discovery.
- Abstract(参考訳): タンパク質リガンド構造予測は、小さな分子(リガンド)と標的タンパク質(受容体)の結合相互作用を予測する薬物発見において必須の課題である。
従来の物理ベースのドッキングツールは広く利用されているが、その精度は限定的なコンフォメーションサンプリングと不正確なスコアリング機能によって損なわれている。
近年,構造予測の精度向上に深層学習技術が取り入れられている。
それでもドッキングコンフォーメーションの実験的な検証はコストがかかるままであり、訓練データに制限があるため、これらの深層学習手法の一般化可能性に関する懸念が高まる。
本稿では,従来の物理ベースのドッキングツールによって生成された大規模ドッキングコンフォメーション上で,形状認識型se(3)等価ニューラルネットワークを事前学習し,実験的に検証された受容体-リガンド複合体の限られたセットで微調整することにより,優れた性能が得られることを示す。
このプロセスでは1億のドッキングコンフォメーションが発生し、およそ100万のcpuコア日が消費される。
提案モデルであるHelixDockは,物理ベースのドッキングツールによってカプセル化された物理知識の事前学習段階における獲得を目的としている。
HelixDockは物理ベースのベースラインとディープラーニングベースのベースラインの両方に対してベンチマークされている。
helixdockは、さらに大きな課題となるデータセットのパフォーマンスも向上し、堅牢性を強調している。
さらに,事前学習された構造予測モデルを規定するスケーリング則を明らかにし,モデルパラメータと事前学習データの増加に伴う性能の一貫した向上を示す。
この研究は、AIによる薬物発見のフロンティアを前進させるために、生成データの多様かつ多様なリポジトリを活用するという戦略的利点を照らす。
関連論文リスト
- Dockformer: A transformer-based molecular docking paradigm for large-scale virtual screening [29.886873241333433]
複合ライブラリのサイズが大きくなるにつれて、従来のドッキングモデルの複雑さが増す。
ディープラーニングアルゴリズムは、ドッキングプロセスのスピードを高めるために、データ駆動リサーチと開発モデルを提供することができる。
本研究では,Dockformerという,ディープラーニングに基づくドッキング手法を紹介する。
論文 参考訳(メタデータ) (2024-11-11T06:25:13Z) - SPIN: SE(3)-Invariant Physics Informed Network for Binding Affinity Prediction [3.406882192023597]
タンパク質-リガンド結合親和性の正確な予測は、薬物開発に不可欠である。
伝統的な手法は、しばしば複合体の空間情報を正確にモデル化するのに失敗する。
この課題に適用可能な様々な帰納バイアスを組み込んだモデルSPINを提案する。
論文 参考訳(メタデータ) (2024-07-10T08:40:07Z) - Re-Dock: Towards Flexible and Realistic Molecular Docking with Diffusion
Bridge [69.80471117520719]
Re-Dockは、幾何学多様体に拡張された新しい拡散橋生成モデルである。
我々はNewton-Euler方程式にインスパイアされたエネルギー-幾何学マッピングを提案し、結合エネルギーとコンフォーメーションを共モデリングする。
アポドックやクロスドックといった設計済みのベンチマークデータセットの実験は、現在の手法よりもモデルの有効性と効率性が優れていることを示している。
論文 参考訳(メタデータ) (2024-02-18T05:04:50Z) - Multi-scale Iterative Refinement towards Robust and Versatile Molecular
Docking [17.28573902701018]
分子ドッキング(英: molecular docking)は、小分子のタンパク質標的への結合コンホメーションを予測するために使われる重要な計算ツールである。
我々は、効率的な分子ドッキング用に設計された堅牢で汎用的なフレームワークであるDeltaDockを紹介する。
論文 参考訳(メタデータ) (2023-11-30T14:09:20Z) - ETDock: A Novel Equivariant Transformer for Protein-Ligand Docking [36.14826783009814]
従来のドッキング法は、タンパク質と薬物のドッキングを予測するために、スコアリング機能とディープラーニングに依存している。
本稿では,タンパク質リガンドドッキングポーズ予測のためのトランスフォーマーニューラルネットワークを提案する。
実データを用いた実験結果から,本モデルが最先端の性能を達成できることが示唆された。
論文 参考訳(メタデータ) (2023-10-12T06:23:12Z) - State-specific protein-ligand complex structure prediction with a
multi-scale deep generative model [68.28309982199902]
タンパク質-リガンド複合体構造を直接予測できる計算手法であるNeuralPLexerを提案する。
我々の研究は、データ駆動型アプローチがタンパク質と小分子の構造的協調性を捉え、酵素や薬物分子などの設計を加速させる可能性を示唆している。
論文 参考訳(メタデータ) (2022-09-30T01:46:38Z) - Independent SE(3)-Equivariant Models for End-to-End Rigid Protein
Docking [57.2037357017652]
我々は、剛体タンパク質ドッキング、すなわち、個々の非結合構造からタンパク質-タンパク質複合体の3次元構造を計算的に予測する。
本研究では, タンパク質の回転と翻訳を予測し, 1つのタンパク質をドッキング位置に置くために, ペアワイズ非独立なSE(3)-等変グラフマッチングネットワークを設計する。
我々のモデルはEquiDockと呼ばれ、結合ポケットを近似し、キーポイントマッチングとアライメントを用いてドッキングポーズを予測する。
論文 参考訳(メタデータ) (2021-11-15T18:46:37Z) - Transfer Learning for Protein Structure Classification at Low Resolution [124.5573289131546]
タンパク質のクラスとアーキテクチャの正確な(geq$80%)予測を、低い(leq$3A)解像度で決定された構造から行うことができることを示す。
本稿では, 高速で低コストなタンパク質構造を低解像度で分類するための概念実証と, 機能予測への拡張の基礎を提供する。
論文 参考訳(メタデータ) (2020-08-11T15:01:32Z) - Explainable Deep Relational Networks for Predicting Compound-Protein
Affinities and Contacts [80.69440684790925]
Deep Relationsは物理にインスパイアされた、本質的に説明可能なアーキテクチャを持つディープリレーショナルネットワークである。
それは最先端技術に対する優れた解釈可能性を示している。
接触予測 9.5, 16.9, 19.3, 5.7 倍の AUPRC をテスト用、複合ユニク、タンパク質ユニク、両ユニクセットで強化する。
論文 参考訳(メタデータ) (2019-12-29T00:14:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。