論文の概要: Pre-Training on Large-Scale Generated Docking Conformations with
HelixDock to Unlock the Potential of Protein-ligand Structure Prediction
Models
- arxiv url: http://arxiv.org/abs/2310.13913v1
- Date: Sat, 21 Oct 2023 05:54:26 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-25 04:26:42.743051
- Title: Pre-Training on Large-Scale Generated Docking Conformations with
HelixDock to Unlock the Potential of Protein-ligand Structure Prediction
Models
- Title(参考訳): タンパク質リガンド構造予測モデルの可能性を解き放つため, HelixDock を用いた大規模ドッキングコンフォーメーションの事前評価
- Authors: Lihang Liu, Donglong He, Xianbin Ye, Shanzhuo Zhang, Xiaonan Zhang,
Jingbo Zhou, Jun Li, Hua Chai, Fan Wang, Jingzhou He, Liang Zheng, Yonghui
Li, Xiaomin Fang
- Abstract要約: HelixDockは、サイト特異的な分子ドッキングの新しいアプローチである。
何百万もの結合ポーズは、様々なタンパク質標的や小さな分子を含む、伝統的なドッキングツールによって生成される。
ディープラーニングに基づくドッキングモデルであるSE(3)同変ネットワークは、この大規模データセットで事前訓練され、少数の正確な受容体-リガンド複合体構造で微調整される。
- 参考スコア(独自算出の注目度): 40.743510516659896
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Molecular docking, a pivotal computational tool for drug discovery, predicts
the binding interactions between small molecules (ligands) and target proteins
(receptors). Conventional physics-based docking tools, though widely used, face
limitations in precision due to restricted conformational sampling and
imprecise scoring functions. Recent endeavors have employed deep learning
techniques to enhance docking accuracy, but their generalization remains a
concern due to limited training data. Leveraging the success of extensive and
diverse data in other domains, we introduce HelixDock, a novel approach for
site-specific molecular docking. Hundreds of millions of binding poses are
generated by traditional docking tools, encompassing diverse protein targets
and small molecules. Our deep learning-based docking model, a SE(3)-equivariant
network, is pre-trained with this large-scale dataset and then fine-tuned with
a small number of precise receptor-ligand complex structures. Comparative
analyses against physics-based and deep learning-based baseline methods
highlight HelixDock's superiority, especially on challenging test sets. Our
study elucidates the scaling laws of the pre-trained molecular docking models,
showcasing consistent improvements with increased model parameters and
pre-train data quantities. Harnessing the power of extensive and diverse
generated data holds promise for advancing AI-driven drug discovery.
- Abstract(参考訳): 薬物発見のための重要な計算ツールである分子ドッキングは、小さな分子(配位子)と標的タンパク質(受容体)の結合相互作用を予測する。
従来の物理ベースのドッキングツールは広く使われているが、コンフォメーションサンプリングの制限とスコアリング機能の不正確さのために精度の限界に直面している。
近年,ドッキング精度を高めるためにディープラーニング技術が採用されているが,訓練データが少ないため,その一般化が懸念されている。
他の領域における広範囲かつ多様なデータの成功を活かし、サイト固有の分子ドッキングのための新しいアプローチであるhelixdockを紹介する。
何十億もの結合ポーズが伝統的なドッキングツールによって生成され、様々なタンパク質標的や小さな分子を包含する。
ディープラーニングベースのドッキングモデルであるse(3)等価ネットワークは、この大規模データセットで事前学習され、少数の正確な受容体リガンド複雑な構造で微調整されます。
物理ベースおよびディープラーニングベースライン法の比較分析は、特に挑戦的なテストセットにおいて、HelixDockの優位性を強調している。
本研究は,事前学習した分子ドッキングモデルのスケーリング則を解明し,モデルパラメータと事前学習データ量の増加による一貫した改善を示す。
広範囲で多様な生成されたデータの力を損なうことは、AIによる薬物発見を前進させる約束である。
関連論文リスト
- Training on test proteins improves fitness, structure, and function prediction [18.176929152066872]
大規模データセット上での自己教師付き事前トレーニングは、一般化を強化するための一般的な方法である。
そこで本研究では,テスト時に自己教師型微調整を行う手法を導入し,モデルがハエの関心を持つテストタンパク質に適応できるようにした。
本手法は,タンパク質の適合度予測のための標準ベンチマークにおいて,新しい最先端結果をもたらすことを示す。
論文 参考訳(メタデータ) (2024-11-04T14:23:59Z) - SPIN: SE(3)-Invariant Physics Informed Network for Binding Affinity Prediction [3.406882192023597]
タンパク質-リガンド結合親和性の正確な予測は、薬物開発に不可欠である。
伝統的な手法は、しばしば複合体の空間情報を正確にモデル化するのに失敗する。
この課題に適用可能な様々な帰納バイアスを組み込んだモデルSPINを提案する。
論文 参考訳(メタデータ) (2024-07-10T08:40:07Z) - Re-Dock: Towards Flexible and Realistic Molecular Docking with Diffusion
Bridge [69.80471117520719]
Re-Dockは、幾何学多様体に拡張された新しい拡散橋生成モデルである。
我々はNewton-Euler方程式にインスパイアされたエネルギー-幾何学マッピングを提案し、結合エネルギーとコンフォーメーションを共モデリングする。
アポドックやクロスドックといった設計済みのベンチマークデータセットの実験は、現在の手法よりもモデルの有効性と効率性が優れていることを示している。
論文 参考訳(メタデータ) (2024-02-18T05:04:50Z) - Multi-scale Iterative Refinement towards Robust and Versatile Molecular
Docking [17.28573902701018]
分子ドッキング(英: molecular docking)は、小分子のタンパク質標的への結合コンホメーションを予測するために使われる重要な計算ツールである。
我々は、効率的な分子ドッキング用に設計された堅牢で汎用的なフレームワークであるDeltaDockを紹介する。
論文 参考訳(メタデータ) (2023-11-30T14:09:20Z) - ETDock: A Novel Equivariant Transformer for Protein-Ligand Docking [36.14826783009814]
従来のドッキング法は、タンパク質と薬物のドッキングを予測するために、スコアリング機能とディープラーニングに依存している。
本稿では,タンパク質リガンドドッキングポーズ予測のためのトランスフォーマーニューラルネットワークを提案する。
実データを用いた実験結果から,本モデルが最先端の性能を達成できることが示唆された。
論文 参考訳(メタデータ) (2023-10-12T06:23:12Z) - State-specific protein-ligand complex structure prediction with a
multi-scale deep generative model [68.28309982199902]
タンパク質-リガンド複合体構造を直接予測できる計算手法であるNeuralPLexerを提案する。
我々の研究は、データ駆動型アプローチがタンパク質と小分子の構造的協調性を捉え、酵素や薬物分子などの設計を加速させる可能性を示唆している。
論文 参考訳(メタデータ) (2022-09-30T01:46:38Z) - Independent SE(3)-Equivariant Models for End-to-End Rigid Protein
Docking [57.2037357017652]
我々は、剛体タンパク質ドッキング、すなわち、個々の非結合構造からタンパク質-タンパク質複合体の3次元構造を計算的に予測する。
本研究では, タンパク質の回転と翻訳を予測し, 1つのタンパク質をドッキング位置に置くために, ペアワイズ非独立なSE(3)-等変グラフマッチングネットワークを設計する。
我々のモデルはEquiDockと呼ばれ、結合ポケットを近似し、キーポイントマッチングとアライメントを用いてドッキングポーズを予測する。
論文 参考訳(メタデータ) (2021-11-15T18:46:37Z) - Transfer Learning for Protein Structure Classification at Low Resolution [124.5573289131546]
タンパク質のクラスとアーキテクチャの正確な(geq$80%)予測を、低い(leq$3A)解像度で決定された構造から行うことができることを示す。
本稿では, 高速で低コストなタンパク質構造を低解像度で分類するための概念実証と, 機能予測への拡張の基礎を提供する。
論文 参考訳(メタデータ) (2020-08-11T15:01:32Z) - Explainable Deep Relational Networks for Predicting Compound-Protein
Affinities and Contacts [80.69440684790925]
Deep Relationsは物理にインスパイアされた、本質的に説明可能なアーキテクチャを持つディープリレーショナルネットワークである。
それは最先端技術に対する優れた解釈可能性を示している。
接触予測 9.5, 16.9, 19.3, 5.7 倍の AUPRC をテスト用、複合ユニク、タンパク質ユニク、両ユニクセットで強化する。
論文 参考訳(メタデータ) (2019-12-29T00:14:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。