論文の概要: Pre-Training on Large-Scale Generated Docking Conformations with
HelixDock to Unlock the Potential of Protein-ligand Structure Prediction
Models
- arxiv url: http://arxiv.org/abs/2310.13913v1
- Date: Sat, 21 Oct 2023 05:54:26 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-25 04:26:42.743051
- Title: Pre-Training on Large-Scale Generated Docking Conformations with
HelixDock to Unlock the Potential of Protein-ligand Structure Prediction
Models
- Title(参考訳): タンパク質リガンド構造予測モデルの可能性を解き放つため, HelixDock を用いた大規模ドッキングコンフォーメーションの事前評価
- Authors: Lihang Liu, Donglong He, Xianbin Ye, Shanzhuo Zhang, Xiaonan Zhang,
Jingbo Zhou, Jun Li, Hua Chai, Fan Wang, Jingzhou He, Liang Zheng, Yonghui
Li, Xiaomin Fang
- Abstract要約: HelixDockは、サイト特異的な分子ドッキングの新しいアプローチである。
何百万もの結合ポーズは、様々なタンパク質標的や小さな分子を含む、伝統的なドッキングツールによって生成される。
ディープラーニングに基づくドッキングモデルであるSE(3)同変ネットワークは、この大規模データセットで事前訓練され、少数の正確な受容体-リガンド複合体構造で微調整される。
- 参考スコア(独自算出の注目度): 40.743510516659896
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Molecular docking, a pivotal computational tool for drug discovery, predicts
the binding interactions between small molecules (ligands) and target proteins
(receptors). Conventional physics-based docking tools, though widely used, face
limitations in precision due to restricted conformational sampling and
imprecise scoring functions. Recent endeavors have employed deep learning
techniques to enhance docking accuracy, but their generalization remains a
concern due to limited training data. Leveraging the success of extensive and
diverse data in other domains, we introduce HelixDock, a novel approach for
site-specific molecular docking. Hundreds of millions of binding poses are
generated by traditional docking tools, encompassing diverse protein targets
and small molecules. Our deep learning-based docking model, a SE(3)-equivariant
network, is pre-trained with this large-scale dataset and then fine-tuned with
a small number of precise receptor-ligand complex structures. Comparative
analyses against physics-based and deep learning-based baseline methods
highlight HelixDock's superiority, especially on challenging test sets. Our
study elucidates the scaling laws of the pre-trained molecular docking models,
showcasing consistent improvements with increased model parameters and
pre-train data quantities. Harnessing the power of extensive and diverse
generated data holds promise for advancing AI-driven drug discovery.
- Abstract(参考訳): 薬物発見のための重要な計算ツールである分子ドッキングは、小さな分子(配位子)と標的タンパク質(受容体)の結合相互作用を予測する。
従来の物理ベースのドッキングツールは広く使われているが、コンフォメーションサンプリングの制限とスコアリング機能の不正確さのために精度の限界に直面している。
近年,ドッキング精度を高めるためにディープラーニング技術が採用されているが,訓練データが少ないため,その一般化が懸念されている。
他の領域における広範囲かつ多様なデータの成功を活かし、サイト固有の分子ドッキングのための新しいアプローチであるhelixdockを紹介する。
何十億もの結合ポーズが伝統的なドッキングツールによって生成され、様々なタンパク質標的や小さな分子を包含する。
ディープラーニングベースのドッキングモデルであるse(3)等価ネットワークは、この大規模データセットで事前学習され、少数の正確な受容体リガンド複雑な構造で微調整されます。
物理ベースおよびディープラーニングベースライン法の比較分析は、特に挑戦的なテストセットにおいて、HelixDockの優位性を強調している。
本研究は,事前学習した分子ドッキングモデルのスケーリング則を解明し,モデルパラメータと事前学習データ量の増加による一貫した改善を示す。
広範囲で多様な生成されたデータの力を損なうことは、AIによる薬物発見を前進させる約束である。
関連論文リスト
- Re-Dock: Towards Flexible and Realistic Molecular Docking with Diffusion
Bridge [69.80471117520719]
Re-Dockは、幾何学多様体に拡張された新しい拡散橋生成モデルである。
我々はNewton-Euler方程式にインスパイアされたエネルギー-幾何学マッピングを提案し、結合エネルギーとコンフォーメーションを共モデリングする。
アポドックやクロスドックといった設計済みのベンチマークデータセットの実験は、現在の手法よりもモデルの有効性と効率性が優れていることを示している。
論文 参考訳(メタデータ) (2024-02-18T05:04:50Z) - Towards Continual Learning Desiderata via HSIC-Bottleneck
Orthogonalization and Equiangular Embedding [55.107555305760954]
本稿では,レイヤワイドパラメータのオーバーライトや決定境界の歪みに起因する,概念的にシンプルで効果的な手法を提案する。
提案手法は,ゼロの指数バッファと1.02倍の差が絶対的に優れていても,競争精度が向上する。
論文 参考訳(メタデータ) (2024-01-17T09:01:29Z) - Multi-scale Iterative Refinement towards Robust and Versatile Molecular
Docking [17.28573902701018]
分子ドッキング(英: molecular docking)は、小分子のタンパク質標的への結合コンホメーションを予測するために使われる重要な計算ツールである。
我々は、効率的な分子ドッキング用に設計された堅牢で汎用的なフレームワークであるDeltaDockを紹介する。
論文 参考訳(メタデータ) (2023-11-30T14:09:20Z) - ETDock: A Novel Equivariant Transformer for Protein-Ligand Docking [36.14826783009814]
従来のドッキング法は、タンパク質と薬物のドッキングを予測するために、スコアリング機能とディープラーニングに依存している。
本稿では,タンパク質リガンドドッキングポーズ予測のためのトランスフォーマーニューラルネットワークを提案する。
実データを用いた実験結果から,本モデルが最先端の性能を達成できることが示唆された。
論文 参考訳(メタデータ) (2023-10-12T06:23:12Z) - PIGNet2: A Versatile Deep Learning-based Protein-Ligand Interaction
Prediction Model for Binding Affinity Scoring and Virtual Screening [0.0]
タンパク質-リガンド相互作用の予測(PLI)は、薬物発見において重要な役割を果たす。
結合親和性を正確に評価し、効率的な仮想スクリーニングを行う汎用モデルの開発は依然として課題である。
本稿では、物理インフォームドグラフニューラルネットワークと組み合わせて、新しいデータ拡張戦略を導入することにより、実現可能なソリューションを提案する。
論文 参考訳(メタデータ) (2023-07-03T14:46:49Z) - E3Bind: An End-to-End Equivariant Network for Protein-Ligand Docking [20.266157559473342]
我々は、リガンドポーズを反復的に更新するエンドツーエンドの同変ネットワークであるE3Bindを提案する。
E3Bindはドッキングにおける幾何学的制約を慎重に考慮し、タンパク質-リガンド相互作用をモデル化する。
標準ベンチマークデータセットの実験は、エンドツーエンドのトレーニング可能なモデルの優れたパフォーマンスを示しています。
論文 参考訳(メタデータ) (2022-10-12T10:25:54Z) - Physics-Inspired Temporal Learning of Quadrotor Dynamics for Accurate
Model Predictive Trajectory Tracking [76.27433308688592]
クオーロタのシステムダイナミクスを正確にモデル化することは、アジャイル、安全、安定したナビゲーションを保証する上で非常に重要です。
本稿では,ロボットの経験から,四重項系の力学を純粋に学習するための新しい物理インスパイアされた時間畳み込みネットワーク(PI-TCN)を提案する。
提案手法は,スパース時間的畳み込みと高密度フィードフォワード接続の表現力を組み合わせて,正確なシステム予測を行う。
論文 参考訳(メタデータ) (2022-06-07T13:51:35Z) - Pre-training via Denoising for Molecular Property Prediction [53.409242538744444]
本稿では,3次元分子構造の大規模データセットを平衡に利用した事前学習手法について述べる。
近年のノイズレギュラー化の進展に触発されて, 事前学習の目的は, 雑音の除去に基づくものである。
論文 参考訳(メタデータ) (2022-05-31T22:28:34Z) - Federated Learning with Unreliable Clients: Performance Analysis and
Mechanism Design [76.29738151117583]
Federated Learning(FL)は、分散クライアント間で効果的な機械学習モデルをトレーニングするための有望なツールとなっている。
しかし、低品質のモデルは信頼性の低いクライアントによってアグリゲータサーバにアップロードすることができ、劣化やトレーニングの崩壊につながる。
クライアントの信頼できない振る舞いをモデル化し、このようなセキュリティリスクを軽減するための防御メカニズムを提案する。
論文 参考訳(メタデータ) (2021-05-10T08:02:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。