論文の概要: Pre-Training on Large-Scale Generated Docking Conformations with
HelixDock to Unlock the Potential of Protein-ligand Structure Prediction
Models
- arxiv url: http://arxiv.org/abs/2310.13913v2
- Date: Wed, 15 Nov 2023 02:29:25 GMT
- ステータス: 処理完了
- システム内更新日: 2023-11-16 19:20:29.884110
- Title: Pre-Training on Large-Scale Generated Docking Conformations with
HelixDock to Unlock the Potential of Protein-ligand Structure Prediction
Models
- Title(参考訳): タンパク質リガンド構造予測モデルの可能性を解き放つため, HelixDock を用いた大規模ドッキングコンフォーメーションの事前評価
- Authors: Lihang Liu, Donglong He, Xianbin Ye, Jingbo Zhou, Shanzhuo Zhang,
Xiaonan Zhang, Jun Li, Hua Chai, Fan Wang, Jingzhou He, Liang Zheng, Yonghui
Li, Xiaomin Fang
- Abstract要約: 本研究では,大規模ドッキングコンフォメーションにおける幾何認識SE(3)-同変ニューラルネットワークの事前学習により,優れた性能が得られることを示す。
提案モデルであるHelixDockは,物理ベースのドッキングツールによってカプセル化された物理知識を,事前学習期間中に取得することを目的としている。
- 参考スコア(独自算出の注目度): 40.743510516659896
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Protein-ligand structure prediction is an essential task in drug discovery,
predicting the binding interactions between small molecules (ligands) and
target proteins (receptors). Although conventional physics-based docking tools
are widely utilized, their accuracy is compromised by limited conformational
sampling and imprecise scoring functions. Recent advances have incorporated
deep learning techniques to improve the accuracy of structure prediction.
Nevertheless, the experimental validation of docking conformations remains
costly, it raises concerns regarding the generalizability of these deep
learning-based methods due to the limited training data. In this work, we show
that by pre-training a geometry-aware SE(3)-Equivariant neural network on a
large-scale docking conformation generated by traditional physics-based docking
tools and then fine-tuning with a limited set of experimentally validated
receptor-ligand complexes, we can achieve outstanding performance. This process
involved the generation of 100 million docking conformations, consuming roughly
1 million CPU core days. The proposed model, HelixDock, aims to acquire the
physical knowledge encapsulated by the physics-based docking tools during the
pre-training phase. HelixDock has been benchmarked against both physics-based
and deep learning-based baselines, showing that it outperforms its closest
competitor by over 40% for RMSD. HelixDock also exhibits enhanced performance
on a dataset that poses a greater challenge, thereby highlighting its
robustness. Moreover, our investigation reveals the scaling laws governing
pre-trained structure prediction models, indicating a consistent enhancement in
performance with increases in model parameters and pre-training data. This
study illuminates the strategic advantage of leveraging a vast and varied
repository of generated data to advance the frontiers of AI-driven drug
discovery.
- Abstract(参考訳): タンパク質リガンド構造予測は、小さな分子(リガンド)と標的タンパク質(受容体)の結合相互作用を予測する薬物発見において必須の課題である。
従来の物理ベースのドッキングツールは広く利用されているが、その精度は限定的なコンフォメーションサンプリングと不正確なスコアリング機能によって損なわれている。
近年,構造予測の精度向上に深層学習技術が取り入れられている。
それでもドッキングコンフォーメーションの実験的な検証はコストがかかるままであり、訓練データに制限があるため、これらの深層学習手法の一般化可能性に関する懸念が高まる。
本稿では,従来の物理ベースのドッキングツールによって生成された大規模ドッキングコンフォメーション上で,形状認識型se(3)等価ニューラルネットワークを事前学習し,実験的に検証された受容体-リガンド複合体の限られたセットで微調整することにより,優れた性能が得られることを示す。
このプロセスでは1億のドッキングコンフォメーションが発生し、およそ100万のcpuコア日が消費される。
提案モデルであるHelixDockは,物理ベースのドッキングツールによってカプセル化された物理知識の事前学習段階における獲得を目的としている。
HelixDockは物理ベースのベースラインとディープラーニングベースのベースラインの両方に対してベンチマークされている。
helixdockは、さらに大きな課題となるデータセットのパフォーマンスも向上し、堅牢性を強調している。
さらに,事前学習された構造予測モデルを規定するスケーリング則を明らかにし,モデルパラメータと事前学習データの増加に伴う性能の一貫した向上を示す。
この研究は、AIによる薬物発見のフロンティアを前進させるために、生成データの多様かつ多様なリポジトリを活用するという戦略的利点を照らす。
関連論文リスト
- Re-Dock: Towards Flexible and Realistic Molecular Docking with Diffusion
Bridge [69.80471117520719]
Re-Dockは、幾何学多様体に拡張された新しい拡散橋生成モデルである。
我々はNewton-Euler方程式にインスパイアされたエネルギー-幾何学マッピングを提案し、結合エネルギーとコンフォーメーションを共モデリングする。
アポドックやクロスドックといった設計済みのベンチマークデータセットの実験は、現在の手法よりもモデルの有効性と効率性が優れていることを示している。
論文 参考訳(メタデータ) (2024-02-18T05:04:50Z) - Towards Continual Learning Desiderata via HSIC-Bottleneck
Orthogonalization and Equiangular Embedding [55.107555305760954]
本稿では,レイヤワイドパラメータのオーバーライトや決定境界の歪みに起因する,概念的にシンプルで効果的な手法を提案する。
提案手法は,ゼロの指数バッファと1.02倍の差が絶対的に優れていても,競争精度が向上する。
論文 参考訳(メタデータ) (2024-01-17T09:01:29Z) - Multi-scale Iterative Refinement towards Robust and Versatile Molecular
Docking [17.28573902701018]
分子ドッキング(英: molecular docking)は、小分子のタンパク質標的への結合コンホメーションを予測するために使われる重要な計算ツールである。
我々は、効率的な分子ドッキング用に設計された堅牢で汎用的なフレームワークであるDeltaDockを紹介する。
論文 参考訳(メタデータ) (2023-11-30T14:09:20Z) - ETDock: A Novel Equivariant Transformer for Protein-Ligand Docking [36.14826783009814]
従来のドッキング法は、タンパク質と薬物のドッキングを予測するために、スコアリング機能とディープラーニングに依存している。
本稿では,タンパク質リガンドドッキングポーズ予測のためのトランスフォーマーニューラルネットワークを提案する。
実データを用いた実験結果から,本モデルが最先端の性能を達成できることが示唆された。
論文 参考訳(メタデータ) (2023-10-12T06:23:12Z) - PIGNet2: A Versatile Deep Learning-based Protein-Ligand Interaction
Prediction Model for Binding Affinity Scoring and Virtual Screening [0.0]
タンパク質-リガンド相互作用の予測(PLI)は、薬物発見において重要な役割を果たす。
結合親和性を正確に評価し、効率的な仮想スクリーニングを行う汎用モデルの開発は依然として課題である。
本稿では、物理インフォームドグラフニューラルネットワークと組み合わせて、新しいデータ拡張戦略を導入することにより、実現可能なソリューションを提案する。
論文 参考訳(メタデータ) (2023-07-03T14:46:49Z) - E3Bind: An End-to-End Equivariant Network for Protein-Ligand Docking [20.266157559473342]
我々は、リガンドポーズを反復的に更新するエンドツーエンドの同変ネットワークであるE3Bindを提案する。
E3Bindはドッキングにおける幾何学的制約を慎重に考慮し、タンパク質-リガンド相互作用をモデル化する。
標準ベンチマークデータセットの実験は、エンドツーエンドのトレーニング可能なモデルの優れたパフォーマンスを示しています。
論文 参考訳(メタデータ) (2022-10-12T10:25:54Z) - Physics-Inspired Temporal Learning of Quadrotor Dynamics for Accurate
Model Predictive Trajectory Tracking [76.27433308688592]
クオーロタのシステムダイナミクスを正確にモデル化することは、アジャイル、安全、安定したナビゲーションを保証する上で非常に重要です。
本稿では,ロボットの経験から,四重項系の力学を純粋に学習するための新しい物理インスパイアされた時間畳み込みネットワーク(PI-TCN)を提案する。
提案手法は,スパース時間的畳み込みと高密度フィードフォワード接続の表現力を組み合わせて,正確なシステム予測を行う。
論文 参考訳(メタデータ) (2022-06-07T13:51:35Z) - Pre-training via Denoising for Molecular Property Prediction [53.409242538744444]
本稿では,3次元分子構造の大規模データセットを平衡に利用した事前学習手法について述べる。
近年のノイズレギュラー化の進展に触発されて, 事前学習の目的は, 雑音の除去に基づくものである。
論文 参考訳(メタデータ) (2022-05-31T22:28:34Z) - Federated Learning with Unreliable Clients: Performance Analysis and
Mechanism Design [76.29738151117583]
Federated Learning(FL)は、分散クライアント間で効果的な機械学習モデルをトレーニングするための有望なツールとなっている。
しかし、低品質のモデルは信頼性の低いクライアントによってアグリゲータサーバにアップロードすることができ、劣化やトレーニングの崩壊につながる。
クライアントの信頼できない振る舞いをモデル化し、このようなセキュリティリスクを軽減するための防御メカニズムを提案する。
論文 参考訳(メタデータ) (2021-05-10T08:02:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。