論文の概要: APObind: A Dataset of Ligand Unbound Protein Conformations for Machine
Learning Applications in De Novo Drug Design
- arxiv url: http://arxiv.org/abs/2108.09926v1
- Date: Mon, 23 Aug 2021 04:29:38 GMT
- ステータス: 処理完了
- システム内更新日: 2021-08-24 15:57:04.388889
- Title: APObind: A Dataset of Ligand Unbound Protein Conformations for Machine
Learning Applications in De Novo Drug Design
- Title(参考訳): APObind:De Novoドラッグデザインにおける機械学習応用のためのリガンド非結合タンパク質のデータセット
- Authors: Rishal Aggarwal, Akash Gupta, U Deva Priyakumar
- Abstract要約: PDBbindデータセットに存在するタンパク質のアポコンフォメーションを提供することを目的としたAPObindというデータセットを提案する。
本稿では,このデータセット上での3つのユースケースに特有の手法の性能について検討し,APObindデータセット上での検証の重要性を示す。
- 参考スコア(独自算出の注目度): 3.9824631668067507
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Protein-ligand complex structures have been utilised to design benchmark
machine learning methods that perform important tasks related to drug design
such as receptor binding site detection, small molecule docking and binding
affinity prediction. However, these methods are usually trained on only ligand
bound (or holo) conformations of the protein and therefore are not guaranteed
to perform well when the protein structure is in its native unbound
conformation (or apo), which is usually the conformation available for a newly
identified receptor. A primary reason for this is that the local structure of
the binding site usually changes upon ligand binding. To facilitate solutions
for this problem, we propose a dataset called APObind that aims to provide apo
conformations of proteins present in the PDBbind dataset, a popular dataset
used in drug design. Furthermore, we explore the performance of methods
specific to three use cases on this dataset, through which, the importance of
validating them on the APObind dataset is demonstrated.
- Abstract(参考訳): タンパク質リガンド複合体構造は、受容体結合部位の検出、小さな分子ドッキング、結合親和性予測などの薬物設計に関連する重要なタスクを実行するベンチマーク機械学習手法を設計するために利用されてきた。
しかし、これらの方法は通常、タンパク質のリガンド結合(またはホロ)配座のみに基づいて訓練されるため、タンパク質構造がネイティブなアンバウンド配座(apo)にある場合、通常は新しく同定された受容体の配座である場合、うまく機能することが保証されない。
主な理由は、結合部位の局所構造が通常、リガンド結合によって変化するからである。
この問題を解決するため,我々は pdbbind データセットに存在するタンパク質の apo コンフォーメーションを提供することを目的とした apobind というデータセットを提案する。
さらに,本データセット上の3つのユースケースに特有の手法の性能について検討し,APObindデータセット上での検証の重要性を示す。
関連論文リスト
- MeToken: Uniform Micro-environment Token Boosts Post-Translational Modification Prediction [65.33218256339151]
翻訳後修飾(PTM)はプロテオームの複雑さと機能を大幅に拡張する。
既存の計算手法は主に、配列依存的なモチーフの認識によって引き起こされる、PTM部位を予測するタンパク質配列に焦点を当てている。
本稿では,各酸のマイクロ環境をトークン化し,シーケンス情報と構造情報を統一された離散トークンに統合するMeTokenモデルを提案する。
論文 参考訳(メタデータ) (2024-11-04T07:14:28Z) - CoPRA: Bridging Cross-domain Pretrained Sequence Models with Complex Structures for Protein-RNA Binding Affinity Prediction [23.1499716310298]
我々は,タンパク質-RNA結合親和性データセットPRA310を構築し,性能評価を行った。
我々は,(1)タンパク質-RNA結合親和性,(2)変異による結合親和性の変化を正確に予測できること,(3)データのスケーリングとモデルサイズによるメリットを広く分析し,検証する。
論文 参考訳(メタデータ) (2024-08-21T09:48:22Z) - ProLLM: Protein Chain-of-Thoughts Enhanced LLM for Protein-Protein Interaction Prediction [54.132290875513405]
タンパク質-タンパク質相互作用(PPI)の予測は、生物学的機能や疾患を理解する上で重要である。
PPI予測に対する従来の機械学習アプローチは、主に直接的な物理的相互作用に焦点を当てていた。
PPIに適したLLMを用いた新しいフレームワークProLLMを提案する。
論文 参考訳(メタデータ) (2024-03-30T05:32:42Z) - PSC-CPI: Multi-Scale Protein Sequence-Structure Contrasting for
Efficient and Generalizable Compound-Protein Interaction Prediction [63.50967073653953]
化合物-タンパク質相互作用予測は、合理的な薬物発見のための化合物-タンパク質相互作用のパターンと強度を予測することを目的としている。
既存のディープラーニングベースの手法では、タンパク質配列や構造が単一のモダリティしか利用していない。
CPI予測のためのマルチスケールタンパク質配列構造コントラストフレームワークを提案する。
論文 参考訳(メタデータ) (2024-02-13T03:51:10Z) - Protein-ligand binding representation learning from fine-grained
interactions [29.965890962846093]
本稿では,タンパク質-リガンド結合表現を自己教師付き学習方式で学習することを提案する。
この自己教師付き学習問題は、決定的結合複素構造の予測として定式化される。
様々なバインディングタスクに対して,本手法の優位性を示す実験を行った。
論文 参考訳(メタデータ) (2023-11-09T01:33:09Z) - ETDock: A Novel Equivariant Transformer for Protein-Ligand Docking [36.14826783009814]
従来のドッキング法は、タンパク質と薬物のドッキングを予測するために、スコアリング機能とディープラーニングに依存している。
本稿では,タンパク質リガンドドッキングポーズ予測のためのトランスフォーマーニューラルネットワークを提案する。
実データを用いた実験結果から,本モデルが最先端の性能を達成できることが示唆された。
論文 参考訳(メタデータ) (2023-10-12T06:23:12Z) - ProFSA: Self-supervised Pocket Pretraining via Protein
Fragment-Surroundings Alignment [20.012210194899605]
本稿では,高分解能原子タンパク質構造からの知識を活用したポケット事前学習手法を提案する。
ProFSAと命名された本手法は,ポケットの薬剤性予測など,様々なタスクにおける最先端性能を実現する。
我々の研究は、高品質で多様なタンパク質構造データベースを活用することにより、タンパク質-リガンド複合体データの不足を軽減するための新たな道を開く。
論文 参考訳(メタデータ) (2023-10-11T06:36:23Z) - DiffDock-PP: Rigid Protein-Protein Docking with Diffusion Models [47.73386438748902]
DiffDock-PPは拡散生成モデルであり、非有界タンパク質構造をそれらの有界配座に翻訳し回転させる。
中央値C-RMSDが4.85でDIPSの最先端性能を達成し,すべてのベースラインを上回りました。
論文 参考訳(メタデータ) (2023-04-08T02:10:44Z) - State-specific protein-ligand complex structure prediction with a
multi-scale deep generative model [68.28309982199902]
タンパク質-リガンド複合体構造を直接予測できる計算手法であるNeuralPLexerを提案する。
我々の研究は、データ駆動型アプローチがタンパク質と小分子の構造的協調性を捉え、酵素や薬物分子などの設計を加速させる可能性を示唆している。
論文 参考訳(メタデータ) (2022-09-30T01:46:38Z) - HelixFold-Single: MSA-free Protein Structure Prediction by Using Protein
Language Model as an Alternative [61.984700682903096]
HelixFold-Singleは、大規模なタンパク質言語モデルとAlphaFold2の優れた幾何学的学習能力を組み合わせるために提案されている。
提案手法は,数千万の一次配列を持つ大規模タンパク質言語モデルを事前学習する。
我々は、一次系列のみから原子の3次元座標を予測するために、エンドツーエンドの微分可能なモデルを得る。
論文 参考訳(メタデータ) (2022-07-28T07:30:33Z) - Protein 3D structure-based neural networks highly improve the accuracy
in compound-protein binding affinity prediction [7.059949221160259]
我々は,タンパク質3D構造情報の複合タンパク質結合親和性(CPAs)予測への応用を容易にするために,高速進化的注意と粗いグラフニューラルネットワーク(FeatNN)を開発した。
FeatNNはCPA予測において様々な最先端のベースラインをかなり上回り、ピアソン値は約35.7%上昇した。
論文 参考訳(メタデータ) (2022-03-30T00:44:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。