論文の概要: Cross-Modality Protein Embedding for Compound-Protein Affinity and
Contact Prediction
- arxiv url: http://arxiv.org/abs/2012.00651v1
- Date: Sat, 14 Nov 2020 04:42:25 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-25 14:03:26.866576
- Title: Cross-Modality Protein Embedding for Compound-Protein Affinity and
Contact Prediction
- Title(参考訳): 複合プロテイン親和性と接触予測のためのクロスモーダルタンパク質埋め込み
- Authors: Yuning You, Yang Shen
- Abstract要約: タンパク質を1Dアミノ酸配列と(シーケンス予測)2D残基ペア接触マップを含むマルチモーダルデータとみなす。
CPAC予測の精度と一般化性において,2つの単一モードの埋め込みを実証的に評価した。
- 参考スコア(独自算出の注目度): 15.955668586941472
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Compound-protein pairs dominate FDA-approved drug-target pairs and the
prediction of compound-protein affinity and contact (CPAC) could help
accelerate drug discovery. In this study we consider proteins as multi-modal
data including 1D amino-acid sequences and (sequence-predicted) 2D residue-pair
contact maps. We empirically evaluate the embeddings of the two single
modalities in their accuracy and generalizability of CPAC prediction (i.e.
structure-free interpretable compound-protein affinity prediction). And we
rationalize their performances in both challenges of embedding individual
modalities and learning generalizable embedding-label relationship. We further
propose two models involving cross-modality protein embedding and establish
that the one with cross interaction (thus capturing correlations among
modalities) outperforms SOTAs and our single modality models in affinity,
contact, and binding-site predictions for proteins never seen in the training
set.
- Abstract(参考訳): 化合物タンパク質対はFDAが承認した薬物標的対を支配し、化合物タンパク質親和性と接触(CPAC)の予測は薬物発見の促進に役立つ。
本研究では,タンパク質を1Dアミノ酸配列と2D残基ペア接触マップを含むマルチモーダルデータとみなす。
CPAC予測の精度と一般化性(構造のない解釈可能な複合タンパク質親和性予測)における2つの単一モダリティの埋め込みを実験的に評価した。
個々のモダリティの埋め込みと一般化可能な埋め込み-ラベル関係の学習という課題において,それらのパフォーマンスを合理化する。
さらに, クロスモダリティタンパク質の埋め込みを含む2つのモデルを提案し, 相互相互作用(モダリティ間の相関を捉える)を持つモデルが, トレーニングセットにないタンパク質の親和性, 接触性, 結合部位予測において, SOTAおよび我々の単一モダリティモデルより優れていることを示す。
関連論文リスト
- SFM-Protein: Integrative Co-evolutionary Pre-training for Advanced Protein Sequence Representation [97.99658944212675]
タンパク質基盤モデルのための新しい事前学習戦略を導入する。
アミノ酸残基間の相互作用を強調し、短距離および長距離の共進化的特徴の抽出を強化する。
大規模タンパク質配列データセットを用いて学習し,より優れた一般化能力を示す。
論文 参考訳(メタデータ) (2024-10-31T15:22:03Z) - DPLM-2: A Multimodal Diffusion Protein Language Model [75.98083311705182]
DPLM-2は, 離散拡散タンパク質言語モデル(DPLM)を拡張し, 配列と構造の両方に適合する多モーダルタンパク質基盤モデルである。
DPLM-2は、配列と構造、およびその限界と条件の結合分布を学習する。
実験によりDPLM-2は高度に互換性のあるアミノ酸配列とそれに対応する3D構造を同時に生成できることが示された。
論文 参考訳(メタデータ) (2024-10-17T17:20:24Z) - CoPRA: Bridging Cross-domain Pretrained Sequence Models with Complex Structures for Protein-RNA Binding Affinity Prediction [23.1499716310298]
我々は,タンパク質-RNA結合親和性データセットPRA310を構築し,性能評価を行った。
我々は,(1)タンパク質-RNA結合親和性,(2)変異による結合親和性の変化を正確に予測できること,(3)データのスケーリングとモデルサイズによるメリットを広く分析し,検証する。
論文 参考訳(メタデータ) (2024-08-21T09:48:22Z) - Accurate Prediction of Ligand-Protein Interaction Affinities with Fine-Tuned Small Language Models [0.0]
SLMによるリガンド-タンパク質相互作用(LPI)の精度予測について述べる。
本研究は,機械学習(ML)と自由エネルギー摂動(FEP+)に基づく手法よりも,LPI親和性の範囲を正確に予測できることを示す。
論文 参考訳(メタデータ) (2024-06-27T13:04:58Z) - ProLLM: Protein Chain-of-Thoughts Enhanced LLM for Protein-Protein Interaction Prediction [54.132290875513405]
タンパク質-タンパク質相互作用(PPI)の予測は、生物学的機能や疾患を理解する上で重要である。
PPI予測に対する従来の機械学習アプローチは、主に直接的な物理的相互作用に焦点を当てていた。
PPIに適したLLMを用いた新しいフレームワークProLLMを提案する。
論文 参考訳(メタデータ) (2024-03-30T05:32:42Z) - PSC-CPI: Multi-Scale Protein Sequence-Structure Contrasting for
Efficient and Generalizable Compound-Protein Interaction Prediction [63.50967073653953]
化合物-タンパク質相互作用予測は、合理的な薬物発見のための化合物-タンパク質相互作用のパターンと強度を予測することを目的としている。
既存のディープラーニングベースの手法では、タンパク質配列や構造が単一のモダリティしか利用していない。
CPI予測のためのマルチスケールタンパク質配列構造コントラストフレームワークを提案する。
論文 参考訳(メタデータ) (2024-02-13T03:51:10Z) - Improving Protein-peptide Interface Predictions in the Low Data Regime [0.0]
本稿では,バイモーダルトランスを用いたタンパク質-ペプチド相互作用の予測手法を提案する。
界面残基-残基相互作用の分布は界面残基-残基相互作用と重なり合うことを示す。
このデータ拡張により、PepBDBで利用可能な膨大な量のタンパク質のみのデータを活用して、ニューラルネットワークをトレーニングできます。
論文 参考訳(メタデータ) (2023-05-31T17:04:27Z) - State-specific protein-ligand complex structure prediction with a
multi-scale deep generative model [68.28309982199902]
タンパク質-リガンド複合体構造を直接予測できる計算手法であるNeuralPLexerを提案する。
我々の研究は、データ駆動型アプローチがタンパク質と小分子の構造的協調性を捉え、酵素や薬物分子などの設計を加速させる可能性を示唆している。
論文 参考訳(メタデータ) (2022-09-30T01:46:38Z) - Explainable Deep Relational Networks for Predicting Compound-Protein
Affinities and Contacts [80.69440684790925]
Deep Relationsは物理にインスパイアされた、本質的に説明可能なアーキテクチャを持つディープリレーショナルネットワークである。
それは最先端技術に対する優れた解釈可能性を示している。
接触予測 9.5, 16.9, 19.3, 5.7 倍の AUPRC をテスト用、複合ユニク、タンパク質ユニク、両ユニクセットで強化する。
論文 参考訳(メタデータ) (2019-12-29T00:14:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。