論文の概要: GeoPep: A geometry-aware masked language model for protein-peptide binding site prediction
- arxiv url: http://arxiv.org/abs/2510.27040v1
- Date: Thu, 30 Oct 2025 22:58:02 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-03 17:52:15.928732
- Title: GeoPep: A geometry-aware masked language model for protein-peptide binding site prediction
- Title(参考訳): GeoPep:タンパク質-ペプチド結合部位予測のための幾何学的マスキング言語モデル
- Authors: Dian Chen, Yunkai Chen, Tong Lin, Sijie Chen, Xiaolin Cheng,
- Abstract要約: ペプチド結合サイト予測のための新しいフレームワークであるGeoPepを紹介する。
GeoPepファインチューンESM3のタンパク質-タンパク質結合からの豊富な事前学習表現は、タンパク質-ペプチド結合データの限られた可用性に対処する。
- 参考スコア(独自算出の注目度): 4.517623379283838
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Multimodal approaches that integrate protein structure and sequence have achieved remarkable success in protein-protein interface prediction. However, extending these methods to protein-peptide interactions remains challenging due to the inherent conformational flexibility of peptides and the limited availability of structural data that hinder direct training of structure-aware models. To address these limitations, we introduce GeoPep, a novel framework for peptide binding site prediction that leverages transfer learning from ESM3, a multimodal protein foundation model. GeoPep fine-tunes ESM3's rich pre-learned representations from protein-protein binding to address the limited availability of protein-peptide binding data. The fine-tuned model is further integrated with a parameter-efficient neural network architecture capable of learning complex patterns from sparse data. Furthermore, the model is trained using distance-based loss functions that exploit 3D structural information to enhance binding site prediction. Comprehensive evaluations demonstrate that GeoPep significantly outperforms existing methods in protein-peptide binding site prediction by effectively capturing sparse and heterogeneous binding patterns.
- Abstract(参考訳): タンパク質の構造と配列を統合するマルチモーダルアプローチは、タンパク質-タンパク質界面の予測において顕著な成功を収めた。
しかしながら、これらの手法をタンパク質-ペプチド相互作用に拡張することは、ペプチドの固有のコンフォメーションの柔軟性と、構造認識モデルの直接的な訓練を妨げる構造データの限られた可用性のために、依然として困難である。
これらの制約に対処するため,マルチモーダルタンパク質基盤モデルであるESM3からの転写学習を活用する,ペプチド結合部位予測のための新しいフレームワークであるGeoPepを紹介した。
GeoPepファインチューンESM3のタンパク質-タンパク質結合からの豊富な事前学習表現は、タンパク質-ペプチド結合データの限られた可用性に対処する。
微調整されたモデルは、スパースデータから複雑なパターンを学習できるパラメータ効率のよいニューラルネットワークアーキテクチャとさらに統合される。
さらに,3次元構造情報を利用する距離ベース損失関数を用いて,結合部位予測の精度向上を図る。
総合的な評価から、GeoPepはスパースおよびヘテロジニアス結合パターンを効果的に捉えることにより、タンパク質-ペプチド結合部位の予測において既存の手法を著しく上回っていることが示されている。
関連論文リスト
- PRING: Rethinking Protein-Protein Interaction Prediction from Pairs to Graphs [88.98041407783502]
PRINGは、タンパク質とタンパク質の相互作用予測をグラフレベルで評価する最初のベンチマークである。
PRINGは、21,484タンパク質と186,818の相互作用からなる高品質な多種PPIネットワークデータセットをキュレートする。
論文 参考訳(メタデータ) (2025-07-07T15:21:05Z) - SFM-Protein: Integrative Co-evolutionary Pre-training for Advanced Protein Sequence Representation [97.99658944212675]
タンパク質基盤モデルのための新しい事前学習戦略を導入する。
アミノ酸残基間の相互作用を強調し、短距離および長距離の共進化的特徴の抽出を強化する。
大規模タンパク質配列データセットを用いて学習し,より優れた一般化能力を示す。
論文 参考訳(メタデータ) (2024-10-31T15:22:03Z) - Protein binding affinity prediction under multiple substitutions applying eGNNs on Residue and Atomic graphs combined with Language model information: eGRAL [1.840390797252648]
ディープラーニングは、シリコン内予測と生体内観測のギャップを埋めることのできる強力なツールとして、ますます認識されている。
タンパク質複合体中のアミノ酸置換物からの結合親和性変化を予測するための新しいグラフニューラルネットワークアーキテクチャであるeGRALを提案する。
eGralは、タンパク質の大規模言語モデルから抽出された特徴のおかげで、残基、原子スケール、進化スケールを利用する。
論文 参考訳(メタデータ) (2024-05-03T10:33:19Z) - Endowing Protein Language Models with Structural Knowledge [5.587293092389789]
本稿では,タンパク質構造データを統合することにより,タンパク質言語モデルを強化する新しいフレームワークを提案する。
PST(Protein Structure Transformer)と呼ばれる精製モデルは、小さなタンパク質構造データベース上でさらに事前訓練されている。
PSTは、タンパク質配列の最先端基盤モデルであるESM-2を一貫して上回り、タンパク質機能予測の新しいベンチマークを設定している。
論文 参考訳(メタデータ) (2024-01-26T12:47:54Z) - State-specific protein-ligand complex structure prediction with a
multi-scale deep generative model [68.28309982199902]
タンパク質-リガンド複合体構造を直接予測できる計算手法であるNeuralPLexerを提案する。
我々の研究は、データ駆動型アプローチがタンパク質と小分子の構造的協調性を捉え、酵素や薬物分子などの設計を加速させる可能性を示唆している。
論文 参考訳(メタデータ) (2022-09-30T01:46:38Z) - Learning Geometrically Disentangled Representations of Protein Folding
Simulations [72.03095377508856]
この研究は、薬物標的タンパク質の構造的アンサンブルに基づいて生成ニューラルネットワークを学習することに焦点を当てている。
モデル課題は、様々な薬物分子に結合したタンパク質の構造的変動を特徴付けることである。
その結果,我々の幾何学的学習に基づく手法は,複雑な構造変化を生成するための精度と効率の両方を享受できることがわかった。
論文 参考訳(メタデータ) (2022-05-20T19:38:00Z) - Protein 3D structure-based neural networks highly improve the accuracy
in compound-protein binding affinity prediction [7.059949221160259]
我々は,タンパク質3D構造情報の複合タンパク質結合親和性(CPAs)予測への応用を容易にするために,高速進化的注意と粗いグラフニューラルネットワーク(FeatNN)を開発した。
FeatNNはCPA予測において様々な最先端のベースラインをかなり上回り、ピアソン値は約35.7%上昇した。
論文 参考訳(メタデータ) (2022-03-30T00:44:15Z) - PersGNN: Applying Topological Data Analysis and Geometric Deep Learning
to Structure-Based Protein Function Prediction [0.07340017786387766]
本研究では,タンパク質構造を分離し,タンパク質データバンク内のタンパク質の機能的アノテーションを作成する。
本稿では,グラフ表現学習とトポロジカルデータ解析を組み合わせた,エンドツーエンドのトレーニング可能なディープラーニングモデルPersGNNを提案する。
論文 参考訳(メタデータ) (2020-10-30T02:24:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。