論文の概要: MAPE-PPI: Towards Effective and Efficient Protein-Protein Interaction
Prediction via Microenvironment-Aware Protein Embedding
- arxiv url: http://arxiv.org/abs/2402.14391v1
- Date: Thu, 22 Feb 2024 09:04:41 GMT
- ステータス: 処理完了
- システム内更新日: 2024-02-23 15:54:39.997985
- Title: MAPE-PPI: Towards Effective and Efficient Protein-Protein Interaction
Prediction via Microenvironment-Aware Protein Embedding
- Title(参考訳): MAPE-PPI : 微小環境に配慮したタンパク質埋め込みによるタンパク質とタンパク質の相互作用予測
- Authors: Lirong Wu, Yijun Tian, Yufei Huang, Siyuan Li, Haitao Lin, Nitesh V
Chawla, Stan Z. Li
- Abstract要約: タンパク質-プロテイン相互作用(PPI)は、様々な生物学的過程において基本的であり、生命活動において重要な役割を果たしている。
MPAE-PPIは、十分に大きな「語彙」を介して、マイクロ環境を化学的に意味のある離散コードに符号化する
MPAE-PPIは、数百万のPPIでPPI予測にスケールでき、有効性と計算効率のトレードオフが優れている。
- 参考スコア(独自算出の注目度): 82.31506767274841
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Protein-Protein Interactions (PPIs) are fundamental in various biological
processes and play a key role in life activities. The growing demand and cost
of experimental PPI assays require computational methods for efficient PPI
prediction. While existing methods rely heavily on protein sequence for PPI
prediction, it is the protein structure that is the key to determine the
interactions. To take both protein modalities into account, we define the
microenvironment of an amino acid residue by its sequence and structural
contexts, which describe the surrounding chemical properties and geometric
features. In addition, microenvironments defined in previous work are largely
based on experimentally assayed physicochemical properties, for which the
"vocabulary" is usually extremely small. This makes it difficult to cover the
diversity and complexity of microenvironments. In this paper, we propose
Microenvironment-Aware Protein Embedding for PPI prediction (MPAE-PPI), which
encodes microenvironments into chemically meaningful discrete codes via a
sufficiently large microenvironment "vocabulary" (i.e., codebook). Moreover, we
propose a novel pre-training strategy, namely Masked Codebook Modeling (MCM),
to capture the dependencies between different microenvironments by randomly
masking the codebook and reconstructing the input. With the learned
microenvironment codebook, we can reuse it as an off-the-shelf tool to
efficiently and effectively encode proteins of different sizes and functions
for large-scale PPI prediction. Extensive experiments show that MAPE-PPI can
scale to PPI prediction with millions of PPIs with superior trade-offs between
effectiveness and computational efficiency than the state-of-the-art
competitors.
- Abstract(参考訳): タンパク質-プロテイン相互作用(PPI)は、様々な生物学的過程において基本的であり、生命活動において重要な役割を果たしている。
実験的なPPIアッセイの需要増加とコストは、効率的なPPI予測のための計算方法を必要とする。
既存の手法はPPI予測のためのタンパク質配列に大きく依存しているが、相互作用を決定する鍵となるタンパク質構造である。
両方のタンパク質様相を考慮に入れるために、アミノ酸残基の配列と構造的コンテクストによる微小環境を定義し、周囲の化学的性質と幾何学的特徴を記述した。
加えて、以前の研究で定義された微小環境は、主に「語彙」が極端に小さい実験的に測定された物理化学的性質に基づいている。
これにより、マイクロ環境の多様性と複雑さをカバーすることが困難になる。
本稿では,ppi予測 (mpae-ppi) のためのマイクロ環境認識タンパク質埋め込みを提案し, 十分に大きなマイクロ環境"ボカブラリ" (すなわちコードブック) を介して, マイクロ環境を化学的に有意義な離散コードにコード化する。
さらに、ランダムにコードブックをマスキングし、入力を再構築することで、異なるマイクロ環境間の依存関係を捕捉する新しい事前学習戦略、Masked Codebook Modeling (MCM)を提案する。
学習したマイクロ環境コードブックを使って、オフザシェルフツールとして再利用し、異なる大きさのタンパク質を効率的に効果的にエンコードし、大規模なPPI予測を行う。
大規模な実験により、MAPE-PPIは数百万のPPIでPPI予測にスケールできることが示され、その効果と計算効率のトレードオフは最先端の競合相手よりも優れている。
関連論文リスト
- PSC-CPI: Multi-Scale Protein Sequence-Structure Contrasting for
Efficient and Generalizable Compound-Protein Interaction Prediction [63.50967073653953]
化合物-タンパク質相互作用予測は、合理的な薬物発見のための化合物-タンパク質相互作用のパターンと強度を予測することを目的としている。
既存のディープラーニングベースの手法では、タンパク質配列や構造が単一のモダリティしか利用していない。
CPI予測のためのマルチスケールタンパク質配列構造コントラストフレームワークを提案する。
論文 参考訳(メタデータ) (2024-02-13T03:51:10Z) - Effective Protein-Protein Interaction Exploration with PPIretrieval [46.07027715907749]
PPIretrievalはタンパク質とタンパク質の相互作用を探索する最初の深層学習モデルである。
PPIretrievalは、埋め込み空間における潜在的なPPIを探し、タンパク質表面の豊富な幾何学的および化学的情報を収集する。
論文 参考訳(メタデータ) (2024-02-06T03:57:06Z) - Accurate Machine Learned Quantum-Mechanical Force Fields for
Biomolecular Simulations [51.68332623405432]
分子動力学(MD)シミュレーションは、化学的および生物学的プロセスに関する原子論的な洞察を可能にする。
近年,MDシミュレーションの代替手段として機械学習力場(MLFF)が出現している。
本研究は、大規模分子シミュレーションのための正確なMLFFを構築するための一般的なアプローチを提案する。
論文 参考訳(メタデータ) (2022-05-17T13:08:28Z) - A Supervised Machine Learning Approach for Sequence Based
Protein-protein Interaction (PPI) Prediction [4.916874464940376]
計算タンパク質間相互作用(PPI)予測技術は、時間、コスト、偽陽性相互作用の低減に大きく貢献する。
提案したソリューションをSeqPIPコンペティションの結果とともに紹介した。
論文 参考訳(メタデータ) (2022-03-23T18:27:25Z) - Multimodal Pre-Training Model for Sequence-based Prediction of
Protein-Protein Interaction [7.022012579173686]
タンパク質モデルによる効果的な表現の学習は、タンパク質とタンパク質の相互作用において重要である。
PPIの事前学習モデルのほとんどは配列ベースであり、自然言語処理で使用される言語モデルをアミノ酸配列に導入している。
本稿では, 配列, 構造, 機能という3つのモーダル性を持つマルチモーダルタンパク質事前学習モデルを提案する。
論文 参考訳(メタデータ) (2021-12-09T10:21:52Z) - Pre-training Co-evolutionary Protein Representation via A Pairwise
Masked Language Model [93.9943278892735]
タンパク質配列表現学習の鍵となる問題は、配列中の残基間の共変量によって反映される共進化情報をキャプチャすることである。
Pairwise Masked Language Model (PMLM) と呼ばれる専用言語モデルによる事前学習により,この情報を直接キャプチャする新しい手法を提案する。
提案手法は, 相互関係を効果的に把握し, ベースラインと比較して, 接触予測性能を最大9%向上できることを示す。
論文 参考訳(メタデータ) (2021-10-29T04:01:32Z) - DIPS-Plus: The Enhanced Database of Interacting Protein Structures for
Interface Prediction [2.697420611471228]
DIPS-Plusはタンパク質界面の幾何学的深層学習のための42,112複合体の強化された機能豊富なデータセットである。
DIPSの以前のバージョンは、与えられたタンパク質複合体を構成する原子のカルテシアン座標とタイプのみを含む。
DIPS-Plusには、プロテクション指標、半球アミノ酸組成、および各アミノ酸に対する新しいプロファイル隠れマルコフモデル(HMM)ベースの配列機能を含む、新しい残基レベルの特徴が多数含まれている。
論文 参考訳(メタデータ) (2021-06-06T23:56:27Z) - EBM-Fold: Fully-Differentiable Protein Folding Powered by Energy-based
Models [53.17320541056843]
本研究では,データ駆動型生成ネットワークを用いたタンパク質構造最適化手法を提案する。
EBM-Foldアプローチは,従来のロゼッタ構造最適化ルーチンと比較して,高品質なデコイを効率よく生成できる。
論文 参考訳(メタデータ) (2021-05-11T03:40:29Z) - Assigning function to protein-protein interactions: a weakly supervised
BioBERT based approach using PubMed abstracts [2.208694022993555]
タンパク質とタンパク質の相互作用(PPI)は正常細胞と疾患細胞のタンパク質の機能に重要である。
タンパク質相互作用データベースで取得されるPPIのごく一部に、機能アノテーションがある。
本稿では,PubMed の要約に記述された関係を抽出することで,PPIの関数型をラベル付けすることを目的とする。
論文 参考訳(メタデータ) (2020-08-20T01:42:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。