Fugu-MT 論文翻訳(概要): MAPE-PPI: Towards Effective and Efficient Protein-Protein Interaction Prediction via Microenvironment-Aware Protein Embedding

論文の概要: MAPE-PPI: Towards Effective and Efficient Protein-Protein Interaction Prediction via Microenvironment-Aware Protein Embedding

arxiv url: http://arxiv.org/abs/2402.14391v1
Date: Thu, 22 Feb 2024 09:04:41 GMT
ステータス: 翻訳完了
システム内更新日: 2024-02-23 15:54:39.997985
Title: MAPE-PPI: Towards Effective and Efficient Protein-Protein Interaction Prediction via Microenvironment-Aware Protein Embedding
Title（参考訳）: MAPE-PPI : 微小環境に配慮したタンパク質埋め込みによるタンパク質とタンパク質の相互作用予測
Authors: Lirong Wu, Yijun Tian, Yufei Huang, Siyuan Li, Haitao Lin, Nitesh V Chawla, Stan Z. Li
Abstract要約: タンパク質-プロテイン相互作用(PPI)は、様々な生物学的過程において基本的であり、生命活動において重要な役割を果たしている。 MPAE-PPIは、十分に大きな「語彙」を介して、マイクロ環境を化学的に意味のある離散コードに符号化する MPAE-PPIは、数百万のPPIでPPI予測にスケールでき、有効性と計算効率のトレードオフが優れている。
参考スコア（独自算出の注目度）: 82.31506767274841
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Protein-Protein Interactions (PPIs) are fundamental in various biological processes and play a key role in life activities. The growing demand and cost of experimental PPI assays require computational methods for efficient PPI prediction. While existing methods rely heavily on protein sequence for PPI prediction, it is the protein structure that is the key to determine the interactions. To take both protein modalities into account, we define the microenvironment of an amino acid residue by its sequence and structural contexts, which describe the surrounding chemical properties and geometric features. In addition, microenvironments defined in previous work are largely based on experimentally assayed physicochemical properties, for which the "vocabulary" is usually extremely small. This makes it difficult to cover the diversity and complexity of microenvironments. In this paper, we propose Microenvironment-Aware Protein Embedding for PPI prediction (MPAE-PPI), which encodes microenvironments into chemically meaningful discrete codes via a sufficiently large microenvironment "vocabulary" (i.e., codebook). Moreover, we propose a novel pre-training strategy, namely Masked Codebook Modeling (MCM), to capture the dependencies between different microenvironments by randomly masking the codebook and reconstructing the input. With the learned microenvironment codebook, we can reuse it as an off-the-shelf tool to efficiently and effectively encode proteins of different sizes and functions for large-scale PPI prediction. Extensive experiments show that MAPE-PPI can scale to PPI prediction with millions of PPIs with superior trade-offs between effectiveness and computational efficiency than the state-of-the-art competitors.
Abstract（参考訳）: タンパク質-プロテイン相互作用(PPI)は、様々な生物学的過程において基本的であり、生命活動において重要な役割を果たしている。実験的なPPIアッセイの需要増加とコストは、効率的なPPI予測のための計算方法を必要とする。既存の手法はPPI予測のためのタンパク質配列に大きく依存しているが、相互作用を決定する鍵となるタンパク質構造である。両方のタンパク質様相を考慮に入れるために、アミノ酸残基の配列と構造的コンテクストによる微小環境を定義し、周囲の化学的性質と幾何学的特徴を記述した。加えて、以前の研究で定義された微小環境は、主に「語彙」が極端に小さい実験的に測定された物理化学的性質に基づいている。これにより、マイクロ環境の多様性と複雑さをカバーすることが困難になる。本稿では,ppi予測 (mpae-ppi) のためのマイクロ環境認識タンパク質埋め込みを提案し, 十分に大きなマイクロ環境"ボカブラリ" (すなわちコードブック) を介して, マイクロ環境を化学的に有意義な離散コードにコード化する。さらに、ランダムにコードブックをマスキングし、入力を再構築することで、異なるマイクロ環境間の依存関係を捕捉する新しい事前学習戦略、Masked Codebook Modeling (MCM)を提案する。学習したマイクロ環境コードブックを使って、オフザシェルフツールとして再利用し、異なる大きさのタンパク質を効率的に効果的にエンコードし、大規模なPPI予測を行う。大規模な実験により、MAPE-PPIは数百万のPPIでPPI予測にスケールできることが示され、その効果と計算効率のトレードオフは最先端の競合相手よりも優れている。

関連論文リスト

Self Distillation Fine-Tuning of Protein Language Models Improves Versatility in Protein Design [61.2846583160056]
Supervised Fine-tuning (SFT) は、大規模言語モデルを特殊なドメインに適応するための標準的なアプローチである。これは、高品質なアノテートされたデータは、自然言語よりもタンパク質の入手がはるかに難しいためである。生成したタンパク質配列の忠実度,信頼性,新規性を改善するために設計された,PLMの高速SFTのための簡易かつ汎用的なレシピを提案する。
論文参考訳（メタデータ） (2025-12-10T05:34:47Z)
PRING: Rethinking Protein-Protein Interaction Prediction from Pairs to Graphs [80.08310253195144]
PRINGは、タンパク質とタンパク質の相互作用予測をグラフレベルで評価する最初のベンチマークである。 PRINGは、21,484タンパク質と186,818の相互作用からなる高品質な多種PPIネットワークデータセットをキュレートする。
論文参考訳（メタデータ） (2025-07-07T15:21:05Z)
Beyond Simple Concatenation: Fairly Assessing PLM Architectures for Multi-Chain Protein-Protein Interactions Prediction [0.2509487459755192]
タンパク質とタンパク質の相互作用 (PPIs) は、多くの細胞プロセスの基礎である。 PLMはタンパク質の構造と機能を予測するのに顕著な成功を収めた。シークエンスベースのPPI結合親和性予測への応用は、いまだに未検討である。
論文参考訳（メタデータ） (2025-05-26T14:23:08Z)
Joint Masked Reconstruction and Contrastive Learning for Mining Interactions Between Proteins [4.254824555546419]
タンパク質とタンパク質の相互作用 (PPI) の予測は、細胞操作の基礎となるメカニズムを解明するための手段である。本稿では,JmcPPIと呼ばれるマスク型再構成とコントラスト学習を組み合わせた新しいPPI予測手法を提案する。 3つの広く利用されているPPIデータセットに対して行われた大規模な実験は、JmcPPIが既存の最適なベースラインモデルを上回ることを示した。
論文参考訳（メタデータ） (2025-03-06T17:39:12Z)
Extracting Inter-Protein Interactions Via Multitasking Graph Structure Learning [2.0096054368418814]
本稿では,タンパク質構造情報へのグラフアテンションを利用したMgslaPPIという新しいPPI予測手法を提案する。実験により、MgslaPPIは、様々なデータ分割方式で既存の最先端手法よりも大幅に優れていることが示された。
論文参考訳（メタデータ） (2025-01-29T11:44:49Z)
MeToken: Uniform Micro-environment Token Boosts Post-Translational Modification Prediction [65.33218256339151]
翻訳後修飾(PTM)はプロテオームの複雑さと機能を大幅に拡張する。既存の計算手法は主に、配列依存的なモチーフの認識によって引き起こされる、PTM部位を予測するタンパク質配列に焦点を当てている。本稿では,各酸のマイクロ環境をトークン化し,シーケンス情報と構造情報を統一された離散トークンに統合するMeTokenモデルを提案する。
論文参考訳（メタデータ） (2024-11-04T07:14:28Z)
Learning to Predict Mutation Effects of Protein-Protein Interactions by Microenvironment-aware Hierarchical Prompt Learning [78.38442423223832]
我々は、新しいコードブック事前学習タスク、すなわちマスク付きマイクロ環境モデリングを開発する。突然変異効果予測において、最先端の事前学習法よりも優れた性能と訓練効率を示す。
論文参考訳（メタデータ） (2024-05-16T03:53:21Z)
ProLLM: Protein Chain-of-Thoughts Enhanced LLM for Protein-Protein Interaction Prediction [54.132290875513405]
タンパク質-タンパク質相互作用(PPI)の予測は、生物学的機能や疾患を理解する上で重要である。 PPI予測に対する従来の機械学習アプローチは、主に直接的な物理的相互作用に焦点を当てていた。 PPIに適したLLMを用いた新しいフレームワークProLLMを提案する。
論文参考訳（メタデータ） (2024-03-30T05:32:42Z)
PSC-CPI: Multi-Scale Protein Sequence-Structure Contrasting for Efficient and Generalizable Compound-Protein Interaction Prediction [63.50967073653953]
化合物-タンパク質相互作用予測は、合理的な薬物発見のための化合物-タンパク質相互作用のパターンと強度を予測することを目的としている。既存のディープラーニングベースの手法では、タンパク質配列や構造が単一のモダリティしか利用していない。 CPI予測のためのマルチスケールタンパク質配列構造コントラストフレームワークを提案する。
論文参考訳（メタデータ） (2024-02-13T03:51:10Z)
Effective Protein-Protein Interaction Exploration with PPIretrieval [46.07027715907749]
PPIretrievalはタンパク質とタンパク質の相互作用を探索する最初の深層学習モデルである。 PPIretrievalは、埋め込み空間における潜在的なPPIを探し、タンパク質表面の豊富な幾何学的および化学的情報を収集する。
論文参考訳（メタデータ） (2024-02-06T03:57:06Z)
Multimodal Pre-Training Model for Sequence-based Prediction of Protein-Protein Interaction [7.022012579173686]
タンパク質モデルによる効果的な表現の学習は、タンパク質とタンパク質の相互作用において重要である。 PPIの事前学習モデルのほとんどは配列ベースであり、自然言語処理で使用される言語モデルをアミノ酸配列に導入している。本稿では, 配列, 構造, 機能という3つのモーダル性を持つマルチモーダルタンパク質事前学習モデルを提案する。
論文参考訳（メタデータ） (2021-12-09T10:21:52Z)
DIPS-Plus: The Enhanced Database of Interacting Protein Structures for Interface Prediction [2.697420611471228]
DIPS-Plusはタンパク質界面の幾何学的深層学習のための42,112複合体の強化された機能豊富なデータセットである。 DIPSの以前のバージョンは、与えられたタンパク質複合体を構成する原子のカルテシアン座標とタイプのみを含む。 DIPS-Plusには、プロテクション指標、半球アミノ酸組成、および各アミノ酸に対する新しいプロファイル隠れマルコフモデル(HMM)ベースの配列機能を含む、新しい残基レベルの特徴が多数含まれている。
論文参考訳（メタデータ） (2021-06-06T23:56:27Z)
Assigning function to protein-protein interactions: a weakly supervised BioBERT based approach using PubMed abstracts [2.208694022993555]
タンパク質とタンパク質の相互作用(PPI)は正常細胞と疾患細胞のタンパク質の機能に重要である。タンパク質相互作用データベースで取得されるPPIのごく一部に、機能アノテーションがある。本稿では,PubMed の要約に記述された関係を抽出することで,PPIの関数型をラベル付けすることを目的とする。
論文参考訳（メタデータ） (2020-08-20T01:42:28Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。