論文の概要: Extracting Inter-Protein Interactions Via Multitasking Graph Structure Learning
- arxiv url: http://arxiv.org/abs/2501.17589v1
- Date: Wed, 29 Jan 2025 11:44:49 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-01-30 15:52:53.885249
- Title: Extracting Inter-Protein Interactions Via Multitasking Graph Structure Learning
- Title(参考訳): マルチタスクグラフ構造学習によるプロテイン間相互作用の抽出
- Authors: Jiang Li, Yuan-Ting Li,
- Abstract要約: 本稿では,タンパク質構造情報へのグラフアテンションを利用したMgslaPPIという新しいPPI予測手法を提案する。
実験により、MgslaPPIは、様々なデータ分割方式で既存の最先端手法よりも大幅に優れていることが示された。
- 参考スコア(独自算出の注目度): 2.0096054368418814
- License:
- Abstract: Identifying protein-protein interactions (PPI) is crucial for gaining in-depth insights into numerous biological processes within cells and holds significant guiding value in areas such as drug development and disease treatment. Currently, most PPI prediction methods focus primarily on the study of protein sequences, neglecting the critical role of the internal structure of proteins. This paper proposes a novel PPI prediction method named MgslaPPI, which utilizes graph attention to mine protein structural information and enhances the expressive power of the protein encoder through multitask learning strategy. Specifically, we decompose the end-to-end PPI prediction process into two stages: amino acid residue reconstruction (A2RR) and protein interaction prediction (PIP). In the A2RR stage, we employ a graph attention-based residue reconstruction method to explore the internal relationships and features of proteins. In the PIP stage, in addition to the basic interaction prediction task, we introduce two auxiliary tasks, i.e., protein feature reconstruction (PFR) and masked interaction prediction (MIP). The PFR task aims to reconstruct the representation of proteins in the PIP stage, while the MIP task uses partially masked protein features for PPI prediction, with both working in concert to prompt MgslaPPI to capture more useful information. Experimental results demonstrate that MgslaPPI significantly outperforms existing state-of-the-art methods under various data partitioning schemes.
- Abstract(参考訳): タンパク質とタンパク質の相互作用(PPI)の同定は、細胞内の多くの生物学的過程の深い洞察を得るために不可欠であり、薬物開発や疾患治療などの分野で重要な指針となる。
現在、ほとんどのPPI予測法はタンパク質配列の研究に重点を置いており、タンパク質の内部構造の重要な役割を無視している。
本稿では,MgslaPPIという新しいPPI予測手法を提案する。この手法は,タンパク質構造情報に対するグラフアテンションを利用して,マルチタスク学習戦略を通じて,タンパク質エンコーダの表現力を高める。
具体的には、エンド・ツー・エンドのPPI予測プロセスを、アミノ酸残基再構成(A2RR)とタンパク質相互作用予測(PIP)の2段階に分解する。
A2RRの段階では、タンパク質の内部関係と特徴を探索するために、グラフアテンションに基づく残基再構成法を用いる。
PIPの段階では、基本的な相互作用予測タスクに加えて、タンパク質特徴再構成(PFR)とマスク相互作用予測(MIP)という2つの補助タスクを導入する。
PFRタスクは、PIP段階でのタンパク質の表現を再構築することを目的としており、MIPタスクはPPI予測のために部分的にマスキングされたタンパク質の特徴を使用しており、両者はMgslaPPIにより有用な情報を取得するよう促している。
実験により、MgslaPPIは、様々なデータ分割方式で既存の最先端手法よりも大幅に優れていることが示された。
関連論文リスト
- MeToken: Uniform Micro-environment Token Boosts Post-Translational Modification Prediction [65.33218256339151]
翻訳後修飾(PTM)はプロテオームの複雑さと機能を大幅に拡張する。
既存の計算手法は主に、配列依存的なモチーフの認識によって引き起こされる、PTM部位を予測するタンパク質配列に焦点を当てている。
本稿では,各酸のマイクロ環境をトークン化し,シーケンス情報と構造情報を統一された離散トークンに統合するMeTokenモデルを提案する。
論文 参考訳(メタデータ) (2024-11-04T07:14:28Z) - Long-context Protein Language Model [76.95505296417866]
言語モデル(LM)の自己教師による訓練は、有意義な表現の学習や創薬設計において、タンパク質配列に大きな成功を収めている。
ほとんどのタンパク質LMは、短い文脈長を持つ個々のタンパク質に基づいて訓練されたトランスフォーマーアーキテクチャに基づいている。
そこで我々は,選択的構造化状態空間モデルから構築した代替のタンパク質LMアーキテクチャであるBiMamba-Sに基づくLC-PLMを提案する。
また、第2段階のトレーニングのために、タンパク質-タンパク質相互作用グラフの文脈化を行うLC-PLM-Gも導入した。
論文 参考訳(メタデータ) (2024-10-29T16:43:28Z) - ProLLM: Protein Chain-of-Thoughts Enhanced LLM for Protein-Protein Interaction Prediction [54.132290875513405]
タンパク質-タンパク質相互作用(PPI)の予測は、生物学的機能や疾患を理解する上で重要である。
PPI予測に対する従来の機械学習アプローチは、主に直接的な物理的相互作用に焦点を当てていた。
PPIに適したLLMを用いた新しいフレームワークProLLMを提案する。
論文 参考訳(メタデータ) (2024-03-30T05:32:42Z) - MAPE-PPI: Towards Effective and Efficient Protein-Protein Interaction
Prediction via Microenvironment-Aware Protein Embedding [82.31506767274841]
タンパク質-プロテイン相互作用(PPI)は、様々な生物学的過程において基本的であり、生命活動において重要な役割を果たしている。
MPAE-PPIは、十分に大きな「語彙」を介して、マイクロ環境を化学的に意味のある離散コードに符号化する
MPAE-PPIは、数百万のPPIでPPI予測にスケールでき、有効性と計算効率のトレードオフが優れている。
論文 参考訳(メタデータ) (2024-02-22T09:04:41Z) - PSC-CPI: Multi-Scale Protein Sequence-Structure Contrasting for
Efficient and Generalizable Compound-Protein Interaction Prediction [63.50967073653953]
化合物-タンパク質相互作用予測は、合理的な薬物発見のための化合物-タンパク質相互作用のパターンと強度を予測することを目的としている。
既存のディープラーニングベースの手法では、タンパク質配列や構造が単一のモダリティしか利用していない。
CPI予測のためのマルチスケールタンパク質配列構造コントラストフレームワークを提案する。
論文 参考訳(メタデータ) (2024-02-13T03:51:10Z) - Effective Protein-Protein Interaction Exploration with PPIretrieval [46.07027715907749]
PPIretrievalはタンパク質とタンパク質の相互作用を探索する最初の深層学習モデルである。
PPIretrievalは、埋め込み空間における潜在的なPPIを探し、タンパク質表面の豊富な幾何学的および化学的情報を収集する。
論文 参考訳(メタデータ) (2024-02-06T03:57:06Z) - Learning to design protein-protein interactions with enhanced generalization [14.983309106361899]
PPIRefは3Dタンパク質-タンパク質相互作用の最大かつ非冗長なデータセットである。
PPIRefデータセットをプレトレーニングPPIformerに利用し,多種多様なタンパク質結合変異体を対象とするSE(3)-同変モデルを提案する。
我々はPPIフォーマを微調整し,タンパク質とタンパク質の相互作用に対する変異の影響を予測する。
論文 参考訳(メタデータ) (2023-10-27T22:22:44Z) - Multimodal Pre-Training Model for Sequence-based Prediction of
Protein-Protein Interaction [7.022012579173686]
タンパク質モデルによる効果的な表現の学習は、タンパク質とタンパク質の相互作用において重要である。
PPIの事前学習モデルのほとんどは配列ベースであり、自然言語処理で使用される言語モデルをアミノ酸配列に導入している。
本稿では, 配列, 構造, 機能という3つのモーダル性を持つマルチモーダルタンパク質事前学習モデルを提案する。
論文 参考訳(メタデータ) (2021-12-09T10:21:52Z) - DIPS-Plus: The Enhanced Database of Interacting Protein Structures for
Interface Prediction [2.697420611471228]
DIPS-Plusはタンパク質界面の幾何学的深層学習のための42,112複合体の強化された機能豊富なデータセットである。
DIPSの以前のバージョンは、与えられたタンパク質複合体を構成する原子のカルテシアン座標とタイプのみを含む。
DIPS-Plusには、プロテクション指標、半球アミノ酸組成、および各アミノ酸に対する新しいプロファイル隠れマルコフモデル(HMM)ベースの配列機能を含む、新しい残基レベルの特徴が多数含まれている。
論文 参考訳(メタデータ) (2021-06-06T23:56:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。