論文の概要: Protein Secondary Structure Prediction Using 3D Graphs and Relation-Aware Message Passing Transformers
- arxiv url: http://arxiv.org/abs/2511.13685v1
- Date: Mon, 17 Nov 2025 18:39:13 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-18 18:52:09.680671
- Title: Protein Secondary Structure Prediction Using 3D Graphs and Relation-Aware Message Passing Transformers
- Title(参考訳): 3次元グラフとRelation-Aware Message Passing Transformerを用いたタンパク質二次構造予測
- Authors: Disha Varshney, Samarth Garg, Sarthak Tyagi, Deeksha Varshney, Nayan Deep, Asif Ekbal,
- Abstract要約: 本研究では,タンパク質一次配列から二次構造を予測するという課題に取り組む。
タンパク質残基グラフを用いて、空間情報の強化を図り、様々な形態の逐次的または構造的接続を導入する。
複数の畳み込み層を積み重ねて、タンパク質の空間グラフから組み合わせた洞察を効率的に学習する。
- 参考スコア(独自算出の注目度): 26.044929670768
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: In this study, we tackle the challenging task of predicting secondary structures from protein primary sequences, a pivotal initial stride towards predicting tertiary structures, while yielding crucial insights into protein activity, relationships, and functions. Existing methods often utilize extensive sets of unlabeled amino acid sequences. However, these approaches neither explicitly capture nor harness the accessible protein 3D structural data, which is recognized as a decisive factor in dictating protein functions. To address this, we utilize protein residue graphs and introduce various forms of sequential or structural connections to capture enhanced spatial information. We adeptly combine Graph Neural Networks (GNNs) and Language Models (LMs), specifically utilizing a pre-trained transformer-based protein language model to encode amino acid sequences and employing message-passing mechanisms like GCN and R-GCN to capture geometric characteristics of protein structures. Employing convolution within a specific node's nearby region, including relations, we stack multiple convolutional layers to efficiently learn combined insights from the protein's spatial graph, revealing intricate interconnections and dependencies in its structural arrangement. To assess our model's performance, we employed the training dataset provided by NetSurfP-2.0, which outlines secondary structure in 3-and 8-states. Extensive experiments show that our proposed model, SSRGNet surpasses the baseline on f1-scores.
- Abstract(参考訳): 本研究では,タンパク質の一次配列から二次構造を予測するという課題に取り組み,第3次構造を予測し,タンパク質の活性,関係,機能について重要な知見を得た。
既存の手法では、ラベルなしアミノ酸配列の広いセットを利用することが多い。
しかし、これらのアプローチは、タンパク質の機能を決定づける決定的な要因として認識されている、アクセス可能なタンパク質3D構造データを明示的に捉えたり利用したりしない。
これを解決するために,タンパク質残基グラフを用い,空間情報を付加するために様々な形態の逐次的あるいは構造的接続を導入する。
グラフニューラルネットワーク (GNN) と言語モデル (LM) を組み合わせて, アミノ酸配列をエンコードするトランスフォーマーベースタンパク質言語モデルと, GCN や R-GCN などのメッセージパッシング機構を用いて, タンパク質構造の幾何学的特徴を捉える。
関係を含む特定のノードの近傍領域内での畳み込みを利用して、複数の畳み込み層を積み重ねて、タンパク質の空間グラフから効率的に組み合わせた洞察を学習し、複雑な相互結合と構造的配列の依存関係を明らかにする。
モデルの性能を評価するため,NetSurfP-2.0が提供するトレーニングデータセットを用いて,2次構造を3段階と8段階に概説した。
実験の結果,提案モデルであるSSRGNetがf1スコアのベースラインを超えていることがわかった。
関連論文リスト
- S$^2$Drug: Bridging Protein Sequence and 3D Structure in Contrastive Representation Learning for Virtual Screening [72.89086338778098]
タンパク質リガンドコントラスト表現学習のための2段階フレームワークを提案する。
最初の段階では、ESM2ベースのバックボーンを用いて、ChemBLでタンパク質配列を事前訓練する。
第2段階では、残基レベルゲーティングモジュールを介して配列と構造情報を融合することでPDBBindを微調整する。
この補助的なタスクは、モデルを誘導し、タンパク質配列内の結合残基を正確に局在させ、それらの3次元空間配列をキャプチャする。
論文 参考訳(メタデータ) (2025-11-10T11:57:47Z) - PRING: Rethinking Protein-Protein Interaction Prediction from Pairs to Graphs [88.98041407783502]
PRINGは、タンパク質とタンパク質の相互作用予測をグラフレベルで評価する最初のベンチマークである。
PRINGは、21,484タンパク質と186,818の相互作用からなる高品質な多種PPIネットワークデータセットをキュレートする。
論文 参考訳(メタデータ) (2025-07-07T15:21:05Z) - Bidirectional Hierarchical Protein Multi-Modal Representation Learning [4.682021474006426]
大規模タンパク質配列で事前訓練されたタンパク質言語モデル(pLM)は、配列ベースタスクにおいて大きな成功を収めた。
3次元構造情報を活用するために設計されたグラフニューラルネットワーク(GNN)は、タンパク質関連予測タスクにおいて有望な一般化を示している。
本稿では、よりリッチで包括的なタンパク質表現を捉えるために、双方向かつ階層的な(双階層的な)融合アプローチを提案する。
論文 参考訳(メタデータ) (2025-04-07T06:47:49Z) - SFM-Protein: Integrative Co-evolutionary Pre-training for Advanced Protein Sequence Representation [97.99658944212675]
タンパク質基盤モデルのための新しい事前学習戦略を導入する。
アミノ酸残基間の相互作用を強調し、短距離および長距離の共進化的特徴の抽出を強化する。
大規模タンパク質配列データセットを用いて学習し,より優れた一般化能力を示す。
論文 参考訳(メタデータ) (2024-10-31T15:22:03Z) - Geometric Self-Supervised Pretraining on 3D Protein Structures using Subgraphs [26.727436310732692]
本稿では,3次元タンパク質構造上の3次元グラフニューラルネットワークを事前学習するための自己教師型手法を提案する。
提案手法が6%までの大幅な改善につながることを実験的に示す。
論文 参考訳(メタデータ) (2024-06-20T09:34:31Z) - A Systematic Study of Joint Representation Learning on Protein Sequences
and Structures [38.94729758958265]
効果的なタンパク質表現の学習は、タンパク質機能の予測のような生物学の様々なタスクにおいて重要である。
近年, タンパク質言語モデル(PLM)に基づく配列表現学習法は, 配列ベースタスクでは優れているが, タンパク質構造に関わるタスクへの直接適応は依然として困難である。
本研究は、最先端のPLMと異なる構造エンコーダを統合することで、結合タンパク質表現学習の包括的研究を行う。
論文 参考訳(メタデータ) (2023-03-11T01:24:10Z) - PersGNN: Applying Topological Data Analysis and Geometric Deep Learning
to Structure-Based Protein Function Prediction [0.07340017786387766]
本研究では,タンパク質構造を分離し,タンパク質データバンク内のタンパク質の機能的アノテーションを作成する。
本稿では,グラフ表現学習とトポロジカルデータ解析を組み合わせた,エンドツーエンドのトレーニング可能なディープラーニングモデルPersGNNを提案する。
論文 参考訳(メタデータ) (2020-10-30T02:24:35Z) - Transfer Learning for Protein Structure Classification at Low Resolution [124.5573289131546]
タンパク質のクラスとアーキテクチャの正確な(geq$80%)予測を、低い(leq$3A)解像度で決定された構造から行うことができることを示す。
本稿では, 高速で低コストなタンパク質構造を低解像度で分類するための概念実証と, 機能予測への拡張の基礎を提供する。
論文 参考訳(メタデータ) (2020-08-11T15:01:32Z) - BERTology Meets Biology: Interpreting Attention in Protein Language
Models [124.8966298974842]
注目レンズを用いたタンパク質トランスフォーマーモデルの解析方法を示す。
注意はタンパク質の折りたたみ構造を捉え、基礎となる配列では遠く離れているが、三次元構造では空間的に近接しているアミノ酸を接続する。
また、注意とタンパク質構造との相互作用を三次元的に可視化する。
論文 参考訳(メタデータ) (2020-06-26T21:50:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。