論文の概要: ProteinRPN: Towards Accurate Protein Function Prediction with Graph-Based Region Proposals
- arxiv url: http://arxiv.org/abs/2409.00610v1
- Date: Sun, 1 Sep 2024 04:40:04 GMT
- ステータス: 処理完了
- システム内更新日: 2024-09-06 13:27:03.934789
- Title: ProteinRPN: Towards Accurate Protein Function Prediction with Graph-Based Region Proposals
- Title(参考訳): proteinRPN: グラフベースの領域提案によるタンパク質機能予測に向けて
- Authors: Shania Mitra, Lei Huang, Manolis Kellis,
- Abstract要約: 本稿では,タンパク質機能予測のためのタンパク質領域提案ネットワーク(ProteinRPN)を紹介する。
proteinRPNは、階層型ノードドロッププーリング層を通じて洗練される潜在的な機能領域(アンカー)を識別する。
予測された機能ノードの表現は、注意機構を使用して強化され、グラフマルチセット変換器に入力される。
- 参考スコア(独自算出の注目度): 4.525216077859531
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Protein function prediction is a crucial task in bioinformatics, with significant implications for understanding biological processes and disease mechanisms. While the relationship between sequence and function has been extensively explored, translating protein structure to function continues to present substantial challenges. Various models, particularly, CNN and graph-based deep learning approaches that integrate structural and functional data, have been proposed to address these challenges. However, these methods often fall short in elucidating the functional significance of key residues essential for protein functionality, as they predominantly adopt a retrospective perspective, leading to suboptimal performance. Inspired by region proposal networks in computer vision, we introduce the Protein Region Proposal Network (ProteinRPN) for accurate protein function prediction. Specifically, the region proposal module component of ProteinRPN identifies potential functional regions (anchors) which are refined through the hierarchy-aware node drop pooling layer favoring nodes with defined secondary structures and spatial proximity. The representations of the predicted functional nodes are enriched using attention mechanisms and subsequently fed into a Graph Multiset Transformer, which is trained with supervised contrastive (SupCon) and InfoNCE losses on perturbed protein structures. Our model demonstrates significant improvements in predicting Gene Ontology (GO) terms, effectively localizing functional residues within protein structures. The proposed framework provides a robust, scalable solution for protein function annotation, advancing the understanding of protein structure-function relationships in computational biology.
- Abstract(参考訳): タンパク質機能予測はバイオインフォマティクスにおいて重要な課題であり、生物学的プロセスや疾患のメカニズムを理解する上で重要な意味を持つ。
配列と機能の関係は広く研究されているが、タンパク質構造を機能に翻訳することは大きな課題を呈し続けている。
構造的および機能的データを統合するCNNやグラフベースのディープラーニングアプローチなど、さまざまなモデルがこれらの課題に対処するために提案されている。
しかしながら、これらの手法は、しばしば、タンパク質の機能に不可欠なキー残基の機能的意義を解明するのに不足する。
コンピュータビジョンにおける領域提案ネットワークに触発されて,正確なタンパク質機能予測のためのタンパク質領域提案ネットワーク(ProteinRPN)を導入する。
具体的には、ProteinRPNの領域提案モジュールコンポーネントは、定義された二次構造と空間的近接性を持つノードを優先する階層認識ノードドロッププーリング層を通して洗練される潜在的機能領域(アンカー)を特定する。
予測された機能ノードの表現は、注意機構を用いて強化され、その後グラフ・マルチセット・トランスフォーマーに入力され、教師付きコントラスト(SupCon)とInfoNCEの損失によってトレーニングされる。
本モデルは,遺伝子オントロジー(GO)用語の予測において,タンパク質構造内の機能的残基を効果的に局在させることにおいて,大幅な改善を示す。
提案フレームワークは、タンパク質機能アノテーションに対する堅牢でスケーラブルなソリューションを提供し、計算生物学におけるタンパク質構造-機能関係の理解を深める。
関連論文リスト
- SFM-Protein: Integrative Co-evolutionary Pre-training for Advanced Protein Sequence Representation [97.99658944212675]
タンパク質基盤モデルのための新しい事前学習戦略を導入する。
アミノ酸残基間の相互作用を強調し、短距離および長距離の共進化的特徴の抽出を強化する。
大規模タンパク質配列データセットを用いて学習し,より優れた一般化能力を示す。
論文 参考訳(メタデータ) (2024-10-31T15:22:03Z) - ProtFAD: Introducing function-aware domains as implicit modality towards protein function prediction [4.299777426056576]
本稿では,タンパク質の異なる機能を識別するために,機能認識ドメイン表現とドメイン結合型学習戦略を提案する。
提案手法は, 様々なベンチマークにおいて, 最先端の手法よりも大きく, 包括的に優れている。
論文 参考訳(メタデータ) (2024-05-24T02:26:45Z) - NaNa and MiGu: Semantic Data Augmentation Techniques to Enhance Protein Classification in Graph Neural Networks [60.48306899271866]
本稿では,背骨化学および側鎖生物物理情報をタンパク質分類タスクに組み込む新しい意味データ拡張手法を提案する。
具体的には, 分子生物学的, 二次構造, 化学結合, およびタンパク質のイオン特性を活用し, 分類作業を容易にする。
論文 参考訳(メタデータ) (2024-03-21T13:27:57Z) - Structure-Informed Protein Language Model [38.019425619750265]
本稿では、構造情報をタンパク質言語モデルに抽出するためのリモートホモロジー検出の統合について紹介する。
この構造インフォームドトレーニングが下流タンパク質機能予測タスクに与える影響を評価する。
論文 参考訳(メタデータ) (2024-02-07T09:32:35Z) - Multi-level Protein Representation Learning for Blind Mutational Effect
Prediction [5.207307163958806]
本稿では,タンパク質構造解析のためのシーケンシャルおよび幾何学的アナライザをカスケードする,新しい事前学習フレームワークを提案する。
野生型タンパク質の自然選択をシミュレートすることにより、所望の形質に対する突然変異方向を誘導する。
提案手法は,多種多様な効果予測タスクに対して,パブリックデータベースと2つの新しいデータベースを用いて評価する。
論文 参考訳(メタデータ) (2023-06-08T03:00:50Z) - Learning the shape of protein micro-environments with a holographic
convolutional neural network [0.0]
本稿では,タンパク質のホログラフィック畳み込みニューラルネットワーク(H-CNN)を紹介する。
H-CNNは、タンパク質構造におけるアミノ酸の嗜好をモデル化するための、物理的に動機付けられた機械学習アプローチである。
タンパク質複合体の安定性や結合を含むタンパク質機能に対する突然変異の影響を正確に予測する。
論文 参考訳(メタデータ) (2022-11-05T16:29:15Z) - Structure-aware Protein Self-supervised Learning [50.04673179816619]
本稿では,タンパク質の構造情報を取得するための構造認識型タンパク質自己教師学習法を提案する。
特に、タンパク質構造情報を保存するために、よく設計されたグラフニューラルネットワーク(GNN)モデルを事前訓練する。
タンパク質言語モデルにおける逐次情報と特別に設計されたGNNモデルにおける構造情報との関係を,新しい擬似二段階最適化手法を用いて同定する。
論文 参考訳(メタデータ) (2022-04-06T02:18:41Z) - EBM-Fold: Fully-Differentiable Protein Folding Powered by Energy-based
Models [53.17320541056843]
本研究では,データ駆動型生成ネットワークを用いたタンパク質構造最適化手法を提案する。
EBM-Foldアプローチは,従来のロゼッタ構造最適化ルーチンと比較して,高品質なデコイを効率よく生成できる。
論文 参考訳(メタデータ) (2021-05-11T03:40:29Z) - PersGNN: Applying Topological Data Analysis and Geometric Deep Learning
to Structure-Based Protein Function Prediction [0.07340017786387766]
本研究では,タンパク質構造を分離し,タンパク質データバンク内のタンパク質の機能的アノテーションを作成する。
本稿では,グラフ表現学習とトポロジカルデータ解析を組み合わせた,エンドツーエンドのトレーニング可能なディープラーニングモデルPersGNNを提案する。
論文 参考訳(メタデータ) (2020-10-30T02:24:35Z) - Transfer Learning for Protein Structure Classification at Low Resolution [124.5573289131546]
タンパク質のクラスとアーキテクチャの正確な(geq$80%)予測を、低い(leq$3A)解像度で決定された構造から行うことができることを示す。
本稿では, 高速で低コストなタンパク質構造を低解像度で分類するための概念実証と, 機能予測への拡張の基礎を提供する。
論文 参考訳(メタデータ) (2020-08-11T15:01:32Z) - BERTology Meets Biology: Interpreting Attention in Protein Language
Models [124.8966298974842]
注目レンズを用いたタンパク質トランスフォーマーモデルの解析方法を示す。
注意はタンパク質の折りたたみ構造を捉え、基礎となる配列では遠く離れているが、三次元構造では空間的に近接しているアミノ酸を接続する。
また、注意とタンパク質構造との相互作用を三次元的に可視化する。
論文 参考訳(メタデータ) (2020-06-26T21:50:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。