論文の概要: Encoding protein dynamic information in graph representation for
functional residue identification
- arxiv url: http://arxiv.org/abs/2112.12033v1
- Date: Wed, 15 Dec 2021 17:57:13 GMT
- ステータス: 処理完了
- システム内更新日: 2021-12-26 13:21:39.346783
- Title: Encoding protein dynamic information in graph representation for
functional residue identification
- Title(参考訳): 機能的残基同定のためのグラフ表現におけるタンパク質動的情報の符号化
- Authors: Yuan Chiang, Wei-Han Hui, Shu-Wei Chang
- Abstract要約: タンパク質機能予測の最近の進歩は、タンパク質の構造的特徴とトポロジ的特徴と分子機能との相関をグラフベースの深層学習アプローチを用いている。
ここでは, 動的に相関する残基対間のエッジを連結することにより, ネイティブタンパク質コンホメーションと拡張タンパク質グラフに正規モード解析を適用した。
提案したグラフニューラルネットワークであるProDARは、残基レベルのアノテーションの解釈可能性と一般化性を高め、タンパク質の構造的ニュアンスを強く反映する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Recent advances in protein function prediction exploit graph-based deep
learning approaches to correlate the structural and topological features of
proteins with their molecular functions. However, proteins in vivo are not
static but dynamic molecules that alter conformation for functional purposes.
Here we apply normal mode analysis to native protein conformations and augment
protein graphs by connecting edges between dynamically correlated residue
pairs. In the multilabel function classification task, our method demonstrates
a remarkable performance gain based on this dynamics-informed representation.
The proposed graph neural network, ProDAR, increases the interpretability and
generalizability of residue-level annotations and robustly reflects structural
nuance in proteins. We elucidate the importance of dynamic information in graph
representation by comparing class activation maps for the hMTH1, nitrophorin,
and SARS-CoV-2 receptor binding domain. Our model successfully learns the
dynamic fingerprints of proteins and provides molecular insights into protein
functions, with vast untapped potential for broad biotechnology and
pharmaceutical applications.
- Abstract(参考訳): タンパク質機能予測の最近の進歩は、タンパク質の構造的・トポロジー的特徴と分子機能との相関をグラフベースで実現する。
しかし、生体内のタンパク質は静的ではなく、機能目的のためにコンフォメーションを変化させる動的分子である。
ここでは, 動的に相関する残基対間のエッジを連結することにより, ネイティブタンパク質コンホメーションと拡張タンパク質グラフに正規モード解析を適用する。
マルチラベル関数分類タスクでは,この動的インフォームド表現に基づく顕著な性能向上を示す。
提案したグラフニューラルネットワークであるProDARは、残基レベルのアノテーションの解釈可能性と一般化性を高め、タンパク質の構造的ニュアンスを強く反映する。
我々は,hMTH1,ニトロホリン,SARS-CoV-2受容体結合ドメインのクラス活性化マップを比較し,グラフ表現における動的情報の重要性を明らかにする。
本モデルでは,タンパク質のダイナミックフィンガープリントの学習に成功し,タンパク質機能に関する分子的知見を提供する。
関連論文リスト
- Structure-Informed Protein Language Model [38.019425619750265]
本稿では、構造情報をタンパク質言語モデルに抽出するためのリモートホモロジー検出の統合について紹介する。
この構造インフォームドトレーニングが下流タンパク質機能予測タスクに与える影響を評価する。
論文 参考訳(メタデータ) (2024-02-07T09:32:35Z) - Bi-level Contrastive Learning for Knowledge-Enhanced Molecule
Representations [55.42602325017405]
本稿では,分子の2レベル構造を考慮した新しいGODE法を提案する。
異なるグラフ構造上で2つのグラフニューラルネットワーク(GNN)を事前訓練し、対照的な学習と組み合わせることで、GODEは分子構造を対応する知識グラフサブ構造と融合させる。
11の化学特性タスクを微調整した場合、我々のモデルは既存のベンチマークよりも優れており、分類タスクの平均ROC-AUCアップリフトは13.8%、回帰タスクの平均RMSE/MAEエンハンスメントは35.1%である。
論文 参考訳(メタデータ) (2023-06-02T15:49:45Z) - Learning the shape of protein micro-environments with a holographic
convolutional neural network [0.0]
本稿では,タンパク質のホログラフィック畳み込みニューラルネットワーク(H-CNN)を紹介する。
H-CNNは、タンパク質構造におけるアミノ酸の嗜好をモデル化するための、物理的に動機付けられた機械学習アプローチである。
タンパク質複合体の安定性や結合を含むタンパク質機能に対する突然変異の影響を正確に予測する。
論文 参考訳(メタデータ) (2022-11-05T16:29:15Z) - Learning multi-scale functional representations of proteins from
single-cell microscopy data [77.34726150561087]
局所化分類に基づいて訓練された単純な畳み込みネットワークは、多様な機能情報をカプセル化したタンパク質表現を学習できることを示す。
また,生物機能の異なるスケールでタンパク質表現の質を評価するためのロバストな評価戦略を提案する。
論文 参考訳(メタデータ) (2022-05-24T00:00:07Z) - Learning Geometrically Disentangled Representations of Protein Folding
Simulations [72.03095377508856]
この研究は、薬物標的タンパク質の構造的アンサンブルに基づいて生成ニューラルネットワークを学習することに焦点を当てている。
モデル課題は、様々な薬物分子に結合したタンパク質の構造的変動を特徴付けることである。
その結果,我々の幾何学的学習に基づく手法は,複雑な構造変化を生成するための精度と効率の両方を享受できることがわかった。
論文 参考訳(メタデータ) (2022-05-20T19:38:00Z) - Structure-aware Protein Self-supervised Learning [50.04673179816619]
本稿では,タンパク質の構造情報を取得するための構造認識型タンパク質自己教師学習法を提案する。
特に、タンパク質構造情報を保存するために、よく設計されたグラフニューラルネットワーク(GNN)モデルを事前訓練する。
タンパク質言語モデルにおける逐次情報と特別に設計されたGNNモデルにおける構造情報との関係を,新しい擬似二段階最適化手法を用いて同定する。
論文 参考訳(メタデータ) (2022-04-06T02:18:41Z) - Multi-Scale Representation Learning on Proteins [78.31410227443102]
本稿では,タンパク質HoloProtのマルチスケールグラフ構築について紹介する。
表面はタンパク質の粗い詳細を捉え、配列は一次成分であり、構造はより微細な詳細を捉えている。
グラフエンコーダは、各レベルが下のレベル(s)からそのレベルでのグラフとエンコーディングを統合することで、マルチスケール表現を学習する。
論文 参考訳(メタデータ) (2022-04-04T08:29:17Z) - OntoProtein: Protein Pretraining With Gene Ontology Embedding [36.92674447484136]
GO(Gene Ontology)の構造をタンパク質事前学習モデルに活用する最初の汎用フレームワークであるOntoProteinを提案する。
我々はGOとその関連タンパク質からなる新しい大規模知識グラフを構築し、遺伝子アノテーションのテキストやタンパク質配列はグラフ内の全てのノードを記述する。
論文 参考訳(メタデータ) (2022-01-23T14:49:49Z) - PersGNN: Applying Topological Data Analysis and Geometric Deep Learning
to Structure-Based Protein Function Prediction [0.07340017786387766]
本研究では,タンパク質構造を分離し,タンパク質データバンク内のタンパク質の機能的アノテーションを作成する。
本稿では,グラフ表現学習とトポロジカルデータ解析を組み合わせた,エンドツーエンドのトレーニング可能なディープラーニングモデルPersGNNを提案する。
論文 参考訳(メタデータ) (2020-10-30T02:24:35Z) - BERTology Meets Biology: Interpreting Attention in Protein Language
Models [124.8966298974842]
注目レンズを用いたタンパク質トランスフォーマーモデルの解析方法を示す。
注意はタンパク質の折りたたみ構造を捉え、基礎となる配列では遠く離れているが、三次元構造では空間的に近接しているアミノ酸を接続する。
また、注意とタンパク質構造との相互作用を三次元的に可視化する。
論文 参考訳(メタデータ) (2020-06-26T21:50:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。