論文の概要: Graph neural networks and attention-based CNN-LSTM for protein
classification
- arxiv url: http://arxiv.org/abs/2204.09486v1
- Date: Wed, 20 Apr 2022 14:34:29 GMT
- ステータス: 処理完了
- システム内更新日: 2022-04-21 16:51:19.638462
- Title: Graph neural networks and attention-based CNN-LSTM for protein
classification
- Title(参考訳): タンパク質分類のためのグラフニューラルネットワークと注目に基づくCNN-LSTM
- Authors: Zhuangwei Shi
- Abstract要約: 本稿では,タンパク質の分類に関する3つの重要な問題に焦点をあてる。
まず,CNN-LSTMを用いた多ラベルCAZyme分類モデルを提案する。
次に,タンパク質グラフ分類のための変分グラフオートエンコーダに基づく部分空間学習モデルを提案する。
第3に,複合タンパク質相互作用予測のためのグラフ同型ネットワーク(GIN)とアテンションに基づくCNN-LSTMを提案する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This paper focuses on three critical problems on protein classification.
Firstly, Carbohydrate-active enzyme (CAZyme) classification can help people to
understand the properties of enzymes. However, one CAZyme may belong to several
classes. This leads to Multi-label CAZyme classification. Secondly, to capture
information from the secondary structure of protein, protein classification is
modeled as graph classification problem. Thirdly, compound-protein interactions
prediction employs graph learning for compound with sequential embedding for
protein. This can be seen as classification task for compound-protein pairs.
This paper proposes three models for protein classification. Firstly, this
paper proposes a Multi-label CAZyme classification model using CNN-LSTM with
Attention mechanism. Secondly, this paper proposes a variational graph
autoencoder based subspace learning model for protein graph classification.
Thirdly, this paper proposes graph isomorphism networks (GIN) and
Attention-based CNN-LSTM for compound-protein interactions prediction, as well
as comparing GIN with graph convolution networks (GCN) and graph attention
networks (GAT) in this task. The proposed models are effective for protein
classification. Source code and data are available at
https://github.com/zshicode/GNN-AttCL-protein. Besides, this repository
collects and collates the benchmark datasets with respect to above problems,
including CAZyme classification, enzyme protein graph classification,
compound-protein interactions prediction, drug-target affinities prediction and
drug-drug interactions prediction. Hence, the usage for evaluation by benchmark
datasets can be more conveniently.
- Abstract(参考訳): 本稿では,タンパク質の分類に関する3つの重要な問題に焦点をあてる。
まず、炭水化物活性酵素(cazyme)の分類は、酵素の性質を理解するのに役立つ。
しかし、1つのCAZymeはいくつかのクラスに属するかもしれない。
これは多ラベルCAZyme分類につながる。
次に、タンパク質の二次構造から情報を取得するために、タンパク質分類をグラフ分類問題としてモデル化する。
第3に、複合タンパク質相互作用予測は、タンパク質のシーケンシャル埋め込みを伴う化合物のグラフ学習を用いる。
これは複合タンパク質対の分類タスクと見なすことができる。
本稿では,タンパク質分類の3つのモデルを提案する。
まず,CNN-LSTMを用いた多ラベルCAZyme分類モデルを提案する。
次に,タンパク質グラフ分類のための変分グラフオートエンコーダに基づく部分空間学習モデルを提案する。
第3に,複合タンパク質相互作用予測のためのグラフ同型ネットワーク(GIN)とアテンションに基づくCNN-LSTMを提案し,その課題におけるグラフ畳み込みネットワーク(GCN)とグラフアテンションネットワーク(GAT)との比較を行った。
提案モデルはタンパク質の分類に有効である。
ソースコードとデータはhttps://github.com/zshicode/GNN-AttCL-oproteinで入手できる。
このリポジトリは、CAZyme分類、酵素タンパク質グラフ分類、複合タンパク質相互作用予測、薬物-標的親和性予測、薬物-薬物相互作用予測など、上記の問題に関するベンチマークデータセットを収集し、照合する。
したがって、ベンチマークデータセットによる評価はより便利である。
関連論文リスト
- Protein Language Model-Powered 3D Ligand Binding Site Prediction from
Protein Sequence [16.06613460477948]
タンパク質の結合部位の予測は、タンパク質の機能を理解し、潜在的な薬物をスクリーニングする重要な課題である。
既存の方法の多くは、入力として実験的に決定されたタンパク質ホロ構造を必要とする。
タンパク質配列とリガンド分子グラフのみを入力とするLaMPSiteを提案する。
論文 参考訳(メタデータ) (2023-12-05T01:47:38Z) - DeepGATGO: A Hierarchical Pretraining-Based Graph-Attention Model for
Automatic Protein Function Prediction [4.608328575930055]
自動タンパク質機能予測(AFP)は大規模多ラベル分類問題に分類される。
現在、一般的な手法は主にタンパク質関連情報と遺伝子オントロジー(GO)の用語を組み合わせて、最終的な機能予測を生成する。
本稿では,タンパク質配列とGO項ラベルを階層的に処理するシークエンスベースの階層予測手法であるDeepGATGOを提案する。
論文 参考訳(メタデータ) (2023-07-24T07:01:32Z) - Bi-level Contrastive Learning for Knowledge-Enhanced Molecule
Representations [55.42602325017405]
本稿では,分子の2レベル構造を考慮した新しいGODE法を提案する。
異なるグラフ構造上で2つのグラフニューラルネットワーク(GNN)を事前訓練し、対照的な学習と組み合わせることで、GODEは分子構造を対応する知識グラフサブ構造と融合させる。
11の化学特性タスクを微調整した場合、我々のモデルは既存のベンチマークよりも優れており、分類タスクの平均ROC-AUCアップリフトは13.8%、回帰タスクの平均RMSE/MAEエンハンスメントは35.1%である。
論文 参考訳(メタデータ) (2023-06-02T15:49:45Z) - EquiPocket: an E(3)-Equivariant Geometric Graph Neural Network for
Ligand Binding Site Prediction [36.08979503853887]
本研究では,結合サイト予測のためのE3-equivariant Graph Neural Network(GNN)であるEquiPocketを提案する。
特に、EquiPocketは3つのモジュールから構成されており、最初のモジュールは各表面原子の局所的な幾何学情報を抽出し、2番目のモジュールはタンパク質の化学的構造と空間的構造の両方をモデル化し、最後のモジュールは表面の幾何学を捉える。
論文 参考訳(メタデータ) (2023-02-23T17:18:26Z) - Structure-aware Protein Self-supervised Learning [50.04673179816619]
本稿では,タンパク質の構造情報を取得するための構造認識型タンパク質自己教師学習法を提案する。
特に、タンパク質構造情報を保存するために、よく設計されたグラフニューラルネットワーク(GNN)モデルを事前訓練する。
タンパク質言語モデルにおける逐次情報と特別に設計されたGNNモデルにおける構造情報との関係を,新しい擬似二段階最適化手法を用いて同定する。
論文 参考訳(メタデータ) (2022-04-06T02:18:41Z) - Protein Representation Learning by Geometric Structure Pretraining [27.723095456631906]
既存のアプローチは通常、多くの未ラベルアミノ酸配列で事前訓練されたタンパク質言語モデルである。
まず,タンパク質の幾何学的特徴を学習するための単純かつ効果的なエンコーダを提案する。
関数予測と折り畳み分類の両タスクの実験結果から,提案した事前学習法は,より少ないデータを用いた最先端のシーケンスベース手法と同等あるいは同等であることがわかった。
論文 参考訳(メタデータ) (2022-03-11T17:52:13Z) - Structure-Enhanced Meta-Learning For Few-Shot Graph Classification [53.54066611743269]
本研究では,数点グラフ分類の解法のためのメトリベースメタラーニングの可能性を検討する。
SMFGINというGINの実装は、ChemblとTRIANGLESの2つのデータセットでテストされている。
論文 参考訳(メタデータ) (2021-03-05T09:03:03Z) - GEFA: Early Fusion Approach in Drug-Target Affinity Prediction [28.695523040015164]
本稿では,結合効果により対象表現の変化に対処するアテンション機構を備えた新しいグラフイングラフニューラルネットワークを提案する。
薬物は原子のグラフとしてモデル化され、残基-ドラッグ複合体の大きなグラフのノードとして機能する。
また、文脈化されたタンパク質表現を学習する最近の取り組みにより、事前訓練されたタンパク質表現を使用する。
論文 参考訳(メタデータ) (2020-09-25T11:54:15Z) - Deep Learning of High-Order Interactions for Protein Interface
Prediction [58.164371994210406]
本稿では,タンパク質界面の予測を2次元密度予測問題として定式化する。
タンパク質をグラフとして表現し、グラフニューラルネットワークを用いてノードの特徴を学習する。
我々は高次対相互作用を組み込んで、異なる対相互作用を含む3次元テンソルを生成する。
論文 参考訳(メタデータ) (2020-07-18T05:39:35Z) - BERTology Meets Biology: Interpreting Attention in Protein Language
Models [124.8966298974842]
注目レンズを用いたタンパク質トランスフォーマーモデルの解析方法を示す。
注意はタンパク質の折りたたみ構造を捉え、基礎となる配列では遠く離れているが、三次元構造では空間的に近接しているアミノ酸を接続する。
また、注意とタンパク質構造との相互作用を三次元的に可視化する。
論文 参考訳(メタデータ) (2020-06-26T21:50:17Z) - A Systematic Evaluation: Fine-Grained CNN vs. Traditional CNN
Classifiers [54.996358399108566]
本稿では,大規模分類データセット上でトップノーチ結果を示すランドマーク一般的なCNN分類器の性能について検討する。
最先端のきめ細かい分類器と比較する。
実験において, 粒度の細かい分類器がベースラインを高められるかどうかを判定するために, 6つのデータセットについて広範囲に評価する。
論文 参考訳(メタデータ) (2020-03-24T23:49:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。