論文の概要: Binary classification of proteins by a Machine Learning approach
- arxiv url: http://arxiv.org/abs/2111.01975v1
- Date: Wed, 3 Nov 2021 01:58:16 GMT
- ステータス: 処理完了
- システム内更新日: 2021-11-04 23:18:24.543354
- Title: Binary classification of proteins by a Machine Learning approach
- Title(参考訳): 機械学習によるタンパク質の2成分分類
- Authors: Damiano Perri, Marco Simonetti, Andrea Lombardi, Noelia Faginas-Lago,
Osvaldo Gervasi
- Abstract要約: 本稿では,タンパク質データバンクに含まれるタンパク質の記述に基づいてアミノ酸のタンパク質鎖を分類するシステムを提案する。
それぞれのタンパク質は、XML形式でのファイルの化学・物理・幾何学的特性で完全に記述されている。
この研究の目的は、大量のデータの収集と管理のためのディープラーニング機械を設計し、そのアミノ酸配列の分類への応用を通じてそれを検証することである。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In this work we present a system based on a Deep Learning approach, by using
a Convolutional Neural Network, capable of classifying protein chains of amino
acids based on the protein description contained in the Protein Data Bank. Each
protein is fully described in its chemical-physical-geometric properties in a
file in XML format. The aim of the work is to design a prototypical Deep
Learning machinery for the collection and management of a huge amount of data
and to validate it through its application to the classification of a sequences
of amino acids. We envisage applying the described approach to more general
classification problems in biomolecules, related to structural properties and
similarities.
- Abstract(参考訳): 本研究では、タンパク質データバンクに含まれるタンパク質の記述に基づいてアミノ酸のタンパク質鎖を分類できる畳み込みニューラルネットワークを用いて、ディープラーニングアプローチに基づくシステムを提案する。
それぞれのタンパク質は、XML形式でのファイルの化学・物理・幾何学的特性で完全に記述されている。
この研究の目的は、大量のデータの収集と管理のための原型的なディープラーニング機械を設計し、そのアミノ酸配列の分類への応用を通じてそれを検証することである。
本稿では, 生体分子のより一般的な分類問題に対して, 構造的特性と類似性に関連するアプローチを適用することを検討する。
関連論文リスト
- MMDesign: Multi-Modality Transfer Learning for Generative Protein Design [66.49989188722553]
タンパク質の設計は、対応するタンパク質のバックボーンに基づいてタンパク質配列を生成する。
深層生成モデルは、データから直接タンパク質設計を学ぶことを約束している。
パブリックな構造系列ペアリングの欠如は、一般化能力を制限している。
マルチモーダルトランスファー学習を利用するMMDesignと呼ばれる新しいタンパク質設計パラダイムを提案する。
論文 参考訳(メタデータ) (2023-12-11T10:59:23Z) - SBSM-Pro: Support Bio-sequence Machine for Proteins [2.716144006729723]
本稿では,生物配列の分類モデルであるSBSM-Pro(Support Bio-Sequence Machine for Proteins)を紹介する。
配列アライメントを組み込んでタンパク質間の類似性を計測し、新しいマルチカーネル学習(MKL)アプローチを用いて様々な種類の情報を統合する。
以上の結果から,タンパク質の機能同定と翻訳後修飾の観点から,本モデルが10個のデータセットにまたがる可換性を示すことが示唆された。
論文 参考訳(メタデータ) (2023-08-20T14:10:50Z) - Integration of Pre-trained Protein Language Models into Geometric Deep
Learning Networks [68.90692290665648]
我々は、タンパク質言語モデルから学んだ知識を、いくつかの最先端の幾何学的ネットワークに統合する。
以上の結果から,ベースラインを20%上回る総合的な改善が見られた。
強い証拠は、タンパク質言語モデルの知識を取り入れることで、幾何学的ネットワークの能力が著しく向上することを示している。
論文 参考訳(メタデータ) (2022-12-07T04:04:04Z) - Deep Learning Methods for Protein Family Classification on PDB
Sequencing Data [0.0]
本稿では,新たな双方向LSTMや畳み込みモデルなどのディープラーニングフレームワークの性能を,広く利用可能なシークエンシングデータ上で実証し比較する。
我々のディープラーニングモデルは従来の機械学習手法よりも優れた性能を示し、畳み込みアーキテクチャは最も印象的な推論性能を提供する。
論文 参考訳(メタデータ) (2022-07-14T06:11:32Z) - Learning Geometrically Disentangled Representations of Protein Folding
Simulations [72.03095377508856]
この研究は、薬物標的タンパク質の構造的アンサンブルに基づいて生成ニューラルネットワークを学習することに焦点を当てている。
モデル課題は、様々な薬物分子に結合したタンパク質の構造的変動を特徴付けることである。
その結果,我々の幾何学的学習に基づく手法は,複雑な構造変化を生成するための精度と効率の両方を享受できることがわかった。
論文 参考訳(メタデータ) (2022-05-20T19:38:00Z) - Structure-aware Protein Self-supervised Learning [50.04673179816619]
本稿では,タンパク質の構造情報を取得するための構造認識型タンパク質自己教師学習法を提案する。
特に、タンパク質構造情報を保存するために、よく設計されたグラフニューラルネットワーク(GNN)モデルを事前訓練する。
タンパク質言語モデルにおける逐次情報と特別に設計されたGNNモデルにおける構造情報との関係を,新しい擬似二段階最適化手法を用いて同定する。
論文 参考訳(メタデータ) (2022-04-06T02:18:41Z) - A new method for binary classification of proteins with Machine Learning [0.0]
本研究では,ディープラーニング手法を用いてタンパク質構造を分類する手法を提案する。
私たちの人工知能は、タンパク質データバンク(PDB)データベースから外挿された複雑な生体分子構造を認識し、イメージとして再処理するように訓練されています。
この目的のために、これらの画像から重要な特徴を抽出し、分子を正しく分類するために、InceptionResNetV2やInceptionV3のような事前訓練された畳み込みニューラルネットワークを用いて様々な試験が行われた。
論文 参考訳(メタデータ) (2021-11-03T01:58:34Z) - PersGNN: Applying Topological Data Analysis and Geometric Deep Learning
to Structure-Based Protein Function Prediction [0.07340017786387766]
本研究では,タンパク質構造を分離し,タンパク質データバンク内のタンパク質の機能的アノテーションを作成する。
本稿では,グラフ表現学習とトポロジカルデータ解析を組み合わせた,エンドツーエンドのトレーニング可能なディープラーニングモデルPersGNNを提案する。
論文 参考訳(メタデータ) (2020-10-30T02:24:35Z) - Transfer Learning for Protein Structure Classification at Low Resolution [124.5573289131546]
タンパク質のクラスとアーキテクチャの正確な(geq$80%)予測を、低い(leq$3A)解像度で決定された構造から行うことができることを示す。
本稿では, 高速で低コストなタンパク質構造を低解像度で分類するための概念実証と, 機能予測への拡張の基礎を提供する。
論文 参考訳(メタデータ) (2020-08-11T15:01:32Z) - BERTology Meets Biology: Interpreting Attention in Protein Language
Models [124.8966298974842]
注目レンズを用いたタンパク質トランスフォーマーモデルの解析方法を示す。
注意はタンパク質の折りたたみ構造を捉え、基礎となる配列では遠く離れているが、三次元構造では空間的に近接しているアミノ酸を接続する。
また、注意とタンパク質構造との相互作用を三次元的に可視化する。
論文 参考訳(メタデータ) (2020-06-26T21:50:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。