論文の概要: Macromolecule Classification Based on the Amino-acid Sequence
- arxiv url: http://arxiv.org/abs/2001.01717v2
- Date: Wed, 21 Sep 2022 21:23:23 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-14 03:04:11.616071
- Title: Macromolecule Classification Based on the Amino-acid Sequence
- Title(参考訳): アミノ酸配列に基づくマクロ分子分類
- Authors: Faisal Ghaffar, Sarwar Khan, Gaddisa O., Chen Yu-jhen
- Abstract要約: 深層学習技術を用いたタンパク質配列の分類に着目する。
我々の主な目標は、配列をDNA、RNA、タンパク質、ハイブリッドの4つのグループに分類することであった。
数回のテストの後、私たちはほぼ99%の列車とテストの正確性を達成しました。
- 参考スコア(独自算出の注目度): 0.4588028371034407
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Deep learning is playing a vital role in every field which involves data. It
has emerged as a strong and efficient framework that can be applied to a broad
spectrum of complex learning problems which were difficult to solve using
traditional machine learning techniques in the past. In this study we focused
on classification of protein sequences with deep learning techniques. The study
of amino acid sequence is vital in life sciences. We used different word
embedding techniques from Natural Language processing to represent the amino
acid sequence as vectors. Our main goal was to classify sequences to four group
of classes, that are DNA, RNA, Protein and hybrid. After several tests we have
achieved almost 99% of train and test accuracy. We have experimented on CNN,
LSTM, Bidirectional LSTM, and GRU.
- Abstract(参考訳): ディープラーニングは、データを含むあらゆる分野において重要な役割を果たす。
従来の機械学習技術では解決が困難だった、幅広い複雑な学習問題に適用可能な、強力で効率的なフレームワークとして登場した。
本研究では,深層学習によるタンパク質配列の分類に焦点をあてた。
アミノ酸配列の研究は生命科学において不可欠である。
自然言語処理と異なる単語埋め込み技術を用いてアミノ酸配列をベクターとして表現した。
我々の主な目標は、配列をDNA、RNA、タンパク質、ハイブリッドの4つのグループに分類することであった。
いくつかのテストの後、列車とテストの精度の約99%を達成しました。
我々は,CNN,LSTM,双方向LSTM,GRUの実験を行った。
関連論文リスト
- DNA Sequence Classification with Compressors [0.0]
本研究は,DNA配列解析に適した圧縮機を用いたパラメータフリー分類法を新たに導入する。
この手法は、精度の観点から現在の最先端と整合するだけでなく、従来の機械学習手法よりもリソース効率の良い代替手段を提供する。
論文 参考訳(メタデータ) (2024-01-25T09:17:19Z) - xTrimoPGLM: Unified 100B-Scale Pre-trained Transformer for Deciphering
the Language of Protein [76.18058946124111]
本稿では,タンパク質の理解と生成を同時に行うために,統一されたタンパク質言語モデル xTrimoPGLM を提案する。
xTrimoPGLMは、4つのカテゴリにわたる18のタンパク質理解ベンチマークにおいて、他の高度なベースラインを著しく上回っている。
また、自然の原理に従ってデノボタンパク質配列を生成でき、微調整を監督した後にプログラム可能な生成を行うことができる。
論文 参考訳(メタデータ) (2024-01-11T15:03:17Z) - Fast and Functional Structured Data Generators Rooted in
Out-of-Equilibrium Physics [62.997667081978825]
エネルギーモデルを用いて、構造化データセットで高品質なラベル特化データを生成するという課題に対処する。
伝統的な訓練方法は、マルコフ連鎖モンテカルロ混合による困難に遭遇する。
非平衡効果を利用した新しいトレーニングアルゴリズムを用いる。
論文 参考訳(メタデータ) (2023-07-13T15:08:44Z) - Diversifying Design of Nucleic Acid Aptamers Using Unsupervised Machine
Learning [54.247560894146105]
短い一本鎖RNAとDNA配列(アプタマー)の逆設計は、一連の望ましい基準を満たす配列を見つけるタスクである。
我々は、Pottsモデルとして知られる教師なし機械学習モデルを用いて、制御可能なシーケンスの多様性を持つ新しい有用なシーケンスを発見することを提案する。
論文 参考訳(メタデータ) (2022-08-10T13:30:58Z) - Deep Learning Methods for Protein Family Classification on PDB
Sequencing Data [0.0]
本稿では,新たな双方向LSTMや畳み込みモデルなどのディープラーニングフレームワークの性能を,広く利用可能なシークエンシングデータ上で実証し比較する。
我々のディープラーニングモデルは従来の機械学習手法よりも優れた性能を示し、畳み込みアーキテクチャは最も印象的な推論性能を提供する。
論文 参考訳(メタデータ) (2022-07-14T06:11:32Z) - BASiNETEntropy: an alignment-free method for classification of
biological sequences through complex networks and entropy maximization [0.0]
本研究は, 複雑なネットワークとエントロピーによる生物配列の分類法を提案する。
最大エントロピー原理は、RNAクラスに関する最も情報性の高いエッジを同定し、フィルターされた複雑なネットワークを生成するために提案される。
提案手法は13種の異なるRNAクラスの分類において評価された。
論文 参考訳(メタデータ) (2022-03-24T14:19:43Z) - Deep metric learning improves lab of origin prediction of genetically
engineered plasmids [63.05016513788047]
遺伝工学の属性(GEA)は、配列-ラブの関連を作る能力である。
本稿では,計量学習に基づいて,最も可能性の高い実験室をランク付けする手法を提案する。
我々は、特定の実験室のプラスミド配列のキーシグネチャを抽出することができ、モデル出力の解釈可能な検査を可能にする。
論文 参考訳(メタデータ) (2021-11-24T16:29:03Z) - Improving RNA Secondary Structure Design using Deep Reinforcement
Learning [69.63971634605797]
本稿では,RNA配列設計に強化学習を適用した新しいベンチマークを提案する。このベンチマークでは,目的関数を配列の二次構造における自由エネルギーとして定義する。
本稿では,これらのアルゴリズムに対して行うアブレーション解析の結果と,バッチ間でのアルゴリズムの性能を示すグラフを示す。
論文 参考訳(メタデータ) (2021-11-05T02:54:06Z) - A Brief Review of Machine Learning Techniques for Protein
Phosphorylation Sites Prediction [0.0]
可逆的翻訳後修飾 (Reversible Post-Translational Modifications, PTMs) は、タンパク質の機能的多様性を拡大する上で重要な役割を持つ。
PTMは、様々な細胞プロセスを制御するために利用される重要な分子制御機構として発生してきた。
この修飾の障害は、神経疾患やがんを含む複数の疾患によって引き起こされることがある。
論文 参考訳(メタデータ) (2021-08-10T22:23:30Z) - Neural networks for Anatomical Therapeutic Chemical (ATC) [83.73971067918333]
両方向の長期記憶ネットワーク(BiLSTM)から抽出された集合を含む、特徴の異なるセットで訓練された複数の複数ラベル分類器を組み合わせることを提案する。
実験はこのアプローチのパワーを実証し、文献で報告された最良の手法よりも優れていることを示した。
論文 参考訳(メタデータ) (2021-01-22T19:49:47Z) - Align-gram : Rethinking the Skip-gram Model for Protein Sequence
Analysis [0.8733639720576208]
ベクトル空間において類似の$k$-mersを互いに近接してマッピングできる新しい埋め込みスキームAlign-gramを提案する。
DeepGoPlusのシンプルなベースラインLSTMモデルと非常に複雑なCNNモデルを用いた実験は、タンパク質配列解析のための様々なタイプのディープラーニングアプリケーションを実行する上で、Align-gramの可能性を示している。
論文 参考訳(メタデータ) (2020-12-06T17:04:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。