Fugu-MT 論文翻訳(概要): Macromolecule Classification Based on the Amino-acid Sequence

論文の概要: Macromolecule Classification Based on the Amino-acid Sequence

arxiv url: http://arxiv.org/abs/2001.01717v2
Date: Wed, 21 Sep 2022 21:23:23 GMT
ステータス: 翻訳完了
システム内更新日: 2023-01-14 03:04:11.616071
Title: Macromolecule Classification Based on the Amino-acid Sequence
Title（参考訳）: アミノ酸配列に基づくマクロ分子分類
Authors: Faisal Ghaffar, Sarwar Khan, Gaddisa O., Chen Yu-jhen
Abstract要約: 深層学習技術を用いたタンパク質配列の分類に着目する。我々の主な目標は、配列をDNA、RNA、タンパク質、ハイブリッドの4つのグループに分類することであった。数回のテストの後、私たちはほぼ99%の列車とテストの正確性を達成しました。
参考スコア（独自算出の注目度）: 0.4588028371034407
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Deep learning is playing a vital role in every field which involves data. It has emerged as a strong and efficient framework that can be applied to a broad spectrum of complex learning problems which were difficult to solve using traditional machine learning techniques in the past. In this study we focused on classification of protein sequences with deep learning techniques. The study of amino acid sequence is vital in life sciences. We used different word embedding techniques from Natural Language processing to represent the amino acid sequence as vectors. Our main goal was to classify sequences to four group of classes, that are DNA, RNA, Protein and hybrid. After several tests we have achieved almost 99% of train and test accuracy. We have experimented on CNN, LSTM, Bidirectional LSTM, and GRU.
Abstract（参考訳）: ディープラーニングは、データを含むあらゆる分野において重要な役割を果たす。従来の機械学習技術では解決が困難だった、幅広い複雑な学習問題に適用可能な、強力で効率的なフレームワークとして登場した。本研究では,深層学習によるタンパク質配列の分類に焦点をあてた。アミノ酸配列の研究は生命科学において不可欠である。自然言語処理と異なる単語埋め込み技術を用いてアミノ酸配列をベクターとして表現した。我々の主な目標は、配列をDNA、RNA、タンパク質、ハイブリッドの4つのグループに分類することであった。いくつかのテストの後、列車とテストの精度の約99%を達成しました。我々は,CNN,LSTM,双方向LSTM,GRUの実験を行った。

関連論文リスト

Lost in Tokenization: Context as the Key to Unlocking Biomolecular Understanding in Scientific LLMs [78.18336140706471]
Sci-LLMは、生物発見を加速するための有望なフロンティアとして登場した。現在の戦略では生の生体分子配列を処理する際にSci-LLMの推論能力を制限する。より効果的な戦略は、Sci-LLMに高レベルな構造化コンテキストを提供することである。
論文参考訳（メタデータ） (2025-10-27T09:03:21Z)
Life-Code: Central Dogma Modeling with Multi-Omics Sequence Unification [53.488387420073536]
Life-Codeは、様々な生物学的機能にまたがる包括的なフレームワークである。 Life-Codeは3つのオミクスにまたがる様々なタスクで最先端のパフォーマンスを達成する。
論文参考訳（メタデータ） (2025-02-11T06:53:59Z)
Biology Instructions: A Dataset and Benchmark for Multi-Omics Sequence Understanding Capability of Large Language Models [51.316001071698224]
本稿では,生物配列関連命令チューニングデータセットであるBiology-Instructionsを紹介する。このデータセットは、大きな言語モデル(LLM)と複雑な生物学的シーケンスに関連するタスクのギャップを埋めることができます。また、新たな3段階トレーニングパイプラインを備えたChatMultiOmicsという強力なベースラインも開発しています。
論文参考訳（メタデータ） (2024-12-26T12:12:23Z)
scFusionTTT: Single-cell transcriptomics and proteomics fusion with Test-Time Training layers [14.254553622632594]
scFusionはTTTベースのマスク付きオートエンコーダを用いたシングルセルマルチモーダルオミクスフュージョンの新しい手法である。我々はヒトゲノム中の遺伝子とタンパク質の秩序情報をTTT層と組み合わせ、マルチモーダルオミクスを融合させ、単調オミクス解析を強化する。
論文参考訳（メタデータ） (2024-10-17T06:29:29Z)
Reinforcement Learning for Sequence Design Leveraging Protein Language Models [14.477268882311991]
本稿では,タンパク質言語モデル(PLM)を報酬関数として利用し,新たな配列を生成することを提案する。我々はRLベースのアプローチをベンチマークするために、様々なシーケンス長に関する広範な実験を行う。生物学的妥当性とタンパク質の多様性に関する総合的な評価を行った。
論文参考訳（メタデータ） (2024-07-03T14:31:36Z)
Clustering for Protein Representation Learning [72.72957540484664]
本稿では,タンパク質の臨界成分を自動的に検出するニューラルネットワーククラスタリングフレームワークを提案する。我々のフレームワークはタンパク質をグラフとして扱い、各ノードはアミノ酸を表し、各エッジはアミノ酸間の空間的またはシーケンシャルな接続を表す。タンパク質の折り畳み分類, 酵素反応分類, 遺伝子期予測, 酵素コミッショニング数予測の4つの課題について検討した。
論文参考訳（メタデータ） (2024-03-30T05:51:09Z)
NaNa and MiGu: Semantic Data Augmentation Techniques to Enhance Protein Classification in Graph Neural Networks [60.48306899271866]
本稿では,背骨化学および側鎖生物物理情報をタンパク質分類タスクに組み込む新しい意味データ拡張手法を提案する。具体的には, 分子生物学的, 二次構造, 化学結合, およびタンパク質のイオン特性を活用し, 分類作業を容易にする。
論文参考訳（メタデータ） (2024-03-21T13:27:57Z)
DNA Sequence Classification with Compressors [0.0]
本研究は,DNA配列解析に適した圧縮機を用いたパラメータフリー分類法を新たに導入する。この手法は、精度の観点から現在の最先端と整合するだけでなく、従来の機械学習手法よりもリソース効率の良い代替手段を提供する。
論文参考訳（メタデータ） (2024-01-25T09:17:19Z)
xTrimoPGLM: Unified 100B-Scale Pre-trained Transformer for Deciphering the Language of Protein [76.18058946124111]
本稿では,タンパク質の理解と生成を同時に行うために,統一されたタンパク質言語モデル xTrimoPGLM を提案する。 xTrimoPGLMは、4つのカテゴリにわたる18のタンパク質理解ベンチマークにおいて、他の高度なベースラインを著しく上回っている。また、自然の原理に従ってデノボタンパク質配列を生成でき、微調整を監督した後にプログラム可能な生成を行うことができる。
論文参考訳（メタデータ） (2024-01-11T15:03:17Z)
Deep Learning Methods for Protein Family Classification on PDB Sequencing Data [0.0]
本稿では,新たな双方向LSTMや畳み込みモデルなどのディープラーニングフレームワークの性能を,広く利用可能なシークエンシングデータ上で実証し比較する。我々のディープラーニングモデルは従来の機械学習手法よりも優れた性能を示し、畳み込みアーキテクチャは最も印象的な推論性能を提供する。
論文参考訳（メタデータ） (2022-07-14T06:11:32Z)
Deep metric learning improves lab of origin prediction of genetically engineered plasmids [63.05016513788047]
遺伝工学の属性(GEA)は、配列-ラブの関連を作る能力である。本稿では,計量学習に基づいて,最も可能性の高い実験室をランク付けする手法を提案する。我々は、特定の実験室のプラスミド配列のキーシグネチャを抽出することができ、モデル出力の解釈可能な検査を可能にする。
論文参考訳（メタデータ） (2021-11-24T16:29:03Z)
Improving RNA Secondary Structure Design using Deep Reinforcement Learning [69.63971634605797]
本稿では,RNA配列設計に強化学習を適用した新しいベンチマークを提案する。このベンチマークでは,目的関数を配列の二次構造における自由エネルギーとして定義する。本稿では,これらのアルゴリズムに対して行うアブレーション解析の結果と,バッチ間でのアルゴリズムの性能を示すグラフを示す。
論文参考訳（メタデータ） (2021-11-05T02:54:06Z)
A Brief Review of Machine Learning Techniques for Protein Phosphorylation Sites Prediction [0.0]
可逆的翻訳後修飾 (Reversible Post-Translational Modifications, PTMs) は、タンパク質の機能的多様性を拡大する上で重要な役割を持つ。 PTMは、様々な細胞プロセスを制御するために利用される重要な分子制御機構として発生してきた。この修飾の障害は、神経疾患やがんを含む複数の疾患によって引き起こされることがある。
論文参考訳（メタデータ） (2021-08-10T22:23:30Z)
Neural networks for Anatomical Therapeutic Chemical (ATC) [83.73971067918333]
両方向の長期記憶ネットワーク(BiLSTM)から抽出された集合を含む、特徴の異なるセットで訓練された複数の複数ラベル分類器を組み合わせることを提案する。実験はこのアプローチのパワーを実証し、文献で報告された最良の手法よりも優れていることを示した。
論文参考訳（メタデータ） (2021-01-22T19:49:47Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。