論文の概要: Classification of Influenza Hemagglutinin Protein Sequences using
Convolutional Neural Networks
- arxiv url: http://arxiv.org/abs/2108.04240v1
- Date: Mon, 9 Aug 2021 10:42:26 GMT
- ステータス: 処理完了
- システム内更新日: 2021-08-12 02:28:28.054334
- Title: Classification of Influenza Hemagglutinin Protein Sequences using
Convolutional Neural Networks
- Title(参考訳): 畳み込みニューラルネットワークを用いたインフルエンザヘマグルチニンタンパク質配列の分類
- Authors: Charalambos Chrysostomou, Floris Alexandrou, Mihalis A. Nicolaou and
Huseyin Seker
- Abstract要約: 本稿では,インフルエンザA型ウイルスが特定の宿主,具体的にはヒト,鳥,豚の宿主に感染するかどうかを,HA遺伝子のタンパク質配列のみを用いて正確に予測することに焦点を当てる。
本稿では, タンパク質配列を疎水性指数を用いて数値信号に符号化し, その後, 畳み込みニューラルネットワークに基づく予測モデルを活用することを提案する。
その結果,ヒト,鳥,豚の宿主に感染するウイルスが検出された場合,HAタンパク質配列を高い精度で識別できることがわかった。
- 参考スコア(独自算出の注目度): 8.397189036839956
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The Influenza virus can be considered as one of the most severe viruses that
can infect multiple species with often fatal consequences to the hosts. The
Hemagglutinin (HA) gene of the virus can be a target for antiviral drug
development realised through accurate identification of its sub-types and
possible the targeted hosts. This paper focuses on accurately predicting if an
Influenza type A virus can infect specific hosts, and more specifically, Human,
Avian and Swine hosts, using only the protein sequence of the HA gene. In more
detail, we propose encoding the protein sequences into numerical signals using
the Hydrophobicity Index and subsequently utilising a Convolutional Neural
Network-based predictive model. The Influenza HA protein sequences used in the
proposed work are obtained from the Influenza Research Database (IRD).
Specifically, complete and unique HA protein sequences were used for avian,
human and swine hosts. The data obtained for this work was 17999 human-host
proteins, 17667 avian-host proteins and 9278 swine-host proteins. Given this
set of collected proteins, the proposed method yields as much as 10% higher
accuracy for an individual class (namely, Avian) and 5% higher overall accuracy
than in an earlier study. It is also observed that the accuracy for each class
in this work is more balanced than what was presented in this earlier study. As
the results show, the proposed model can distinguish HA protein sequences with
high accuracy whenever the virus under investigation can infect Human, Avian or
Swine hosts.
- Abstract(参考訳): インフルエンザウイルスは複数の種に感染し、しばしば宿主に致命的な影響をもたらす最も深刻なウイルスの1つと見なすことができる。
ウイルスのヘマグルチニン(ha)遺伝子は、そのサブタイプと標的宿主の正確な同定によって実現される抗ウイルス薬開発の標的となり得る。
本稿では,インフルエンザA型ウイルスが特定の宿主,具体的にはヒト,鳥,豚の宿主に感染するかどうかを,HA遺伝子のタンパク質配列のみを用いて正確に予測することに焦点を当てる。
より詳しくは、疎水性指数を用いてタンパク質配列を数値信号に符号化し、畳み込みニューラルネットワークに基づく予測モデルを活用することを提案する。
提案する研究で使用されるインフルエンザhaタンパク質配列は、インフルエンザ研究データベース(ird)から得られる。
特に、完全かつユニークなhaタンパク質配列は、鳥類、ヒト、豚の宿主に使用された。
この研究で得られたデータは、17999のヒト宿主タンパク質、17667の鳥類宿主タンパク質9278のブタ宿主タンパク質である。
得られたタンパク質の集合を考えると、提案手法は個々のクラス(すなわちAvian)に対して10%高い精度と、以前の研究よりも5%高い全体的な精度が得られる。
また,本研究における各授業の精度は,本研究で提示したものよりもバランスがとれていることも確認された。
その結果,ヒト,鳥,豚の宿主に感染するウイルスが検出された場合,HAタンパク質配列を高い精度で識別できることがわかった。
関連論文リスト
- Efficiently Predicting Protein Stability Changes Upon Single-point
Mutation with Large Language Models [51.57843608615827]
タンパク質の熱安定性を正確に予測する能力は、様々なサブフィールドや生化学への応用において重要である。
タンパク質配列と構造的特徴を統合したESMによる効率的なアプローチを導入し, 単一点突然変異によるタンパク質の熱安定性変化を予測する。
論文 参考訳(メタデータ) (2023-12-07T03:25:49Z) - MC-NN: An End-to-End Multi-Channel Neural Network Approach for
Predicting Influenza A Virus Hosts and Antigenic Types [5.067354030054702]
インフルエンザは公衆衛生、特に高齢者、幼児、基礎疾患を持つ人々にとって重大な脅威となる。
インフルエンザAウイルスの宿主および抗原サブタイプを予測するためのマルチチャネルニューラルネットワークモデルを提案する。
論文 参考訳(メタデータ) (2023-06-08T23:14:39Z) - A Latent Diffusion Model for Protein Structure Generation [50.74232632854264]
本稿では,タンパク質モデリングの複雑さを低減できる潜在拡散モデルを提案する。
提案手法は, 高い設計性と効率性を有する新規なタンパク質のバックボーン構造を効果的に生成できることを示す。
論文 参考訳(メタデータ) (2023-05-06T19:10:19Z) - Virus2Vec: Viral Sequence Classification Using Machine Learning [48.40285316053593]
本稿では,バイラル・シークエンスのための特徴ベクトル表現であるVrus2Vecを提案する。
コロナウイルス科の実際のスパイク配列と狂犬病ウイルスのシークエンスデータに基づいてウイルス2Vecを実験的に評価し、宿主を予測した。
以上の結果から, Virus2Vecはベースラインおよび最先端手法の予測精度よりも優れていた。
論文 参考訳(メタデータ) (2023-04-24T08:17:16Z) - Dense Feature Memory Augmented Transformers for COVID-19 Vaccination
Search Classification [60.49594822215981]
本稿では,新型コロナウイルスワクチン関連検索クエリの分類モデルを提案する。
本稿では,モデルが対応可能なメモリトークンとして,高密度特徴を考慮した新しい手法を提案する。
この新しいモデリング手法により,Vaccine Search Insights (VSI) タスクを大幅に改善できることを示す。
論文 参考訳(メタデータ) (2022-12-16T13:57:41Z) - Dive into Machine Learning Algorithms for Influenza Virus Host
Prediction with Hemagglutinin Sequences [5.067354030054702]
インフルエンザウイルスは急速に変異し、公衆衛生、特に脆弱な集団に脅威をもたらす可能性がある。
近年,機械学習アルゴリズムによるウイルス配列の高速かつ正確な予測への関心が高まっている。
本研究では,さまざまな分類レベルで機械学習アルゴリズムを評価するために,実検定データセットと各種評価指標を用いた。
論文 参考訳(メタデータ) (2022-07-28T00:54:54Z) - Multi-channel neural networks for predicting influenza A virus hosts and
antigenic types [3.1981440103815717]
インフルエンザウイルスの宿主とサブタイプを予測するための高速で正確で低コストな手法は、ウイルスの感染を減らし、資源の乏しい地域に利益をもたらす。
本稿では,A型インフルエンザウイルスの抗原型と宿主を完全かつ部分的なタンパク質配列で予測するマルチチャネルニューラルネットワークを提案する。
論文 参考訳(メタデータ) (2022-06-08T11:47:31Z) - Accurate Virus Identification with Interpretable Raman Signatures by
Machine Learning [12.184128048998906]
本稿では,ヒトおよび鳥のRamanスペクトルを機械学習で解析する手法を提案する。
スペクトルデータ用に特別に設計された畳み込みニューラルネットワーク(CNN)分類器は、様々なウイルスタイプやサブタイプの識別タスクに対して非常に高い精度を達成する。
論文 参考訳(メタデータ) (2022-06-05T22:31:14Z) - Structure-aware Protein Self-supervised Learning [50.04673179816619]
本稿では,タンパク質の構造情報を取得するための構造認識型タンパク質自己教師学習法を提案する。
特に、タンパク質構造情報を保存するために、よく設計されたグラフニューラルネットワーク(GNN)モデルを事前訓練する。
タンパク質言語モデルにおける逐次情報と特別に設計されたGNNモデルにおける構造情報との関係を,新しい擬似二段階最適化手法を用いて同定する。
論文 参考訳(メタデータ) (2022-04-06T02:18:41Z) - A k-mer Based Approach for SARS-CoV-2 Variant Identification [55.78588835407174]
アミノ酸の順序を保つことで,分類器の精度が向上することを示す。
また,アメリカ疾病予防管理センター(CDC)が報告した,変異の同定に重要な役割を担っているアミノ酸の重要性も示した。
論文 参考訳(メタデータ) (2021-08-07T15:08:15Z) - MutaGAN: A Seq2seq GAN Framework to Predict Mutations of Evolving
Protein Populations [0.0]
このディープラーニングフレームワークの理想的なテストケースとしてインフルエンザウイルス配列が同定された。
MutaGANは、中央のレベンシュテイン距離が2.00アミノ酸である与えられた「親」タンパク質配列から「子」配列を生成した。
結果は, 病原体予測を補助する MutaGAN フレームワークの能力が, タンパク質集団の進化予測に広く有用であることを示すものである。
論文 参考訳(メタデータ) (2020-08-26T20:20:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。