論文の概要: Classification of Influenza Hemagglutinin Protein Sequences using
Convolutional Neural Networks
- arxiv url: http://arxiv.org/abs/2108.04240v1
- Date: Mon, 9 Aug 2021 10:42:26 GMT
- ステータス: 処理完了
- システム内更新日: 2021-08-12 02:28:28.054334
- Title: Classification of Influenza Hemagglutinin Protein Sequences using
Convolutional Neural Networks
- Title(参考訳): 畳み込みニューラルネットワークを用いたインフルエンザヘマグルチニンタンパク質配列の分類
- Authors: Charalambos Chrysostomou, Floris Alexandrou, Mihalis A. Nicolaou and
Huseyin Seker
- Abstract要約: 本稿では,インフルエンザA型ウイルスが特定の宿主,具体的にはヒト,鳥,豚の宿主に感染するかどうかを,HA遺伝子のタンパク質配列のみを用いて正確に予測することに焦点を当てる。
本稿では, タンパク質配列を疎水性指数を用いて数値信号に符号化し, その後, 畳み込みニューラルネットワークに基づく予測モデルを活用することを提案する。
その結果,ヒト,鳥,豚の宿主に感染するウイルスが検出された場合,HAタンパク質配列を高い精度で識別できることがわかった。
- 参考スコア(独自算出の注目度): 8.397189036839956
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The Influenza virus can be considered as one of the most severe viruses that
can infect multiple species with often fatal consequences to the hosts. The
Hemagglutinin (HA) gene of the virus can be a target for antiviral drug
development realised through accurate identification of its sub-types and
possible the targeted hosts. This paper focuses on accurately predicting if an
Influenza type A virus can infect specific hosts, and more specifically, Human,
Avian and Swine hosts, using only the protein sequence of the HA gene. In more
detail, we propose encoding the protein sequences into numerical signals using
the Hydrophobicity Index and subsequently utilising a Convolutional Neural
Network-based predictive model. The Influenza HA protein sequences used in the
proposed work are obtained from the Influenza Research Database (IRD).
Specifically, complete and unique HA protein sequences were used for avian,
human and swine hosts. The data obtained for this work was 17999 human-host
proteins, 17667 avian-host proteins and 9278 swine-host proteins. Given this
set of collected proteins, the proposed method yields as much as 10% higher
accuracy for an individual class (namely, Avian) and 5% higher overall accuracy
than in an earlier study. It is also observed that the accuracy for each class
in this work is more balanced than what was presented in this earlier study. As
the results show, the proposed model can distinguish HA protein sequences with
high accuracy whenever the virus under investigation can infect Human, Avian or
Swine hosts.
- Abstract(参考訳): インフルエンザウイルスは複数の種に感染し、しばしば宿主に致命的な影響をもたらす最も深刻なウイルスの1つと見なすことができる。
ウイルスのヘマグルチニン(ha)遺伝子は、そのサブタイプと標的宿主の正確な同定によって実現される抗ウイルス薬開発の標的となり得る。
本稿では,インフルエンザA型ウイルスが特定の宿主,具体的にはヒト,鳥,豚の宿主に感染するかどうかを,HA遺伝子のタンパク質配列のみを用いて正確に予測することに焦点を当てる。
より詳しくは、疎水性指数を用いてタンパク質配列を数値信号に符号化し、畳み込みニューラルネットワークに基づく予測モデルを活用することを提案する。
提案する研究で使用されるインフルエンザhaタンパク質配列は、インフルエンザ研究データベース(ird)から得られる。
特に、完全かつユニークなhaタンパク質配列は、鳥類、ヒト、豚の宿主に使用された。
この研究で得られたデータは、17999のヒト宿主タンパク質、17667の鳥類宿主タンパク質9278のブタ宿主タンパク質である。
得られたタンパク質の集合を考えると、提案手法は個々のクラス(すなわちAvian)に対して10%高い精度と、以前の研究よりも5%高い全体的な精度が得られる。
また,本研究における各授業の精度は,本研究で提示したものよりもバランスがとれていることも確認された。
その結果,ヒト,鳥,豚の宿主に感染するウイルスが検出された場合,HAタンパク質配列を高い精度で識別できることがわかった。
関連論文リスト
- Using Pre-training and Interaction Modeling for ancestry-specific disease prediction in UK Biobank [69.90493129893112]
近年のゲノムワイド・アソシエーション(GWAS)研究は、複雑な形質の遺伝的基盤を明らかにしているが、非ヨーロッパ系個体の低発現を示している。
そこで本研究では,マルチオミクスデータを用いて,多様な祖先間での疾患予測を改善することができるかを評価する。
論文 参考訳(メタデータ) (2024-04-26T16:39:50Z) - Clustering for Protein Representation Learning [72.72957540484664]
本稿では,タンパク質の臨界成分を自動的に検出するニューラルネットワーククラスタリングフレームワークを提案する。
我々のフレームワークはタンパク質をグラフとして扱い、各ノードはアミノ酸を表し、各エッジはアミノ酸間の空間的またはシーケンシャルな接続を表す。
タンパク質の折り畳み分類, 酵素反応分類, 遺伝子期予測, 酵素コミッショニング数予測の4つの課題について検討した。
論文 参考訳(メタデータ) (2024-03-30T05:51:09Z) - NaNa and MiGu: Semantic Data Augmentation Techniques to Enhance Protein Classification in Graph Neural Networks [60.48306899271866]
本稿では,背骨化学および側鎖生物物理情報をタンパク質分類タスクに組み込む新しい意味データ拡張手法を提案する。
具体的には, 分子生物学的, 二次構造, 化学結合, およびタンパク質のイオン特性を活用し, 分類作業を容易にする。
論文 参考訳(メタデータ) (2024-03-21T13:27:57Z) - MC-NN: An End-to-End Multi-Channel Neural Network Approach for
Predicting Influenza A Virus Hosts and Antigenic Types [5.067354030054702]
インフルエンザは公衆衛生、特に高齢者、幼児、基礎疾患を持つ人々にとって重大な脅威となる。
インフルエンザAウイルスの宿主および抗原サブタイプを予測するためのマルチチャネルニューラルネットワークモデルを提案する。
論文 参考訳(メタデータ) (2023-06-08T23:14:39Z) - A Latent Diffusion Model for Protein Structure Generation [50.74232632854264]
本稿では,タンパク質モデリングの複雑さを低減できる潜在拡散モデルを提案する。
提案手法は, 高い設計性と効率性を有する新規なタンパク質のバックボーン構造を効果的に生成できることを示す。
論文 参考訳(メタデータ) (2023-05-06T19:10:19Z) - Virus2Vec: Viral Sequence Classification Using Machine Learning [48.40285316053593]
本稿では,バイラル・シークエンスのための特徴ベクトル表現であるVrus2Vecを提案する。
コロナウイルス科の実際のスパイク配列と狂犬病ウイルスのシークエンスデータに基づいてウイルス2Vecを実験的に評価し、宿主を予測した。
以上の結果から, Virus2Vecはベースラインおよび最先端手法の予測精度よりも優れていた。
論文 参考訳(メタデータ) (2023-04-24T08:17:16Z) - Dive into Machine Learning Algorithms for Influenza Virus Host Prediction with Hemagglutinin Sequences [4.289396744209968]
インフルエンザウイルスは急速に変異し、公衆衛生、特に脆弱な集団に脅威をもたらす可能性がある。
近年,機械学習アルゴリズムによるウイルス配列の高速かつ正確な予測への関心が高まっている。
本研究では,さまざまな分類レベルで機械学習アルゴリズムを評価するために,実検定データセットと各種評価指標を用いた。
論文 参考訳(メタデータ) (2022-07-28T00:54:54Z) - Multi-channel neural networks for predicting influenza A virus hosts and
antigenic types [3.1981440103815717]
インフルエンザウイルスの宿主とサブタイプを予測するための高速で正確で低コストな手法は、ウイルスの感染を減らし、資源の乏しい地域に利益をもたらす。
本稿では,A型インフルエンザウイルスの抗原型と宿主を完全かつ部分的なタンパク質配列で予測するマルチチャネルニューラルネットワークを提案する。
論文 参考訳(メタデータ) (2022-06-08T11:47:31Z) - Accurate Virus Identification with Interpretable Raman Signatures by
Machine Learning [12.184128048998906]
本稿では,ヒトおよび鳥のRamanスペクトルを機械学習で解析する手法を提案する。
スペクトルデータ用に特別に設計された畳み込みニューラルネットワーク(CNN)分類器は、様々なウイルスタイプやサブタイプの識別タスクに対して非常に高い精度を達成する。
論文 参考訳(メタデータ) (2022-06-05T22:31:14Z) - A k-mer Based Approach for SARS-CoV-2 Variant Identification [55.78588835407174]
アミノ酸の順序を保つことで,分類器の精度が向上することを示す。
また,アメリカ疾病予防管理センター(CDC)が報告した,変異の同定に重要な役割を担っているアミノ酸の重要性も示した。
論文 参考訳(メタデータ) (2021-08-07T15:08:15Z) - MutaGAN: A Seq2seq GAN Framework to Predict Mutations of Evolving
Protein Populations [0.0]
このディープラーニングフレームワークの理想的なテストケースとしてインフルエンザウイルス配列が同定された。
MutaGANは、中央のレベンシュテイン距離が2.00アミノ酸である与えられた「親」タンパク質配列から「子」配列を生成した。
結果は, 病原体予測を補助する MutaGAN フレームワークの能力が, タンパク質集団の進化予測に広く有用であることを示すものである。
論文 参考訳(メタデータ) (2020-08-26T20:20:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。